Cosa c’entra San Tommaso con Google?

Marco Passarotti, professore dell’Università Cattolica, ha intitolato così una sua relazione recente al Festival della Scienza di Genova. A unire San Tommaso e Google c’è un padre gesuita, Roberto Busa: “il gesuita che inventò l’ipertesto”, ma che pose le basi anche per arrivare ai motori di ricerca.

Galleria fotografica Padre Busa 4 di 12

Quella di padre Busa è una vicenda incredibile: in Italia è poco noto, mentre negli Stati Uniti è una figura conosciuta tra chi è appassionato delle origini dell’informatica, per il ruolo che ha avuto: sul sito a lui dedicato (in inglese) c’è persino la ricostruzione in 3D del primo laboratorio di analisi linguistica impiantato – con l’aiuto di IBM – a Gallarate, in un’ala di una fabbrica tessile, di quelle d’aspetto ancora quasi ottocentesco, con i lucernari con i tetti inclinati.

Sotto ai lucernari dei tetti a shed, nella ricostruzione 3D e nelle foto d’epoca, c’è un gruppo di giovani donne al lavoro su macchine per la preparazione di schede perforate per i primi computer IBM.

«Tra gli anni Cinquanta e Sessanta padre Busa ebbe due laboratori di analisi automatica linguistica, prima nei locali delle aziende Cuccirelli e Valentini, e poi soprattutto dal 1961 al 1967 alla Dragoni» spiega Marco Passarotti, docente dell’Università Cattolica che sta dedicando tutta la vita a portare avanti il lavoro di padre Busa e alla disciplina che ne è nata, vale a dire la linguistica computazionale, l’analisi automatica delle parole.



Il laboratorio di via Ferraris, giugno 1967

Ma come è possibile che un religioso italiano abbia impiantato in una città di provincia – per quanto ai margini della grande Milano – uno dei primi laboratori di trattamento delle parole con un computer?

Dalla facoltà di teologia all’incontro con mr.IBM

Vicentino di origine, nato nel 1913, Busa si era laureato in filosofia e in teologia all’Istituto Aloisianum, facoltà per i gesuiti dove studiò – tra gli altri – anche il cardinal Martini.

La sua tesi di laurea era dedicata al “lessico dell’interiorità in Tommaso d’Aquino”., attraverso dunque l’analisi delle parole nell’intera opera del santo padre della Chiesa. «Si mise a raccogliere le occorrenze delle parole: prima la parola praesentia, poi le parole con suffisso in-, legate all’interiorità» spiega ancora il professor Marco Passarotti. «Iniziò ad annotare le occorrenze e il contesto, quel che oggi chiameremmo concordanze».

Nel 1949, al seguito di alcuni industriali gallaratesi in visita negli Usa, padre Busa riuscì ad avere un appuntamento con Thomas J. Watson, fondatore dell’IBM.

«Le macchine IBM possono essere usate per analizzare automaticamente i testi, in latino, di Tommaso D’Aquino?» chiese l’ancora giovane gesuita al magnate fondatore della International Business Machines, che passava allora dai calcolatori meccanici ai computer.

Padre Busa negli anni Settanta. È scomparso nel 2011 e oggi riposa insieme ai confratelli gesuiti al cimitero di Crenna di Gallarate.

In qualche modo colpito dalla richiesta, Watson chiese a padre Busa di scrivere il suo progetto e lo affidò agli ingegneri di IBM, che però lo giudicarono impossibile. «Come si può dire che una cosa è impossibile senza aver provato prima a realizzarla?» replicò il gesuita. E mise nelle mani di Watson un foglio con lo slogan di IBM: “The difficult we do right away; the impossible takes a little longer”, il difficile lo facciamo subito, l’impossibile richiede un po’ più tempo. «Glielo restituisco – disse Busa – perché non dice la verità». Punto nel vivo, Watson decise di rilanciare: così un computer e le macchine per le schede perforate iniziarono il loro viaggio verso Gallarate.

Gallarate, fabbriche tessili e computer IBM

Il laboratorio di via Ferraris, giugno 1967

Per anni un gruppo di giovani donne, adeguatamente formate (e in qualche modo entrate in una ristretta aristocrazia di operatori dei computer), lavorarono per registrare ogni singola parola nelle diverse posizioni dentro all’opera di San Tommaso.

Un lavoro di caricamento manuale dei dati immenso: 12 milioni di schede, 500 tonnellate di peso complessivo in 90 metri di scaffalature.

Il trasferimento in via Ferraris, 1961

L’Index Thomisticus venne pubblicato tra il 1974 e 1980, è stato poi digitalizzato nei primi anni Novanta, per poi approdare su Internet negli anni Duemila. Consente una analisi completa del testo: «Ogni scheda riportava non solo la parola e la sua posizione, ma anche la analisi grammaticale». L’opera fu resa possibile non solo dalla passione e tenacia di padre Busa, ma anche dalla lungimiranza di chi intravide le potenzialità di quel lavoro, la proiezione verso il futuro del trattamento automatico dei dati: «Imprenditori che allora lo finanziavano per mecenatismo».

Le parole, il computer e le nostre vite

La ricostruzione in 3D esplorabile del laboratorio di Gallarate, sul sito statunitense dedicato a padre Busa

Forse anche quegli imprenditori, come Watson, si accorsero che «una azienda che avesse avuto modo di trattare i dati in modo automatizzato avrebbe avuto un vantaggio enorme», continua Passarotti.

«La linguistica computazionale è presentissima nella nostra vita: in Google, in Alexa, in Instagram, nel sistema automatico che analizza e corregge quel che stiamo scrivendo sulle note del telefono» ci racconta Marco Passarotti, mentre appuntiamo le sue parole durante una conversazione in vista di un evento dedicato al decennale della morte di Padre Busa, che si terrà il prossimo 30 novembre.

La storia di padre Busa incrociò presto anche l’università fondata da padre Gemelli: il laboratorio gallaratese non si occupava solo di Tommaso, «padre Brusa si è occupato di analisi automatica dello rotoli del mar Morto, avviando quel che sarebbe diventato il CIRCSE dell’Università Cattolica».

Dove umanesimo e scienza si incontrano

Settembre 1963: Padre Busa accompagna in visita il cardinale Efrem Forni, insieme al sindaco di Gallarate Sola. Due anni dopo, come testimoniato dalle fotografie su recaal.org, arrivò in visita il Ministro della Ricerca, il socialista Carlo Arnaudi

Padre Busa, un umanista laureato in filosofia e teologia, fondò una nuova scienza, che oggi è ricercata come una professionalità prima di tutto dalle grandi aziende tecnologiche.

Oggi il suo lavoro è portato avanti, a Milano, dal professor Passarotti, che nel 2018 ha ottenuto un ERC, un prestigioso finanziamento di ricerca europeo da due milioni di euro, il primo vinto dall’Università Cattolica.

Passarotti nel suo racconto torna alla metà degli anni Novanta, quando finì il liceo e affrontò la scelta dell’università: «Nella mia famiglia le grandi decisioni si prendevano con padre Brusa. Io volevo studiare Lettere Classiche, mio padre non era dell’idea. Padre Busa mi disse: “è una buona idea, bisogna sempre battere la via meno battuta. A una condizione: compri un computer e impari a trattare i dati”. Sono entrato in università per fare il classicista, ne sono uscito linguista computazionale».

Marco Passarotti

«Giovane linguista, pensavo che avrei fatto una professione sì bella, ma forse inutile e futile. Invece negli anni ho scoperto che il nostro lavoro è utile al mondo in cui viviamo». I linguisti computazionali vengono oggi contesi dalle grandi aziende, in un mondo in cui trattare i dati, le parole, le idee è diventato centrale.

«Mi rendo conto che al confronto con padre Busa, al primo anno di università, ero un anziano conservatore. Ma la ricerca non è conservazione, è andare in campi inesplorati: mi ha lasciato una eredità infinita, lo vedevo ancora negli ultimi giorni della sua vita: vita: si fece realizzare un programma per disambiguare le funzioni delle parole nei testi di Tommaso. Le trattava una per una: un modello esemplare eterno»».

L’incontro dedicato a Padre Busa e alla linguistica computazionale si terrà martedì 30 novembre agli IBM Studios di Piazza Gae Aulenti a Milano, dalle 16 alle 18.30. Qui il link per iscriversi e partecipare.