Il primo archivio digitale di testi e documenti latini sull’Estremo Oriente, basato su applicazioni dell’intelligenza artificiale

Siena. L’intelligenza artificiale vola da Siena a Utrecht (Paesi Bassi) con Eurasian Latin Archive, la prima piattaforma del progetto DaS-MeMo in grado di applicare le tecnologie di data-mining ad archivi storici per l’archiviazione di testi e documenti latini, a partire da quelli sull’Estremo Oriente, raccolti, codificati e resi ricercabili qui per la prima volta. Il lavoro di ricerca nato dalla sinergia di Quest-it, azienda guidata dal presidente Marco Landi – ex Coo di Apple Computer – specializzata nell’analisi semantica e nell’intelligenza artificiale all’interno del gruppo TDB e parte di The Digital Box, con quella del  gruppo di ricerca dei dipartimenti di Filologia e critica delle letterature antiche e moderne e di Scienze dell’Informazione dell’Università di Siena e cofinanziamento dalla Regione Toscana (progetto GiovaniSì), è stato presentato venerdì 12 luglio al DH2019, la conferenza mondiale delle digital humanities, che quest’anno si svolge a Utrecht. 

DAS-MeMo è la cornice progettuale che ha fatto da incubatrice al progetto intercontinentale Eurasian Latin Archive, un archivio digitale di testi e documenti latini riguardanti l’Asia Orientale con una sezione dedicata, in particolare, alla “Via della seta latina”, che comprende testi latini, latino-cinesi, latino-nipponici e latino-coreani dal XIII al XIX secolo. Nel suo insieme, a regime, la piattaforma DAS-MeMo, basata sull’interrogazione linguistica e semantica dei testi coinvolti, sarà finalizzata all’analisi linguistica comparativa sia interna sia con altri testi latini di epoche e aree diverse, sia con testi non latini di argomento omogeneo. 

Il progetto DAS-MeMo. Avviato nel 2018, il progetto DAS-MeMo mira ad applicare ad archivi storici tecnologie di data-mining, l’estrazione di informazioni da grandi quantità di dati attraverso metodi automatici o semi-automatici, per sviluppare una piattaforma con tool NLP per ricavarne dati linguistico/semantici, coniugando l’esperienza di un’azienda esperta in semantica digitale con quella di un gruppo di ricerca sulla filologia computazionale latina. Il primo obiettivo è l’identificazione di un nucleo di documenti geograficamente e storicamente connotati che costituiranno una parte dell’archivio, con l’avvio di una campagna di digitalizzazione e il censimento di documenti già digitalizzati. 

La piattaforma, georeferenziata, dovrà consentire l’esplorazione del linguaggio e dei contenuti di migliaia di documenti, attraverso l’interrogazione linguistica, dalle frequenze lessicali, clusters, rapporti TTR, network analysis, distanza intertestuale, ed altro, per individuare le soglie relative di incidenza di autore, epoca e luogo nelle caratteristiche di un documento latino; l’interrogazione tematica per effettuare ricerche su qualsiasi argomento dei testi coinvolti, nonché sulle percezioni dell’Estremo Oriente nei testi latini e moderni di viaggiatori occidentali e degli autori “orientali” nelle lingue occidentali e nella propria lingua-madre. 

«DAS-MeMo unisce un approccio e una metodologia innovativi – commenta Leonardo Rigutini, responsabile di ricerca e sviluppo di QuestIT – che consentiranno al vasto patrimonio di difficile reperibilità, attualmente custodito in diverse biblioteche italiane ed estere, di affrontare le sfide del futuro, garantendone la conservazione a lungo termine e una maggiore fruibilità per il pubblico». 

«Si tratta del primo archivio che raccoglie documenti e testi sull’Estremo Oriente scritti per secoli in latino, che fu la lingua globale dei secoli XIII-XIX – commenta Francesco Stella, docente di Letteratura latina medievale e umanistica e direttore del Master in Informatica del testo-edizione elettronica all’Università di Siena – e insieme della prima banca dati digitale e multilingue che di questo enorme patrimonio sconosciuto consenta sia la consultazione sia l’analisi digitale lessicale e tematica (gli informatici dicono “semantica”) con metodi di nuova concezione».
DAS-MeMo vola a Utrecht per il DH2019. Il progetto DAS-MeMo è stato presentato a Utrecht all’interno del DH2019, la conferenza annuale delle digital humanities organizzata da ADHO – The Alliance of Digital Humanities Organizations, in programma da martedì 9 a venerdì 12 luglio. Al convegno, per il progetto DAS-MeMo, saranno presenti Emmanuela Carbé, rappresentante dell’Università di Siena-QuestIT, e Nicola Giannelli, borsista dell’Università di Siena, autori del paper “A Digital Platform for the ‘Latin Silk Road’: Issues and Perspectives in Building a Multilingual Corpus for Textual Analysis”.