Data-mining e analisi statistica su fonti testuali storiche del periodo medievale e moderno

Das-MeMo è il primo progetto di ricerca legato alla realizzazione dell’Eurasian Latin Archive. È cofinanziato da Regione Toscana, dai dipartimenti di Filologia e critica delle letterature antiche e moderne e di Scienze dell’Informazione dell’Università di Siena, e dall’azienda Quest-it.

Avviato a marzo 2018, il progetto mira ad applicare tecnologie di data-mining ad archivi storici, coniugando l’esperienza di un’azienda con quella di un gruppo di ricerca sulla filologia digitale latina.

Il primo obiettivo è l’identificazione di un nucleo di documenti che costituiranno una parte dell’archivio, con l’avvio di una campagna di digitalizzazione e il censimento di documenti già digitalizzati. I materiali saranno via via codificati e inseriti all’interno della piattaforma, ora in fase di progettazione.

La piattaforma, georeferenziata, dovrà consentire l’esplorazione del linguaggio e dei contenuti di migliaia di documenti, attraverso:

  1. l’interrogazione linguistica (frequenze lessicali, clusters, rapporti TTR, network analysis, distanza intertestuale, ecc.) per individuare le soglie relative di incidenza di autore, epoca e luogo nelle caratteristiche di un documento latino;
  2. l’interrogazione tematica per effettuare ricerche su qualsiasi categoria semantica dei testi coinvolti (religione, legislazione, cultura scientifica, metodi medici, arte, costumi, ecc.), nonché sulle percezioni dell’Estremo Oriente nei testi (latini e moderni) di viaggiatori occidentali e degli autori “orientali” nelle lingue occidentali e nelle proprie lingue-madre.