Capochiani, Francesca; Leoni, Chiara; Rosselli Del Turco, Roberto: Open source tools for online publication of charters

Posted by AA in Paper, Proposals, Systems |

Open source tools for online publication of charters

Diplomatic texts consultation is an indispensable tool for historians and archivists. Their online availability offers maximum flexibility and dissemination, allowing the scholar to access this valuable material unimpeded by spatial or temporal barriers: some projects, such as The Electronic Sawyer (http://www.esawyer.org.uk/) and the encoding activities of the École Nationale des Chartes (http://www.enc.sorbonne.fr), show how it is possible offer high quality scientific texts on the Web based on an XML mark-up of the archival sources. Their creation, however, requires substantial resources: is it possible to digitize and to put online this type of document collections for personal research, or to benefit the whole Academic community, in a (relatively) simple and effective way? Furthermore, Web publishing is only effective if it allows easy document browsing and a way to perform powerful data mining of the resources it offers: which methods are best to allow easy text access and search?
This paper aims to show how, through the use of open source software, single scholars or a small team of researchers can encode a corpus of documents using the TEI (http://www.teic.org/) standard, publish it on the Web, and provide a search engine such as eXist (http://existdb.org/) or XTF (http://xtf.cdlib.org/) for complex queries.

***

Strumenti open source per la pubblicazione online di documenti diplomatici

La consultazione di testi diplomatici costituisce uno strumento di lavoro insostituibile per gli storici e gli archivisti. La loro disponibilità online offre il massimo della flessibilità e della diffusione, permettendo allo studioso di accedere a questo materiale prezioso senza barriere spaziali o temporali: alcuni progetti, come The Electronic Sawyer (http://www.esawyer.org.uk/) e l’attività della École Nationale des Chartes (http://www.enc.sorbonne.fr), mostrano come sia possibile offrire testi di alta qualità scientifica sul web usando una codifica XML delle fonti. La loro creazione, tuttavia, richiede risorse non indifferenti: è possibile digitalizzare e mettere online questo materiale, per le proprie ricerche e per il beneficio della comunità accademica, in maniera (relativamente) semplice ed efficace?
Inoltre una pubblicazione sul web è incompleta se non consente un’agevole consultazione e il data mining delle risorse offerte: come facilitare l’accesso e la ricerca all’interno dei testi?
Questo intervento si propone di mostrare come, grazie all’uso di software open source, il singolo studioso o un piccolo team di ricercatori possa digitalizzare un corpus di documenti usando il formato TEI (http://www.tei-c.org/), pubblicarlo sul web e inserire nell’interfaccia un motore di ricerca come eXist (http://exist-db.org/) o XTF (http://xtf.cdlib.org/) per effettuare ricerche complesse.

Francesca Capochiani studente in Informatica Umanistica, Università di Pisa
eMail:f.capochiani@gmail.com

Chiara Leoni laureata in Informatica Umanistica, Università di Pisa
eMail: leoni.chia@gmail.com

Roberto Rosselli Del Turco ricercatore, Università di Pisa / Università di Torino
eMail: rosselli@ling.unipi.it

One Response to Capochiani, Francesca; Leoni, Chiara; Rosselli Del Turco, Roberto: Open source tools for online publication of charters

  1. Pingback: Digital Diplomatics 2011 – Programma – Associazione per l'Informatica Umanistica e la Cultura Digitale