Progettazione e sviluppo

Le caratteristiche dell'edizione Archivio

L'edizione Archivio nasce dalla necessità di indagare e rappresentare le diverse possibilità della Letteratura del Novecento. La sua natura di 'archivio' permette di mettere insieme testi diversi, edizioni differenti, materiali profondamente eterogenei, accomunati da un obiettivo comune: dare al lettore la possibilità di leggere il testo in modo molteplice, multimediale, interattivo.

L'archivio: le tipologie di edizione digitale

Edizioni sinottiche

Le edizioni sinottiche (o edizioni a confronto) permettono al lettore di leggere diverse redazioni di un testo (confrontando tra loro edizioni a stampa o edizioni e autografi) in modo dinamico: interagendo con il testo vengono evidenziate automaticamente le varianti ed è possibile confrontare così le diverse lezioni di un testo. I tag usati sono quelli del Parallel segmentation method, con l'entrata di apparato (<app>) dove vi è una lezione principale (<lem>) e le varianti (<rdg>).

Edizioni facsimile

Le edizioni facsimile sono dei veri e propri iconotesti che permettono di entrare direttamente nel laboratorio dello scrittore, confrontandosi con gli autografi e facendo esperienza del testo come «approssimazione al valore» (Contini). Tra i tag usati <facsimile> e <surface> elaborati con il TeiZoner.

Edizioni intertestuali

Le edizioni intertestuali sono pensate per permettere di entrare nel laboratorio dello scrittore da una porta diversa rispetto a quella dell'edizione facsimile: l'intertestualità come «dialogo fra più scritture» (Kristeva). I tag usati sono <quote> per le fonti e <seg> per i passi paralleli.

Edizioni apparato

Lavorare col Novecento significa inevitabilmente confrontarsi con testi tutelati dal diritto d'autore. Nel rispetto di ciò, sono state progettate delle edizioni solo apparato con estratti del testo, così da permettere una forma di approfondimento per il lettore. I tag usati sono quelli del Parallel segmentation method.

Edizioni ipertestuali
Le edizioni ipertestuali sono da intendersi quali edizioni ‘aumentate della realtà testuale’ con risorse che partono dall’opera per superarla, in direzione di approfondimenti e materiali informativi funzionali alla comprensione e alla fruizione piena del testo letterario.

Edizioni critiche digitized e born digital

Per venire incontro alle esigenze di tutte le tipologie di lettori sono state previste anche delle edizioni critiche 'tradizionali' born digital che rientrano tra le edizioni digitized, e che possono essere agevolmente lette con qualunque supporto.

L'archivio: la codifica e l'interfaccia

I testi

I testi sono stati preparati secondo criteri filologici con una prima fase di revisione della trascrizione a seguito dell'acquisizione tramite OCR (Abbyy FineReader). Le trascrizioni si basano sui testimoni autografi o  su edizioni critiche, laddove presenti, e in seconda battuta su edizioni a stampa di sicura attendibilità. 

Il TEI Header e la codifica

La prima fase del lavoro è stata contraddistinta dalla preparazione di un TEI Header base con le informazioni sul responsabile scientifico e sui codificatori (ampliato successivamente con i riferimenti bibliografici, la dichiarazione sulle pratiche editoriali, la descrizione delle revisioni).
È stato contenstualmente individuato un core set di tag (da TEI lite), successivamente ampliato attraverso alcuni cicli di revisione a partire da exempla di codifica.

Collazione e Parallel segmentation method

Le edizioni scientifiche digitali che presentano più di un testimone sono state sviluppate partendo da una collazione semi-automatica che usano algoritmi di collazione (Juxta Commons e CollateX Python). L'output generato si basa sul cap. 12 del Manuale TEI (Critical apparatus) con il Parallel segmentation method. Gli output sono stati poi revisionati, corretti, normalizzati, sia attraverso fogli di stile XSLT che manualmente dal responsabile dell'edizione.

L'interfaccia: EVT 1 ed EVT2

Per presentare l'edizione al pubblico si è scelto di usare un'interfaccia ampiamente utilizzata dalla comunità italiana DH, ovvero Edition Visualization Technology (EVT).  In base alle tipologia di edizione è stata preferita la versione stabile di EVT 1.3 oppure la versione beta di EVT2. La marcatura di ciascuna edizione è stata quindi adattata attraverso fogli di stile XSLT per garantire una corretta visualizzazione.

L'archivio: Le concordanze e gli indici di frequenza

Il sistema di elaborazione lessicografica è stato sviluppato con l'obiettivo di creare vocabolari per ciascun autore, periodo e scuola. Per fare ciò sono state individuate alcune funzionalità fondamentali implementate nella sezione vocabolari di LINEA:

a) la lemmatizzazione integrale dei testi;
b) la quantificazione di tutte le occorrenze di parola, forme e lemmi;
c) la produzione di liste lessicali strutturate grammaticalmente, formalmente e statisticamente;
d) la creazione di diversi tipi di liste di frequenza