Il CEOD è un sistema per la consultazione e la ricerca testuale costituito da un'interfaccia per il web e da un motore di ricerca. Al sistema si può accedere mediante qualunque browser Internet (come Explorer o Firefox). L'interfaccia web consente all'utente di impostare ricerche nel corpus. Un sistema di link permette la navigazione tra le principali sezioni del sito:
RICERCA SEMPLICE: in questa sezione l'utente, dopo aver selezionato l'insieme testuale su cui operare, può impostare la ricerca di frasi, parole o parti di parole. Le stringhe di ricerca possono essere combinate con operatori standard per ricerche più complesse.
RICERCA AVANZATA: permette di ricercare uno o più fenomeni marcati.
LETTURA SELETTIVA: permette di accedere alla lettura di lettere o insiemi di lettere rispondenti ai criteri di selezione del corpus prescelti (per es. tutte le lettere scritte negli anni 1840-1849, tutte le lettere scritte da Parigi, tutte quelle indirizzate a Giuseppe Garibaldi ecc.).
LETTURA INTEGRALE: permette di accedere alla lettura sequenziale degli epistolari e ad altre informazioni accessorie: descrizione dei carteggi, schede biografiche sugli scriventi e sui principali destinatari, segnature archivistiche, note sulle particolarità dell'edizione e sull'usus degli scriventi, link a riproduzioni fotografiche di alcuni originali.
L'operazione, comune alle sezioni "ricerca semplice", "ricerca avanzata" e "lettura selettiva", consente di definire l'insieme testuale su cui operare e si articola in due passi: dapprima si selezionano uno o più carteggi, successivamente si può definire ulteriormente il corpus agendo sui campi "scrivente", "destinatario", "luogo", "anno". In assenza di interventi dell'utente il sistema seleziona automaticamente l'intero corpus.
All'interno dei menù a tendina relativi ai campi "carteggio", "scrivente", "luogo", "anno" è possibile effettuare selezioni multiple di elementi mediante la combinazione del tasto "shift" e delle frecce del cursore (per es. se si vogliono selezionare più scriventi o più anni consecutivi). Se invece si vogliono selezionare elementi discontinui (per es. solo le lettere scritte negli anni 1821, 1837, 1848 o solo quelle inviate da Parigi e da Marsiglia) si deve tenere premuto il tasto "control" e evidenziare gli elementi prescelti.
Digitando una sequenza di caratteri, per es. testa, il motore effettua la ricerca sulla stringa intesa come parola intera, trascurando le parole in cui testa compare come sottostringa (testamento, attestato, protesta ecc.).
Digitando una frase (più parole separate da caratteri di spaziatura o interpunzione), il motore effettua la ricerca della frase intesa come frase esatta.
La ricerca fornisce come risultato la stringa richiesta, seguita dal relativo link al contesto allargato (l'intera lettera in cui occorre l'elemento).
Per ricercare parole contenenti un prefisso, infisso o suffisso occorre completare la parola con i caratteri jolly, che sono:
* = una sequenza di caratteri alfabetici o numerici
$ = un qualsiasi carattere alfabetico o numerico
Ad esempio la chiave di ricerca *mente fornisce tutte le occorrenze di parole che terminano in mente, così come amo* e *fra* individuano rispettivamente tutte le parole che iniziano per amo e quelle che contengono al loro interno la stringa fra.
Il carattere jolly $ serve per individuare parole contenenti un numero prefissato di caratteri. Ad esempio, la chiave amic$ fornisce tutte le occorrenze di amico, amica, amici, ma non di amiche, la chiave $$$$$mente seleziona, tra le parole che terminano in mente, quelle che iniziano con una sequenza di 5 caratteri (fatalmente), escludendo le altre (per es. abbondantemente).
Anche nella ricerca di una frase è possibile utilizzare i caratteri jolly per completare le parole che la compongono. Ad esempio, la chiave car$ amic* permette di ricercare tutte le occorrenze di caro amico, cari amici, cara amica, care amiche.
Sono disponibili i seguenti operatori (non combinabili fra loro né con i caratteri jolly):
operatore | sintassi | descrizione |
prossimità (AND) | parola1^parola2^N | cerca due parole separate al massimo da N parole. L'unità testuale entro cui ha valore la ricerca è la lettera. |
alternatività (OR) | parola1+parola2 | cerca tutte le occorrenze di parola1 oppure di parola2. La ricerca è condotta sull'intero corpus selezionato. |
esclusione (AND NOT) | #parola1^parola2 | cerca tutte le occorrenze di parola2 quando non è immediatamente preceduta da parola1. L'unità testuale entro cui ha valore la ricerca è la lettera. |
parola1^#parola2 | cerca tutte le occorrenze di parola1 quando non è immediatamente seguita da parola2. L'unità testuale entro cui ha valore la ricerca è la lettera. |
Questa modalità fornisce la lista ordinata alfabeticamente di tutte le forme presenti nel corpus selezionato. Selezionando l'opzione "collega al contesto", nel risultato della ricerca le forme saranno accompagnate dall'elenco dei contesti.
Questa modalità fornisce la lista ordinata per frequenza decrescente di tutte le forme presenti nel corpus selezionato. Anche in questo caso, selezionando l'opzione "collega al contesto", nel risultato della ricerca le forme saranno accompagnate dall'elenco dei contesti.
Digitando una lettera minuscola, il motore di ricerca dà come risultati anche le varianti scritte con la maiuscola e viceversa.
Vista la conservatività dei criteri di edizione riguardo a grafia e accenti, per favorire la ricerca di varianti grafiche non facilmente prevedibili il programma è stato impostato in modo da effettuare le seguenti equivalenze:
L'equivalenza non è bidirezionale: digitando perche si trovano tutte le occorrenze di perche, di perché e di perchè, ma digitando perché o perchè si ottengono solo le corrispondenze esatte.
Naturalmente, alcune parole straniere possono contenere anche altri segni diacritici, in conformità o meno con le regole ortografiche delle rispettive lingue di appartenenza. Per comodità di ricerca, forniamo qui l’elenco completo delle parole straniere contenenti tali segni: âme, apperçus, bientôt, Blû, Böamen, caractêre, chêre, être, für, grâce, hôtel, Institût, Lilî, Mâcon, matinêe, même, pôt, Prüffùng, Pühler, reçois, reçu, reçue, reçuis, Rôbe, rôle, rôles, Rübinstein, santê, Saône, schön, Schütz, tête, tômba, wäre, wünsche, zü
Le liste di risultati della ricerca semplice e avanzata sono ordinate alfabeticamente. L'ordine previsto dal programma di ricerca è il seguente: cifre, lettere dell'alfabeto (nell'ordine: minuscole, maiuscole), vocali accentate (vale a dire che à, è ed ò seguono la z).
Dopo aver selezionato il corpus, l'utente ha accesso a una maschera di ricerca che consente di selezionare uno o più fenomeni marcati. È possibile recuperare le seguenti informazioni:
DI INTERESSE FILOLOGICOcancellature e correzioni (testo barrato, ad es. intanto che ho cantato canterò dopodomani)
sottolineature (testo sottolineato, ad es. aspettavo almeno un saluto)
parole di dubbia lettura (testo in corsivo)
aggiunte interlineari (testo in apice fra barrette oblique, ad es. per mia \e tua/ tranquillità)
aggiunte o glosse in margine (testo in apice fra doppie barrette oblique, ad es. delle pelli di pesce gatto e dei \\specie di// fetisce)
formule di esordio (in cui il vocativo - sia esso un nome o cognome, un ipocoristico, una definizione generica come amico - si trova in posizione iniziale, secondo la collocazione tradizionale: cara moglie ... );
esordio in medias res (in cui il vocativo non apre il testo della lettera, ma si trova in posizione ritardata rispetto all'attacco: Buon giorno, amor mio, buon giorno o manca del tutto, essendo la sua funzione assolta da altri elementi in diversa relazione sintattica col contesto: Giacché i carrettieri partono domani mattina per Ferrara ti scrivo altre due righe);
formule di congedo legate alla firma (realizzate mediante verbi che introducono la firma e rendono il nome del mittente punto d'arrivo di un più complesso giro di frase; di solito oggetto diretto: ama sempre così la tua contenta ed eternamente tutta tua Gianna; complemento predicativo del soggetto: mi dichiaro tuo aff.o padre; meno spesso complemento indiretto: Amami e sarai riamata immensamente, teneramente e per sempre dal Tuo affezionatissimo Checchino);
altre formule di congedo (in cui il saluto è incluso in una breve frase autonoma, perlopiù nominale, che accompagna la firma: il tuo per sempre aff.o Checchino; non si considerano i casi in cui la firma si presenti isolatamente come unico segnale di chiusura).
formule di apertura (che introducono un nuovo tema o una nuova unità testuale; di solito con una movenza ostensiva: ecco ..., o un verbum dicendi: ora, Checchino mio, ti dirò una cosa che tu non sai certamente, o di movimento: passiamo a ... Talvolta coincidono con l'apertura dell'intero corpo del testo: ad es. l'oggetto della presente è farti una tale raccomandazione);
formule di chiusura (che chiudono l'unità testuale, ricorrendo a espressioni come basta, o a verbi come lasciare; non di rado si tratta della chiusura dell'ultima unità testuale, e dunque dell'intera lettera: mi sembra non vi sia altro ..., non dico dippiù);
formule di passaggio (che sottolineano o annunciano il passaggio dall'una all'altra unità testuale; parole chiave di questi snodi testuali sono, di solito, altro e oltre);
tematizzazioni (dislocazioni a sinistra e a destra con o senza ripresa pronominale, costruzioni a tema sospeso, altre tematizzazioni effettuate per mezzo di preposizioni o locuzioni: circa..., riguardo (a)..., quanto a.... Viste le finalità del progetto, si sono marcate solo le tematizzazioni collocate in corrispondenza di snodi testuali rilevanti, come l'inizio di capoverso o di periodo).
riferimenti metaepistolari (che comprendono diverse tipologie, tra cui: il punto sullo scambio epistolare, con le consuete lagnanze sul funzionamento delle poste; i riferimenti al testo che si va scrivendo: questa, la presente, le mie righe ...; i riferimenti all'oggetto-lettera: foglio e simili o ad allegati, acclusi e simili; riferimenti al momento in cui si sta scrivendo la lettera: in questo momento ..., mentre scrivo ... o al momento in cui la lettera sarà letta: a quest'ora ..., quando ti giungerà ...);
anafora e catafora intertestuale (ovvero il riferimento a quanto si è già detto o si dirà in una lettera dello scrivente stesso: Come ti diceva jersera; Ad ogni modo te ne scriverò; o quanto si è letto o si leggerà in una lettera del corrispondente: Credi, mio caro, che molte di quelle cose che tu mi dici, io le aveva osservate...; spero che tu mi scriva presto della tua nuova occupazione);
topoi epistolari (che comprendono alcuni passaggi "rituali", come le scuse per l' eccessiva lunghezza o brevità della propria lettera, per la cattiva scrittura, per le troppe cancellature; il rimprovero per il silenzio prolungato del corrispondente; l'invito a rispondere presto, a scrivere lettere più estese, a dare notizie dettagliate; tutte le giustificazioni che motivano la chiusura della lettera; il piacere e l'emozione derivati dalla lettura dell'ultima lettera ricevuta dal corrispondente; ecc.).
interrogative reali (si fa riferimento alle sole interrogative dirette)
interrogative fittizie (si fa riferimento alle sole interrogative dirette)
esclamative (si fa riferimento soltanto a quelle segnalate dalla punteggiatura)
cambi di progetto (intesi stricto sensu come enunciati che contengono una frattura nella progressione sintattica della frase; perlopiù si tratta di costruzioni a tema sospeso: li sentimenti di afetto che nutri per la povera Mamma tua Iddio Benedetto te ne Benedirà sicuramente).
Prime attestazioni, ovvero parole con datazione antecedente rispetto a quella reperibile nei repertori di riferimento (in particolare, nei principali strumenti lessicografici e negli altri studi di interesse specifico);
Neologismi, ossia termini presumibilmente comparsi da poco tempo nella nostra lingua (qui, convenzionalmente, non oltre i 50 anni precedenti alla data della lettera in cui occorrono);
Termini non documentati (compresi gli hapax), di cui non sembrano esserci altre testimonianze, né precedenti né successive, al di fuori del CEOD;
Dialettismi, adattati o meno ma comunque estranei alla lingua letteraria; così, sono stati marcati sinale ‘grembiule’ e tutina ‘ragazzina’, ma non sturbare, già documentato ad es. nel Boccaccio;
Latinismi, solo in forma non adattata al sistema fonomorfologico italiano (ad es. omnibus ma non servizio);
Forestierismi (suddivisi secondo la lingua di provenienza), solo in forma morfologicamente non adattata (ad es. meeting e plafond ma non ballottaggio né surnaturale).
Sono necessarie alcune precisazioni:
- Le parole sono state marcate - e sono dunque reperibili - nella stessa forma nella quale compaiono nelle lettere. Così, di fronte a una prima attestazione della forma riscarichiamo bisognerà intendere che non risulta precedentemente attestata alcuna voce verbale relativa alla coniugazione del verbo riscaricare. Quanto detto vale anche per il plurale dei sostantivi, per il femminile e il plurale degli aggettivi, ecc.
- Si sono poi tenuti distinti i verbi semplici e i verbi pronominali: ed es. svignarsela risulta prima attestazione, nonostante la maggiore antichità di svignare e svignarsi.
- Per la data non sono state considerate le locuzioni e le polirematiche in generale; fanno eccezione alcune locuzioni in lingua straniera i cui singoli componenti non risulterebbero altrimenti attestati in italiano (ad es. marron glacé). Di ogni termine si è tenuto conto solo del significante, senza distinguere le diverse accezioni di significato; si sono tenuti separati, invece, significanti solo formalmente coincidenti (e come tali, perlopiù registrati dai dizionari sotto entrate diverse): così impostare 'imbucare una lettera' (da posta) è stato marcato come neologismo nonostante l'antichità dell'omonimo verbo impostare 'gettare le basi, sistemare' (da posto). Nei limiti del possibile, si è altresì cercato di tenere separate anche le varie categorie grammaticali, il che, in alcuni casi, ha permesso l’emersione di forme notevoli (ad es. il sostantivo gelato, neologismo, nonostante il participio passato e l’aggettivo corrispondenti fossero in uso da molti secoli). Gli alterati invece non sono stati considerati separatamente dalla forma base, a meno che non siano lessicalizzati (così è stato marcato come prima attestazione centrino 'ornamento per mobili', ma non majaletti).
- Se il corpus offre due o più termini con datazione antecedente rispetto a quella riportata dalle fonti di riferimento, solo il più antico di essi, di norma, viene considerato come prima attestazione, mentre tutti gli altri sono trattati come neologismi (a patto di essere compresi entro i 50 anni di distanza dal primo: vedi sopra), anche se precedenti alla prima attestazione delle fonti. Le poche eccezioni riguardano termini retrodatati contenuti due o più volte in una stessa lettera, marcati tutti come prime attestazioni (ad es. scrocconerie, che compare due volte in PS 69).
- Nel caso di un inserto in latino, in lingua straniera o in dialetto all’interno di una lettera per il resto scritta in italiano, è stato marcato l’intero inserto e non le singole parole che lo compongono. In fase di ricerca, la relativa porzione marcata comparirà nel luogo alfabetico della prima parola dell’inserto. Non sono stati invece marcati come forestierismi i titoli di opere, i toponimi e in generale i nomi propri in lingua straniera (Les mille et une nuit, London, Jules), altrimenti recuperabili sotto le relative categorie dell’"indice contenutistico". Non hanno ricevuto marcature lessicali neanche le lettere composte interamente in lingua straniera (ad es. MM 96).
- Naturalmente una parola può anche rientrare sotto due o più categorie lessicali: ad es. nonsense è un anglicismo ma anche una prima attestazione in italiano.
- La marcatura ha riguardato una selezione ampia e ragionata dei fenomeni sopra esposti.
Tutte le ricerche in modalità avanzata descritte fin qui possono essere raffinate richiedendo che le marcature selezionate contengano una determinata parola o frase. Per es. selezionando "formule di congedo" e digitando addio nel campo di testo presente nella pagina si ottengono solo le formule di congedo contenenti tale parola.
Nella ricerca avanzata è possibile utilizzare i caratteri jolly $ e * come nella ricerca semplice.
La ricerca fornisce come risultati il contesto ristretto, nel quale compare l'elemento marcato, ed il link al contesto allargato (l'intera lettera in cui occorre l'elemento stesso).
persone (esclusi il mittente e il destinatario, recuperabili altrimenti);
personaggi di opere (letterarie, artistiche, mitologiche)
quotidiani e periodici
opere (letterarie, artistiche, mitologiche)
luoghi (escluso il luogo di partenza della lettera, recuperabile altrimenti).
Gli indici consentono all'utente di recuperare tutte le varianti, formali e non, riferibili allo stesso lemma. Per es. al lemma Francesco II di Borbone, re delle Due Sicilie sono associate tutte le occorrenze in cui il sovrano è denominato altrimenti (Ré di Napoli, Ré delle due Sicilie, Ré, Bombina, il Birbone); analogamente nei toponimi, a Sebastopoli sono associate le varianti Sembastopoli e Subastopoli.
Le ricerche sugli indici sono in ogni caso riferite all'intero corpus, anche se l'utente ha selezionato, nei passi precedenti, un sottocorpus più ristretto.
BPI = Lettere di Rosario Bagnasco a patrioti italiani
CM = Lettere di Pacifico Caprini ad Angelo Mangani
CP = Lettere di Pacifico Caprini alla famiglia
DF = Lettere di Agostino Depretis ad Amalia Flarer
DL = Lettere di donne lombarde legate da vincoli di parentela naturale o giuridica
EVS = Carteggio Elisabeth Vichard de Saint-Réal - Laura Nasalli Rocca
FL = Lettere della famiglia Loppi
FLC = Lettere della famiglia Longhi di Casalzuigno
FT = Lettere di Innocenza Tondi al marito e ad altri familiari
GB = Lettere di Giacomo di Brazzà alla famiglia
GMR = Lettere di Giuseppe Mamiani della Rovere al fratello Terenzio
ITP = Lettere di Ines Testi Pianciani a Luigi Pianciani
LCL = Lettere di cantanti liriche
MA = Lettere di Angelo Mangani alla famiglia
MCB = Lettere di Maria Conti Belli al marito e al figlio
MD = Carteggio Ferdinando Martini - Amalia Flarer Depretis
MM = Carteggio Ercole Trotti Estense Mosti - Giovanna Maffei
OS = Carteggio Francesco Orioli - Filippo Saveri
PMP = Lettere di Teresa Pikler alla figlia Costanza
PS = Lettere di patrioti siciliani
RDB = Carteggio Francesco Rivera - Margherita Del Bufalo
RP = Lettere di Amalia Ruspoli Pianciani al figlio Luigi
SML = Lettere di suor Maria Leonarda alla famiglia Merolli