Sei sulla pagina 1di 10

Tecnologie per il testo - Lezione I - 15/03/2023

Tecnologie: esito di un negoziato tra utenti, stakeholder e progettisti. Gli umanisti non hanno un
ruolo secondario dato che si occupano dell’ambito esperienziale attraverso il Design Thinking
supportato il ruolo degli ingegneri. Le tecnologie hanno un valore:
EYETRACKER: momento oculari, percezioni in forma empirica;
ELECTRORADIOGRAFIA:
-strumenti biometrici;
-user experience

Aspetti ergonomici e progettuali della testualità prima dell’IA. I testi hanno effetti, vanno anticipati
e gestiti dai progettisti. Ciò realizza un rapporto tra conoscenza e produzione di conoscenza.
SECOND BRAIN: piattaforma per dispostivi quali gestione di conoscenza come attraverso TULL. L’IA
è un dispositivo tecnologico con capacità cognitive avanzate che consente un’autonomia
decisionale. Sistemi intelligente che operano come la mente umana. I testi, avendo conseguenze
su chi li riceve, devono essere comprensibili cercando di superare quei muri di ambiguità e
conflitti.

Tecnologie per il testo, II Lezione 16/03/2023


Austin scriveva "come fare cose con le parole" in quanto le parole influenzano il veicolo hanno dei
comportamenti. Motivo per cui non bisogna sottovalutare l'importanza del testo.

Programmi tecnologici
I testi possono essere gestiti da diverse tecnologie come ad esempio "Word" il quale sarebbe la
vecchia macchina da scrivere. Altro dispositivo è Excel, dopo Lotus, classe diversa da Word perché
non gestisce dei testi ma dei fogli che possono scegliere di trattare in parte o per intero.
- Powerpoint, uno strumento di comunicazione più efficace per trasmettere e
condividere conoscenza. C'è anche Atlas.it come strumento per l'analisi qualitativa e
quantitativa su più testi o video che permettono di fare delle ricerche incrociate per
capire ad esempio la ricorsività di una parola.
- Ridwice, un'app che nasce per sottolineare, va a cercare tutte le sottolineature dei
nostri libri in digitale le raccoglie le invia sulla nostra email successivamente poi da
scegliere. Per l'interfaccia della parola, Walter Ong è uno storico della cultura in cui la
vera innovazione guarda al passato, con la tecnologia della scrittura che funge da
interfaccia della parola, la quale è un mediatore. Le sue due massime sono “interfacce
della parola” e “oralità e scrittura” come esempi di tecnologie della parola.

C’è molto futuro nel passato. La vera innovazione è nel passato che consente di costruire il nuovo
futuro. La parola diventa un’interfaccia mediatrice diventando un artefatto della storia tra
qualcosa che ha una forma e un utente. Queste tecnologie hanno un obiettivo: il messaggio.

Readrer consente di inserire le lettere come contenitore di lettura in cui contiene audiolibri;
Figma: progetta nuove forme di testo, ipetesto e app;
Notion: strumento che consente di organizzare il nostro spazio di conoscenza.
La testualità
La testualità si sta trasformando attraverso strumenti tecnologici complessi e variegati. La scrittura
diventa articolato e astratto migliorando il pensiero. L’oralità e la scrittura infatti in questo modo
combina la cultura agendo sulla nostra sfera cognitiva.
Nell’ambito del pensiero, i testi consentono di prestare attenzione su un determinato aspetto
comprendendo anche i limiti dell’essere umano. Lo psicologo Daniel Kahneman scrive “Sistemi
lenti e veloci” attraverso cui si identificano i tempi processuali del pensiero.

22/03/2023
Introduzione all’uso del XML – TEI
L’informatica umanistica parte negli anni ‘50 con un italiano, padre Roberto Busa, che voleva
trascrivere in digitale gli scritti di San Tommaso. È il primo approccio all’interazione tra uomo e
macchina dal punto di vista umanistico. Arriviamo poi agli anni 80 dove si riflette su quale
linguaggio fosse più adatto per la digitalizzazione dei testi letterari e si arriva quindi all’XML.
XML: (eXtensible Markup Language) linguaggio che ha uno scopo descrittivo, riusciamo ad
intervenire a livello semantico, diamo al testo un significato.
Struttura base di un XML:
Due tag (“etichette”), delimitati per mezzo di parentesi angolari <…>
Il primo tag è detto di apertura, il secondo di chiusura. Il tag di chiusura si distingue per la
presenza di una barra dopo la prima parentesi angolare </…>

<titolo> La Divina Commedia </titolo>


tag di apertura testo tag di chiusura

Attributo  un tag iniziale può contenere uno o più attributi:


<verso n=”1”> Nel mezzo del cammin di nostra vita </verso>
L’elemento <verso> contiene un attributo n che, nel caso dell’esempio, ha valore 1, il quale viene
inserito fra virgolette alte “”.

Ad un tratto, negli anni ’80, si è capito che ognuno da una propria interpretazione, la comunità
scientifica capì che questi linguaggi dunque non erano abbastanza e così nasce la TEI.
TEI: (Text Encoding Initiative) consorzio di accademici che detta delle linee guida, ovvero una
grammatica da applicare al linguaggio XML. L’idea è stata: tutto quello che è su carta, proviamo a
codificarlo con un linguaggio specifico.
La struttura interna in un linguaggio TEI:
 Struttura base all’interno della radice (<TEI>):
- un’intestazione TEI (<teiHeader>)
- un testo
 Contenuto TEI header: (inseriamo tutte le informazioni che noi vogliamo si conservino, al di là
del testo)
- metadati relativi al documento
- descrizione dei file usando <fileDesc> (una serie di info che descrivono il file)
- descrizioni relative al tipo di codifica, al contenuto del documento, alle sue revisioni
 Possibile includere testi introduttivi e spiegazioni relative alla codifica effettuata
Struttura di un documento TEI:
E’ letteralmente la rappresentazione del dialogo tra me e la macchina
<?xml version=1.0” encoding=”utf-8”?>  è una stringa di dichiarazione, non ha apertura
o
chiusura. E’ la stringa per la quale comunico che
voglio utilizzare il linguaggio XML. L’encoding è
il
formato di lettere che andrò ad utilizzare (utf8)
<TEI xmlns=http://www.tei.c.org/ns/1.0>  suggerisco che voglio utilizzare la grammatica
TEI che trovo su questo link
<teiHeader> [metadati] </teiHeader>  tutti i metadati + elementi accessori
<text>
<front> [premessa, dedica…] </front>
<body> [corpo del testo] </body>
<back> [postfazione, appendice…] </back> } il testo (con apertura e chiusura)
</text>
</TEI>  è la chiusura del TEI

File description: file text legato al file elettronico (andremo a descrivere all’interno di questa
sezione tutti i dati e metadati attenenti alla parte del testo)
Source description: andremo ad inserire tutti i dati/metadati attenenti alla forma

Availability è un tag particolare che per essere validato deve contenere un testo. La TEI ha
pensato tre diversi modi per farlo:
- P = paragraph (comunichiamo alla macchina che è un elemento testuale)
- Anonymus
- Note

Struttura di un <text>
Il <text> è un singolo testo di qualsiasi tipo; è un punto di partenza della gerarchia riguardo il
contenuto può essere preceduto o sostituito da un <facsimile>.
All’interno di <text> possiamo trovare quattro elementi:
 <front> materiale che precede il testo (se presente)
 <body> il testo stesso
 <back> materiale che segue il testo (se presente)
Ma è possibile anche una struttura più complessa:
 <group> raggruppa testi diversi e quindi contiene una serie di <text>

Attributi
L’attributo è una specifica del tag. Alcuni vengono determinati “globali” (att.global) perché si
applicano a tutti i tag. Con gli attributi noi non facciamo che dare al nostro tag un significato
preciso. Essi sono:
 n un numero o un nome non univoco, breve, per identificare un elemento
 rend / rendition informazioni relative all’aspetto originale del testo (è la resa grafica)
 xml:lang la lingua del testo contenuto da un elemento (specifico di che lingua si parla)
 xml:id un identificatore univoco per l’elemento
Tag
I tag, o gli elementi,
<q>  testo citato da altre fonti: discorso diretto, esempi (nei dizionari), etc.
<quote>  una citazione, una frase o un brano attribuito a fonte esterna
<said>  testo pronunciato ad alta voce o pensato
<cit>  citazione con riferimento bibliografico
<emph>  parole o frasi enfatizzate nel testo
<foreign>  parola o frase in una lingua diversa
<distinct>  “diverso” dal testo (arcaico, gergale, etc.)
<hi>  elemento generico
<mentioned>  parola o frase menzionata ma non usata
<gloss>  una spiegazione riguardo il testo
<mdescription>  descrizione del manoscritto
<transcr>  trascrizione di fonti primarie (le fonti a cui l’opera stessa fa riferimento)
<textcrit>  apparato critico
<add>  parola o parole aggiunte nel testo
<del>  parola o parole cancellate nel testo
<gap>  parte di testo omessa mancante o illeggibile

Esempi di applicazione: attributi e valori consigliati


<add> :
 place (interlinea, margine)
 hand (author, scribe1, scribe2)
<del>:
 rend (overstrike, subpunct, overtype)
 hand (author, scribe1, scriba2)
<gap>:
 reason (illegible, cancelled, missing, omitted)
 hand (editor)
 agent (water, smoke, hole, missing page)

Tra i vari tag abbiamo degli elementi detti “speculari”, ovvero una volta aperti ci permettono di
effettuare delle scelte. Come ad esempio il macro elemento <choice> permette queste scelte:
<sic> - corr> (parola o frase ritenuta errata, ma riportata com’è – correzione di una parola errata)
<orig> - <reg> (parola o frase ritenuta non standard – parola o frase normalizzata
<abbr> - <expan> (parola abbreviata – espansione di un’abbreviazione)
SDE
SDE è l’acronimo di Scholarly Digital Edition, o ESD in italiano (Edizione Scientifica Digitale).
I vantaggi nell’adozione di una SDE sono:
- apparato critico senza limiti di spazio
- varianti gestite in relazione dinamica con i testimoni, presentate per intero
- livelli di edizione gestibili in maniera dinamica sulla base di un unico documento
- edizioni con immagini dei MMS
- navigazione impermeabile
- strumenti supplementari come ricerca testuale, restauro virtuale, etc.
Il procedimento di codifica può essere seguito solo da un filologo perché è l’unico che può marcare
il testo in maniera efficace per produrre un’edizione scientifica in quanto ogni testo/documento
presenta specificità che presuppongono conoscenze precise. L’edizione è, quindi, contenuta nel
testo codificato e potrà essere visualizzata attraverso un software specifico.
La codifica TEI consente diversi livelli di edizione per lo stesso testo (ad esempio chiedo al testo di
evidenziarmi tutte le parole che hanno una determinata caratteristica – ad es. tutte le
abbreviazioni)
 elementi di correzione scribale: <del> e <add>
 elementi di intervento editoriale: <sic> e <corr>, <orig> e <reg>, <abbr> e <expan>,
<supplied
 i diversi <mapping> previsti per i caratteri speciali e altri elementi: <hi>, <pc>, <damage>,
etc

OXIGEN XML EDITOR


È uno spazio all’interno del quale noi possiamo scrivere il linguaggio macchina. Più precisamente,
è una multipiattaforma Java che consente di interagire con i linguaggi XML, XSLT/XQuery che
consente di poter ben impostare, con notevoli aiuti, una SDE.
Famosi esempi che utilizzano questa tecnologia dei repository (contenitori di file):
- ALIM  Archivio della Latinità Italiana nel Medioevo; è una digital library di testi scritti
in latino in Italia del Medioevo
- INTERNET CULTURALE  aggregatore di repository digitali sparsi sul territorio italiano
appartenenti a biblioteche di varia provenienza e specializzazione
- BIBLIOTECA ITALIANA  biblioteca digitale di testi rappresentativi della tradizione
culturale e letteraria italiana dal Medioevo al Novecento
- EVT  è un software di visualizzazione per la pubblicazione web di documenti basati su
TEI, in grado di soddisfare molteplici casi d’uso.
29/03/23 - Le edizioni digitali

La filologia digitale è l’uso di strumenti e metodi dell’informatica applicati alla critica testuale
con l’obiettivo di creare un’edizione critica di un testo. Essa è naturalmente multidisciplinare e ha
parecchie etichette (ovvero ha aspetti concatenati ma in realtà sono tutti diversi), ad es.: filologia
computazionale/digitale, edizione elettronica/digitale/computazionale.
L’obiettivo è produrre una versione del testo affidabile; risalire all’opera originale dell’autore.
Tale obiettivo chiaramente non muta quando vogliamo realizzare un’edizione digitale e non
cartacea. Allora perché la consideriamo una disciplina nuova? Perché cambiano:
- Metodo: c’è bisogno di ricorrere a tecnologie informatiche
- Risultato finale: non esclude un’edizione tradizionale a stampa, ma il prodotto finale è
un’edizione a stampa che contiene tanti tipi di informazione insieme, non solo il mero
testo.
Dunque, l’obiettivo primario della filologia digitale può essere definito come la creazione di
un’edizione affidabile di un testo pubblicata come edizione digitale.
Esistono tre definizioni differenti di edizioni digitali:
- Edizione digitalizzata: scansione in PDF
- Edizione in forma digitale: PDF, ebook
- Edizione digitale: qualcosa che è progettata per essere pubblicata su un supporto
digitale, realizzate con teorie, metodi e pratiche digitali.
Ma possiamo chiaramente avere altri tipi di edizioni digitali come quotidiani, riviste o libri.
Ma cos’è esattamente un’edizione digitale in ambito accademico? Esso è un prodotto scientifico
che può essere utilizzato a scopi di studio. Dunque deve avere i metodi della filologia a livello
accademico (recensione, apparato critico, note, citazioni bibliografiche).

Nonostante tutte queste definizioni, tutt’ora ancora non esiste una vera e propria definizione di
“edizione digitale”; è un termine ancora in continua evoluzione perché la tipologia è piuttosto
varia:
- Database testuale
- Edizioni ipertestuali
- Edizioni ipermediali
- Edizioni basate su immagini
- Edizioni sociali/collaborative
- Aggregatori di edizioni

Ma l’edizione digitale è tale perché cambia solo il supporto materiale?


- L’edizione a stampa tradizionale: nasce dal XIX secolo e il layout generale è riempire più
spazio possibile all’interno del foglio e in base a ciò trovano il miglior modo possibile
per farlo; ovviamente ci sono limitazioni proprio dovute allo spazio disponibile.
- L’apparato critico è il miglior compromesso possibile (viene riportato solo l’apparato
positivo, ovvero dove c’è la variante – dove non c’è non vengono citate le edizioni)
- Le varianti sono presentate in un formato compresso e incompleto (apparato negativo,
varianti ortografiche assenti)
- Le edizioni sinottiche (ovvero brevi) sono rare e costose e presentano ulteriori
limitazioni
- Scelta fra facsimile fotografico e edizione
- Scelta fra i livelli diversi di edizione

Prima Generazione
Storicamente, le prime edizioni digitali:
- avevano ancora un supporto fisico come CD o DVD (si volevano staccare dalla
materialità della carta ma allo stesso tempo non allontanarsi troppo).
- Per lo più erano un confronto testo-immagini.
- La qualità delle immagini non era sempre ottima
- La maggior parte utilizzava il software printed page paradigm
- L’interfaccia utente era molto disomogenea
- Oggi le cose le pubblichiamo su una piattaforma e gli altri lo scaricano, negli anni 90 no.
I software erano un po’ obsoleti e non si riusciva sempre a legare il materiale al
software in modo perfetto.

Se si ragiona su memoria virtuale, si va verso una migliore conservazione. Ci avviamo, in questo


modo, verso la seconda generazione delle edizioni digitali.

Seconda Generazione
- Rispetto alla prima, c’è una migliore interfaccia grafica
- Maggiore potenzialità in ogni dettaglio, maggiore diffusione, longevità e autonomia per
lo studioso (non deve comprare software ma è tutto immediatamente accessibile).
- Abbandono del supporto ottico a favore della pubblicazione sul web
- Aspetti negativi: perdita del workflow tradizionale

L’edizione digitale è uno strumento dinamico perché se posso interagire grazie a un software di
navigazione ne consegue che un’edizione digitale non è semplicemente un’edizione tradizionale su
supporto informatico ma è esso stesso uno strumento dinamico.
- Organizzazione dei dati testuali in strutture ipertestuali
- Multimedialità  inclusione di materiali non testuali
- Interazione con l’utente  navigazione, ricerca, strumenti etc.
- Diventa da prodotto di ricerca uno strumento di ricerca
- È born digital (o da conversione in forma digitale di edizioni cartacee -> identico
risultato finale)
Il passaggio da edizione tradizionale a digitale è possibile, il contrario no senza una perdita.

Vantaggi di un’edizione digitale:


 L’apparato critico non è limitato dallo spazio disponibile
 Le varianti possono essere gestite in relazione dinamica con i testimoni (non ho bisogno di
girare fogli, ma le tengo tutte aperte sullo schermo)
 Le edizioni con immagini sono più complete perché danno la possibilità allo studente di
capire quali sono le interpretazioni fatte dallo studioso
 Possibilità di esplorare testo-immagine grazie ad una navigazione ipermediale
 Presenza di strumenti supplementari che possono essere inseriti (es: ricerca intertestuale)
 Correzioni e modifiche possono essere fatte facilmente e a costo zero (senza rovinare
pagine
 Temi e modi della preparazione di una DSE non devono essere quelli tradizionali. Si
possono pubblicare in stile open source o crowdsourcing.
 I materiali preparatori possono essere inclusi nell’edizione stessa attraverso trascrizioni,
note, discussioni e feedback
 I dati dell’edizione possono essere condivisi con la comunità per favorirne lo studio e il
riutilizzo
 Cambiamento di percezione del lavoro: un’edizione digitale sembra colga più pubblico
possibile poiché ha tanti strumenti e possibilità che possono servire a tutti, mentre una
edizione tradizionale sembra essere più mirata ad una cerchia ristretta.

Un ulteriore dettaglio, un prerequisito importante, è che i dati dell’edizione devono essere


separati rispetto agli strumenti di elaborazione, ovvero il testo dell’edizione non è vincolato a
niente. Il testo in XML-TEI è un testo separato dal supporto, dai paradigmi del web, perché
sostanzialmente non è che un’annotazione fatta in un determinato linguaggio. Non ha bisogno di
un software particolare o strumenti particolari per essere letta.

Svantaggi di un’edizione digitale:


 Dal lato dello studioso, bisogna investire del tempo iniziale per apprendere strumenti e
metodi della filologia digitale.
 Dal lato dell’utente, la difficoltà sta nell’educazione all’interfaccia
 Durata e accessibilità nel tempo; solitamente ci si fida delle repository istituzionali (se un
server su cui si appoggia la fruizione di un’edizione digitale viene hackerato, si perde tutto)
 Disintermediazione
 Problemi di valutazione (il prodotto digitale è citabile? c’è un codice ISBN? Il digitale è
considerato alla pari del libro cartaceo?)

Cosa cambia per il filologo, per noi che approcciamo alla disciplina?
Dal punto di vista metodologico nulla perché l’approccio al testo è lo stesso ma dal punto di vista
del metodo cambia molto perché cambiano il tempo e la durata di studio perché c’è bisogno di
apprendere nuovi metodi e nuovi strumenti però dal punto di vista del prodotto finale, invece, il
tempo è più veloce perché una volta appresi gli strumenti si lavora in modo velocissimo (ad es. se
devo fare una collazione, la faccio con dei click e in modo automatico).
Sempre da un punto di vista metodologico, però, vanno fatte delle precisazioni perché quando si
fa una edizione critica tradizionale io devo compiere delle scelte (ho un testo con 10 testimoni tutti
diversi e il filologo sceglie di riportare x elementi e di non riportare x elementi) mentre per il
digitale potrei inserire tutto anche se in realtà qualche scelta va comunque fatta in modo
ragionevole per rendere meglio comprensibile l’edizione critica. Infatti, l’utente che si approccia ad
un’edizione digitale deve capire il perché di una scelta, quindi per questo vanno presentate in
modo ragionevole.

Le competenze di un filologo dovrebbero essere:


- Annotazione semantica con XML-TEI
- HTML 5 e fogli di stile CSS già questi sono abbastanza per dialogare con
esperti
- Fogli di stile XSLT, linguaggio XQuery
- Linguaggi per ontologie
- Linguaggi per analisi del testo qui già siamo ad un livello
avanzato
- Programmazione in JavaScript
- Programmazione in Python
- Programmazione in un framework JS e SQL, database relazionali

Componenti di un’edizione digitale


Tre sono le componenti essenziali per una DSE: TESTO + IMMAGINI + SOFTWARE
Ci sono poi altre componenti supplementari che possono essere un motore di ricerca, un software
(naturalmente parliamo di quegli elementi che ci permettono il passaggio da XML-TEI alla
visualizzazione), immagini scansionate e archiviate, ecc.
Da qualche tempo a questa parte, anche il lavoro tradizionale che precede le edizioni (la
trascrizione) è stata possibile farla tramite strumenti digitali. In particolare passiamo da OCR
(scannerizzazione delle lettere) all’HTR – Handwriting Text Recognition, che riconosce le lettere
scritte a mano e le trascrive in scrittura digitale. E’ un software basato sul machine learning ma
ancora in fase di sperimentazione.

Strumenti digitali per le edizioni critiche


 RECENTIO: raccolta, catalogazione, descrizione di tutti i testimoni per mezzo di metadati
 COLLATIO: confronto fra tutti i testimoni e raccolta degli errori/varianti attraverso una
collazione assistita e semi automatica, quindi più veloce
 CONSTITUTIO TEXTUS: metodo filologico non cambia, ma uso di linguaggi di markup per la
preparazione del testo  precede la visualizzazione

Rappresentazione del testo


HTML è un linguaggio di presentazione che sostanzialmente serve come resa grafica ma al testo
non mi da un significato, non mi dà la resa semantica. Per questo utilizziamo XML, l’unico alla
quale può essere applicato la grammatica TEI e l’unico che mi permette di aggiungere un
significato/la semantica al testo.
Inoltre, l’XML è indipendente dal sistema operativo, è estensibile e permette di creare, archiviare
e distribuire documenti digitali con la garanzia di durabilità nel lungo periodo.

La filologia digitale quindi si avvale di strumenti informatici ma non è identificabile con essi: non
bisogna confonderla con la disciplina perché quest’ultima è a se stante e utilizza gli strumenti
(markup semantico – XML – e ontologia), richiede una definizione della base teorica per adattarli,
richiede una progettazione degli strumenti informatici che colga le nostre esigenze e deve inoltre
prevedere gli sviluppi futuri (ad esempio la pubblicazione sui social).

Per poter preparare un’edizione digitale bisogna marcare il testo. Solo un filologo può marcare il
testo in maniera efficace perché ogni testo presenta specificità tali da richiedere una buona
preparazione di base. La codifica è importante perché l’edizione è nel testo codificato (la codifica
è quindi il nucleo principale di tutto il progetto, è la parte scientifica) e poi la visualizzo attraverso
un software specifico (come TEI Publisher).
Però non necessariamente una codifica è edizione perché se non la porto a termine allora non è
ancora definibile un’edizione. In questo caso si chiama minimal computing, ovvero la
visualizzazione di questa edizione è basata su HTML CSS che sono praticamente la base del web.

Potrebbero piacerti anche