- ROBUSTEZZA: la capacità dell'applicazione di gestire materiale linguistico in input contenente rumore: il rumore è un elemento di disturbo in senso molto lato, perché qualsiasi suono e rumore registrato dall’apparecchio è un elemento di disturbo: Alexa, per esempio, registra tutto ciò che sente mentre io parlo (il rumore dell’acqua che è aperta, la porta che sbatte, la voce di qualcuno nella stanza). il sistema deve essere capace di capire nonostante il disturbo, almeno entro un certo limite. un altro tipo di rumore riguarda il fatto che ciò che io pronuncio può non essere standard: ho un accento regionale, parlo in modo poco chiaro etc. ma anche accettare e analizzare input incompleti. In tutti i sistemi c’è sempre qualche fonte di rumore, anche nel caso di software scritti. Ciò che importa è limitare gli effetti negativi del rumore. Una modalità per risolvere il problema è la ripetizione, ma è la modalità più costosa, perché l’input deve essere ricreato da capo. Per esempio, quando ripetiamo l’input perché Alexa non capisce, c’è un elevato dispendio di energia. - POTENZA: la capacità di copertura della lingua dell’applicazione, il suo raggio di azione; cioè considerare “quanta” della lingua viene trattata accuratamente dalla applicazione. Ciò riguarda sia la quantità di input che di output. Ad esempio, un'applicazione di traduzione era applicata alle notizie meteo: anche se i metodi erano molto poco sviluppati, il software funzionava perchè il lessico e la sintassi usata nelle notizie meteo sono molto limitati e fissi, formulaici. Ha dunque una potenza ridotta, ma questo permette di fare pochi errori. appena la potenza diventa maggiore e quindi si tratta porzioni di lingua molto maggiori (al di là del vocabolario di base, polisemia etc..), i risultati possono essere meno precisi. Alexa ha una potenza piuttosto ampia, ma non abbraccia tutta la lingua nè tutte le strutture sintattiche. Per essere compresi, bisogna usare un certo tipo di lessico e struttura che sono parte della sua potenza. Qual È la specializzazione in termini di potenza? Alexa non è specializzata, si occupa di moltissimi elementi: ovviamente gestire molti settori non essere specializzati, rende il lavoro della macchina molto più complesso e il margine di errore è maggiore. Gli strumenti molto specializzati invece sono di solito più precisi, proprio perchè anche il numero di elementi da analizzare è molto limitato e settoriale. LA CAPACITÁ DI TRATTAMENTE DELLA LINGUA VARIA IN BASE AGLI OBIETTIVI DELLA APPLICAZIONE: se devo rispondere a qualsiasi tipo di domanda, come in alexa, avrò una certa potenza, in questo caso piuttosto ampia. Se l'obiettivo è solo tradurre il meteo, allora la potenza sarà molto ridotta. - PORTABILITÁ: la possibilità di applicarla a nuovi domini (altre lingue, linguaggi settoriali, tipologie testuali…) modificando al minimo la struttura. Per esempio, la traduzione automatica delle notizie meteo si deve poter applicare anche ad altre situazioni, per esempio l’ambito delle notizie del traffico etc… se il modello definito per un certo tipo di ambito può essere esportato senza doverlo modificare ad altri ambiti, allora è dotato di portabilità: è portabile. - GENERALIZZABILITÁ: capacità del modello di dare conto a modelli linguistici nuovi , applicando materiale desunto grazie ad un addestramento, sono di solito basati su modelli statistici. Questo permette alla macchina di migliorare senza una “manutenzione” umana, ma in modo automatico. 2. PROGRAMMAZIONE - ECONOMIA DI PROGRAMMAZIONE: semplicità o complessità del modello su cui è basato il modello; il tempo che ci vuole per perfezionare. Non riguarda la performance, ma come è scritta la procedura. considerata la complessità della performance, si tiene conto della complessità delle attività per realizzare la codifica e quanto tempo serve per migliorare la performance. - COMPLESSITÁ DELLA COMPUTAZIONE: quante operazioni servono per giungere ad un output e quanto ci vuole per processare le informazioni. Questo riguarda anche l’efficienza e la velocità della macchina. Ad esempio, la disambiguazione degli omografi è fatta in tante maniere diverse, per esempio fare riferimento ad una grammatica inserita nel sistema, ma questo ha altissimi costi perché moltissime risorse devono lavorare assieme. Il sistema, dunque, valuta tutte le possibili combinazioni e poi le confronta. ci vogliono molte risorse e molto tempo. dunque, questo tipo di sistema non è più usato. I sistemi odierni sono basati sulla probabilità e questo li rende velocissimi: non c’è confronto tra diverse strutture grammaticali ma l’individuazione della etichetta più frequente per disambiguare gli omografi. LE RADICI DELLA LINGUISTICA COMPUTAZIONALE: alcune discipline hanno influenzato i primordi della linguistica computazionale. La parola computazionale deriva dal verbo computare, cioè elaborare (in modo elettronico). elaborazione elettronica di dati linguistici, in un qualsiasi livello. La prima disciplina è la teoria matematica della comunicazione: pubblicata nel 1949 da Shanon e Weaver, dopo la Seconda guerra mondiale. I due si erano occupati di codici durante la guerra. individuare sistemi di crittografia che permettessero di trasformare un messaggio linguistico “normale” in una codifica “segreta”, per non farli comprendere dai nemici. Il problema della codifica e decriptazione è importante nella nascita della linguistica computazionale. Non è una teoria della comunicazione ma una teoria della trasmissione fisica di info su un canale (per esempio via telegrafo o telefono). Si parte da un problema materiale e di natura fisica: il segnale 1 passa in un canale e diventa un segnale 2, quando è ricevuto si deve ritornare al segnale 1. Come determinare e misurare, quindi, la capacità di un canale in modo da garantire che il messaggio sia ricevuto? Il problema è legato alla fisicità del canale. Bisogna stabilire il miglior sistema di codifica dei messaggi che ne garantisca la ricezione: come faccio a essere certo che il segnale 1 sarà ricevuto nonostante il segnale 1 verrà trasformato nel segnale 2? esempio: comunicazione tra torre di controllo e pilota. Quando il pilota comunica e ha info con torre di controllo, l’info deve essere veicolata dal dialogo con la torre di controllo. ci sono parole chiave usate in codice perché le parole chiave in circostanze di pericolo garantisce massima distinzione e non ambiguità tra chi dialoga. L’infinita combinatorietà della lingua (posso usare mille parole diverse per dire la stessa cosa) è ridotta ad un preciso codice. Il linguaggio in codice preserva il segnale dal rumore. L’informazione è un elemento che viene trasmesso la cui quantità è legata all’incertezza dello stato iniziale. Se inizio una conversazione con una persona, la prima parola che dico è quella che nel modello di Shannon ha più alta informazione, cioè è quella più imprevedibile. Lo stato di incertezza iniziale è ovviamente molto elevato perché è proprio la prima. ovviamente però il contesto ci aiuta a farci una serie di aspettative su cosa potrebbe o non potrebbe essere detto in un certo contesto. L’inizio della conversazione però è quello massimamente incerto, in seguito o stato di ’incertezza è minore. La comprensione e la recezione, infatti, hanno delle basi e delle coordinate. Dunque, più si procede, più è facile prevedere ciò che verrà detto. Ovviamente c’è una base probabilistica. L’informazione in sè è una rimozione dell’incertezza: nel momento in cui si inizia a produrre il messaggio, il numero di elementi che possono seguire è certamente limitato e dipendente da ciò che ho detto prima. Più un elemento è prevedibile, minore è l'informazione veicolata. più un elemento è imprevedibile, più è l’informazione. Gli elementi prevedibili posso ricostruirli senza troppe difficoltà in modo quasi intuitivo, perché conosco le probabilità con cui certi elementi occorrono e quindi posso fare delle previsioni e stime. Se perdo questi elementi durante il dialogo, probabilmente la comunicazione è comunque efficace. Altri elementi, se perduti, compromettono la comprensione. Un elemento centrale per valutare la quantità di info veicolata sono: le variazioni nelle probabilità di occorrenza degli eventi influenzano il successo della trasmissione e ricezione delle informazioni. In tutto ciò le proprietà statistiche dei testi sono centrali per la loro trasmissione. Noi infatti siamo capaci di svolgere attività completamente astratte esclusivamente sulla base della nostra capacità intuitiva di capire come gli elementi della lingua non sono casuali, ma basati su probabilità.