Sei sulla pagina 1di 3

PARAMETRI DELLE APPLICAZIONI COMPUTAZIONALI

1. TRATTAMENTO. Ci sono 4 tipi di parametri:


- ROBUSTEZZA: la capacità dell'applicazione di gestire materiale linguistico in
input contenente rumore: il rumore è un elemento di disturbo in senso molto lato,
perché qualsiasi suono e rumore registrato dall’apparecchio è un elemento di
disturbo: Alexa, per esempio, registra tutto ciò che sente mentre io parlo (il
rumore dell’acqua che è aperta, la porta che sbatte, la voce di qualcuno nella
stanza). il sistema deve essere capace di capire nonostante il disturbo, almeno
entro un certo limite. un altro tipo di rumore riguarda il fatto che ciò che io
pronuncio può non essere standard: ho un accento regionale, parlo in modo poco
chiaro etc. ma anche accettare e analizzare input incompleti. In tutti i sistemi c’è
sempre qualche fonte di rumore, anche nel caso di software scritti. Ciò che
importa è limitare gli effetti negativi del rumore. Una modalità per risolvere il
problema è la ripetizione, ma è la modalità più costosa, perché l’input deve essere
ricreato da capo. Per esempio, quando ripetiamo l’input perché Alexa non capisce,
c’è un elevato dispendio di energia.
- POTENZA: la capacità di copertura della lingua dell’applicazione, il suo raggio di
azione; cioè considerare “quanta” della lingua viene trattata accuratamente dalla
applicazione. Ciò riguarda sia la quantità di input che di output. Ad esempio,
un'applicazione di traduzione era applicata alle notizie meteo: anche se i metodi
erano molto poco sviluppati, il software funzionava perchè il lessico e la sintassi
usata nelle notizie meteo sono molto limitati e fissi, formulaici. Ha dunque una
potenza ridotta, ma questo permette di fare pochi errori. appena la potenza diventa
maggiore e quindi si tratta porzioni di lingua molto maggiori (al di là del
vocabolario di base, polisemia etc..), i risultati possono essere meno precisi. Alexa
ha una potenza piuttosto ampia, ma non abbraccia tutta la lingua nè tutte le
strutture sintattiche. Per essere compresi, bisogna usare un certo tipo di lessico e
struttura che sono parte della sua potenza. Qual È la specializzazione in termini di
potenza? Alexa non è specializzata, si occupa di moltissimi elementi: ovviamente
gestire molti settori non essere specializzati, rende il lavoro della macchina molto
più complesso e il margine di errore è maggiore. Gli strumenti molto specializzati
invece sono di solito più precisi, proprio perchè anche il numero di elementi da
analizzare è molto limitato e settoriale.
LA CAPACITÁ DI TRATTAMENTE DELLA LINGUA VARIA IN BASE AGLI
OBIETTIVI DELLA APPLICAZIONE: se devo rispondere a qualsiasi tipo di
domanda, come in alexa, avrò una certa potenza, in questo caso piuttosto ampia. Se
l'obiettivo è solo tradurre il meteo, allora la potenza sarà molto ridotta.
- PORTABILITÁ: la possibilità di applicarla a nuovi domini (altre lingue,
linguaggi settoriali, tipologie testuali…) modificando al minimo la struttura. Per
esempio, la traduzione automatica delle notizie meteo si deve poter applicare
anche ad altre situazioni, per esempio l’ambito delle notizie del traffico etc… se il
modello definito per un certo tipo di ambito può essere esportato senza doverlo
modificare ad altri ambiti, allora è dotato di portabilità: è portabile.
- GENERALIZZABILITÁ: capacità del modello di dare conto a modelli linguistici
nuovi , applicando materiale desunto grazie ad un addestramento, sono di solito
basati su modelli statistici. Questo permette alla macchina di migliorare senza una
“manutenzione” umana, ma in modo automatico.
2. PROGRAMMAZIONE
- ECONOMIA DI PROGRAMMAZIONE: semplicità o complessità del modello
su cui è basato il modello; il tempo che ci vuole per perfezionare. Non riguarda la
performance, ma come è scritta la procedura. considerata la complessità della
performance, si tiene conto della complessità delle attività per realizzare la
codifica e quanto tempo serve per migliorare la performance.
- COMPLESSITÁ DELLA COMPUTAZIONE: quante operazioni servono per
giungere ad un output e quanto ci vuole per processare le informazioni. Questo
riguarda anche l’efficienza e la velocità della macchina. Ad esempio, la
disambiguazione degli omografi è fatta in tante maniere diverse, per esempio fare
riferimento ad una grammatica inserita nel sistema, ma questo ha altissimi costi
perché moltissime risorse devono lavorare assieme. Il sistema, dunque, valuta tutte
le possibili combinazioni e poi le confronta. ci vogliono molte risorse e molto
tempo. dunque, questo tipo di sistema non è più usato. I sistemi odierni sono
basati sulla probabilità e questo li rende velocissimi: non c’è confronto tra diverse
strutture grammaticali ma l’individuazione della etichetta più frequente per
disambiguare gli omografi.
LE RADICI DELLA LINGUISTICA COMPUTAZIONALE: alcune discipline
hanno influenzato i primordi della linguistica computazionale. La parola
computazionale deriva dal verbo computare, cioè elaborare (in modo elettronico).
elaborazione elettronica di dati linguistici, in un qualsiasi livello. La prima disciplina
è la teoria matematica della comunicazione: pubblicata nel 1949 da Shanon e
Weaver, dopo la Seconda guerra mondiale. I due si erano occupati di codici durante
la guerra. individuare sistemi di crittografia che permettessero di trasformare un
messaggio linguistico “normale” in una codifica “segreta”, per non farli
comprendere dai nemici. Il problema della codifica e decriptazione è importante
nella nascita della linguistica computazionale. Non è una teoria della comunicazione
ma una teoria della trasmissione fisica di info su un canale (per esempio via
telegrafo o telefono). Si parte da un problema materiale e di natura fisica: il segnale
1 passa in un canale e diventa un segnale 2, quando è ricevuto si deve ritornare al
segnale 1. Come determinare e misurare, quindi, la capacità di un canale in modo da
garantire che il messaggio sia ricevuto? Il problema è legato alla fisicità del canale.
Bisogna stabilire il miglior sistema di codifica dei messaggi che ne garantisca la
ricezione: come faccio a essere certo che il segnale 1 sarà ricevuto nonostante il
segnale 1 verrà trasformato nel segnale 2? esempio: comunicazione tra torre di
controllo e pilota. Quando il pilota comunica e ha info con torre di controllo, l’info
deve essere veicolata dal dialogo con la torre di controllo. ci sono parole chiave
usate in codice perché le parole chiave in circostanze di pericolo garantisce massima
distinzione e non ambiguità tra chi dialoga. L’infinita combinatorietà della lingua
(posso usare mille parole diverse per dire la stessa cosa) è ridotta ad un preciso
codice. Il linguaggio in codice preserva il segnale dal rumore. L’informazione è un
elemento che viene trasmesso la cui quantità è legata all’incertezza dello stato
iniziale. Se inizio una conversazione con una persona, la prima parola che dico è
quella che nel modello di Shannon ha più alta informazione, cioè è quella più
imprevedibile. Lo stato di incertezza iniziale è ovviamente molto elevato perché è
proprio la prima. ovviamente però il contesto ci aiuta a farci una serie di aspettative
su cosa potrebbe o non potrebbe essere detto in un certo contesto. L’inizio della
conversazione però è quello massimamente incerto, in seguito o stato di ’incertezza
è minore. La comprensione e la recezione, infatti, hanno delle basi e delle
coordinate. Dunque, più si procede, più è facile prevedere ciò che verrà detto.
Ovviamente c’è una base probabilistica. L’informazione in sè è una rimozione
dell’incertezza: nel momento in cui si inizia a produrre il messaggio, il numero di
elementi che possono seguire è certamente limitato e dipendente da ciò che ho detto
prima. Più un elemento è prevedibile, minore è l'informazione veicolata. più un
elemento è imprevedibile, più è l’informazione. Gli elementi prevedibili posso
ricostruirli senza troppe difficoltà in modo quasi intuitivo, perché conosco le
probabilità con cui certi elementi occorrono e quindi posso fare delle previsioni e
stime. Se perdo questi elementi durante il dialogo, probabilmente la comunicazione
è comunque efficace. Altri elementi, se perduti, compromettono la comprensione.
Un elemento centrale per valutare la quantità di info veicolata sono: le variazioni
nelle probabilità di occorrenza degli eventi influenzano il successo della
trasmissione e ricezione delle informazioni. In tutto ciò le proprietà statistiche dei
testi sono centrali per la loro trasmissione. Noi infatti siamo capaci di svolgere
attività completamente astratte esclusivamente sulla base della nostra capacità
intuitiva di capire come gli elementi della lingua non sono casuali, ma basati su
probabilità.

Potrebbero piacerti anche