Sei sulla pagina 1di 3

Rita Pizzi

Dipartimento di Informatica

Università degli Studi di Milano

PROPOSTA DI SPERIMENTAZIONE PER UN NUOVO MODELLO DI TEST DI TURING

1. PREMESSA

Come è noto, il test di Turing propone la possibilità di distinguere il comportamento di


una macchina da quello di un essere umano attraverso una sessione sperimentale. Il test
di Turing valuta se una persona, comunicando attraverso un sistema trasmissivo e
ponendo domande a due diverse entità, comprenda dalle loro risposte quale di loro è
l'essere umano e quale la macchina. Nel tempo sono state comunque proposte diverse
varianti del test.

Ormai in alcuni contesti il test di Turing permetterebbe di distinguere con sempre


maggior difficoltà le capacità di risposta di un essere umano da quelle di una macchina,
anche se ovviamente questo vale per ora solo per un numero limitato contesti.

Tuttavia è abbastanza evidente che con il progresso dell'Intelligenza Artificiale il numero


di contesti in cui le capacità di risposta di una macchina saranno indistinguibili da quelle
di un essere umano tenderà ad aumentare velocemente. In linea di principio, in un futuro
prossimo o lontano qualunque problema potrebbe essere sottoposto ad una macchina ed
ottenere una risposta che per correttezza e modalità di espressione sia indistinguibile da
quella di un essere umano.

Quindi sarebbe importante identificare un set di domande da rivolgere ai partecipanti al


test che non dipenda dal grado di avanzamento dell'Intelligenza Artificiale, ma che
permetta piuttosto di distinguere l'uomo dalla macchina per qualche loro differente
caratteristica intrinseca.

Il problema non è di semplice soluzione, perchè coinvolge questioni ancora al di là


dall'essere risolte, quali la diatriba AI debole/forte, la presenza (in futuro) o l'assenza di
consapevolezza o autocoscienza nella macchine, e così via.
2. IPOTESI

Tuttavia ho provato a ipotizzare un tipo di test che, a mio avviso, potrebbe consentire di
distinguere il comportamento umano da quello della macchina basandosi non sulle
prestazioni e sulla capacità di dialogo, ma su una caratteristica che ritengo precipua
dell'essere umano e non riproducibile dalla macchina nemmeno in linea di principio.

In sintesi l'ipotesi è che, per essere registrate in memoria e quindi in tempi successivi
richiamate, e utilizzate per analogie, discriminazioni, deduzioni, induzioni o abduzioni, le
emozioni nell'essere umano non debbano necessariamente passare per il fuoco
attenzionale come avviene per le percezioni. Viceversa la macchina, per definizione, può
acquisire e registrare una percezione solo se i suoi sensori la individuano all'interno del
loro specifico fuoco attenzionale, e per utilizzarla successivamente deve necessariamente
richiamarla interamente in memoria. A loro volta, le emozioni potranno - soprattutto in
futuro - anche essere simulate, ma la macchina non potrà che gestirle nell'unico modo
che le è intrinsecamente possibile, ossia acquisendole o richiamandole interamente dalla
memoria come avviene per le percezioni.

Si tratta quindi di individuare un test che vada a porre domande che coinvolgano la "zona
grigia" delle emozioni che resta fuori dal fuoco attenzionale ed è accessibile all'essere
umano ma - a parità di condizioni - non accessibile alla macchina. Chiameremo
"preconscio" questa zona grigia.

3. LA SPERIMENTAZIONE

La sperimentazione si svolge quindi in due tempi: una fase di training ed una fase di
testing.

a.

Nella fase di training alcuni volontari si sottoporranno alla visione di una serie di
immagini, volte ad innescare alcune emozioni e ad associarle.

Nella fase di testing ai volontari verrà somministrato uno specifico sottinsieme di


immagini, e alla fine verrà loro chiesto di dare un punteggio di familiarità a tali immagini.

Non è possibile valutare quale possa essere la risposta individuale al test. Poichè le
differenze di familiarità potrebbero essere minime, sarebbe utile che alcuni volontari
costituissero un gruppo di controllo, in cui una parte saliente delle prime immagini
verrebbe eliminata, in modo da confrontare i risultati finali fra gruppo sperimentale e
gruppo di controllo e valutare la significatività statistica delle differenze.

b.

Separatamente verrà addestrata una rete neurale artificiale con le stesse immagini. Al
termine del training, il testing consisterà nella somministrazione alla rete neurale di uno
specifico sottoinsieme di immagini. L'output della rete fornirà la capacità di
riconoscimento delle immagini e darà quindi il risultato. Questo sarà esprimibile in
termini percentuali, e quindi immediatamante confrontabile con quello del gruppo di
persone.

Anche in questo caso sarebbe utile e semplicissimo realizzare un controllo, variando


l'input come per il gruppo di controllo dei volontari, in modo da valutare la significatività
statistica delle differenze percentuali emerse.

Possono essere utilizzati diversi modelli di reti neurali, o sistemi di deep learning di
ultima generazione. Tuttavia l'ipotesi è che le prestazioni delle reti neurali non siano
correlate al risultato finale, che per come è strutturato il test non avrebbe motivo, in
linea di principio, di riflettere alcuna differenza significativa fra le percentuali di
riconoscimento delle immagini somministrate.

Al termine della sperimentazione dovrebbe emergere una valutazione della solidità


dell'ipotesi e quindi della possibilità di formulare un nuovo modello di test di Turing.

Potrebbero piacerti anche