Sei sulla pagina 1di 22

Lezione 2.24.

03
Tra oggi e domani concludiamo Percezione e Attenzione. Nel corso abbiamo 4 argomenti di cui 3
sono legati alla stessa macro-area cioè “come noi abbiamo informazioni sul mondo esterno” e
quindi: sensazione percezione e attenzione. Nei successivi incontri faremo psicologia della salute.
Per quanto riguarda l’Attenzione abbiamo già detto gran parte delle cose, tranne un paio di
passaggi che faremo oggi, quindi oggi parleremo soprattutto di Percezione, ovvero COME NOI
PERCEPIAMO IL MONDO e in particolare QUALI SONO LE FUNZIONI DELLA PERCEZIONE.
le 5 funzioni della percezione:
attenzione
localizzazione
riconoscimento (significato)
astrazione
costanza

Le FUNZIONI DELLA PERCEZIONE sono organizzate in 5 aree, e l’attenzione è una di queste.


Per quanto riguarda le altre aree noi abbiamo stabilito come il ns sistema localizza gli oggetti (il
mondo esterno è fatto di “cose” che si trovano in un determinato punto dello spazio
(localizzazione): alcune sono più importanti ed altre sono meno importanti,  quindi
realizzazione e attenzione. E’ possibile raccogliere delle informazioni per riconoscerle (e abbiamo
parlato di separazione, raggruppamento, integrazione degli attributi (ieri), e ora parleremo di
qualcosa che è l’interfaccia tra quello che i miei sensi raccolgono e quelle che sono le mie
conoscenze in memoria, ad es io raccolgo l’informazione che davanti a me c’è una cosa che ha
(non si può dire “zampe perché è un concetto troppo somatico) delle parti mobili verso il basso,
che ha una parte mobile verso il retro, che ha una parte mobile sul davanti, organizzata in un certo
modo, ossia ha 2 parti bianche che guardano qua e là; io posso anche capire che fanno parte dello
stesso oggetto MA QUANDO e COME il mio sistema capisce che quello che ho davanti è una
gatta?  questo è il problema! perciò ad un certo punto il mio sistema percettivo deve essere in
grado di generare una rappresentazione di qualcosa che sia nello stesso formato che utilizza per
mantenere tutte le informazioni in memoria semantica (il modo in cui io so che sono costruiti i
gatti, i tavoli, le bottiglie, le persone ecc, noi infatti abbiamo una “memoria” di come sono
organizzate, di come sono costruite e di come appaiono le cose). Per cui in qualche momento il
mio sistema percettivo mi deve generare un’informazione che deve essere confrontata con la
mia “enciclopedia in memoria” di come appaiono le cose dal mondo.
E ora vedremo COME QUESTO ACCADE. Fino ad adesso questo non lo abbiamo mai trattato:
abbiamo parlato di localizzazioni ma questo non ha nulla a che vedere con i codici con cui è
mantenuta l’informazione; abbiamo parlato di informazione globale e locale , ma questo ha a che
vedere semplicemente con quali caratteristiche dell’immagine io vado a leggere, ossia mi dice se
leggo le cose “grandi” o le cose “piccole”. Ma sia che io nell’immagine vada a vedere
l’informazione globale (le cose più grandi) o l’informazione locale (le cose più piccole) dovrò
comunque generarmi un qualcosa da CONFRONTARE con la mia memoria semantica.

Quindi affronteremo il tema di: QUAL E’ IL CODICE che LEGA, che ASSOCIA RAPPRESENTAZIONI IN
MEMORIA a RAPPRESENTAZIONI PERCETTIVE ?
Questo è uno dei grandi temi della psicologia della percezione !! proprio perché ha a che vedere
con qual è il codice che usa il cervello per mantenere le informazioni del mondo, quali sono le
informazioni “critiche” cioè quelle più rilevanti e fondamentali per identificare qualcosa.
1
Si è parlato molto (dopo vi faccio un accenno) della distinzione tra rappresentazioni basate su un
esempio o basate su prototipi, insomma sono dei temi molto “caldi” sia della Psicologia Cognitiva
e sia della Neuroscienza. Vi ho detto questo per introdurvi l’argomento, ed ora passiamo alla
Presentazione. (ho aggiunto delle slide per cui dopo ve le ricarico per cui voi ricontrollate il materiale)
Oggi parliamo di:
RICONOSCIMENTO: fa da ponte tra la PERCEZIONE e gli ASPETTI più MNESTICI, più SEMANTICI.
Infatti COME facciamo a dare un significato a quello che abbiamo davanti ?
Quindi non solamente: come facciamo a selezionare l’informazione, cioè come facciamo a dare la
precedenza a un tipo di informazione, come facciamo a localizzare, adesso si tratta di dare un
significato, quindi si inizia a parlare di “significati”.
E parlando di “significati” delle cose che abbiamo intorno, la prima cosa di cui ci accorgiamo è che
abbiamo un enorme problema che consiste nel fatto che:
degli oggetti che tra loro sono molto diversi, possono apparire simili (dal punto di vista
percettivo un fiocco di neve o un fulmine sono molto simili tra loro, invece dal punto di vista del
significato sono completamente diversi. Viceversa: degli oggetti che sono sostanzialmente uguali-
perché rientrano nella stessa categoria- possono essere molto diversi tra loro.
Es: la cosa su cui si possono sbizzarrire i designer è il numero di forme che può avere una sedia
che è infinito, così come le forme della caffettiera o degli occhiali da sole ecc., tuttavia noi siamo in
grado di far rientrare ciascun oggetto in una categoria specifica. Ma COME FACCIAMO?
“Il come facciamo” è il problema che affrontiamo oggi
Tutti i modelli di riconoscimento assumono che noi abbiamo in memoria delle rappresentazioni di
“come appaiono gli oggetti dal mondo reale” (es: la rappresentazione di come è fatto un gatto,
un orologio, una sedia ecc) E queste rappresentazioni fanno parte della mia rappresentazione
“sedia”, nel senso che l’oggetto “sedia” sarà dotato di proprietà percettive e fisiche, (come
appare, quanto pesa, quali sono le sue caratteristiche tridimensionali, le sue caratteristiche legate
alla funzione, ecc. Quindi ci sarà tutta una serie di informazioni relative a ciascun oggetto, e una
parte di queste informazioni sono caratteristiche percettive, quindi legate a qualcosa che il mio
sistema percettivo raccoglie.
Queste rappresentazioni che ora io ho in memoria, sono poi confrontate col risultato
dell’input visivo: man mano che il mio sistema percettivo ha raccolto l’informazioneha
analizzato con i processi più di “base” (a livello di sensazione)  ha analizzato in forme via via più
complesse  a un certo punto arriva a crearmi una rappresentazione che non ha ancora un
significato, e che viene confrontata con tutte le rappresentazioni che ho in memoria (è un
po’come se io andassi di fronte a uno schedario, a confrontare una per una con tutte le
rappresentazioni che ho in memoria, fino a quando trovo quella che coincide).

La questione è che abbiamo una serie di problematiche che hanno a che vedere con:
- il tipo di rappresentazione: che informazione è rappresentata in questa rappresentazione?
- il modo in cui le categorie sono descritte : cioè che tipo di categorie ci sono? categorie di base,
sovraordinate, sotto ordinate, categorie legate alla funzione, legate all’esperienza, legate al
processo di confronto.
-è un processo che procede in maniera seriale o in maniera parallela?
-sulla base di tutta l’informazione disponibile o sulla base di solo una parte di informazione?

In pratica mi trovo di fronte a una serie di domande aperte che sono “cruciali”, perché se io non
risolvo il problema del “come faccio ad associare”, cioè a legare, a mettere assieme memoria e
percezione, mi ritrovo ad avere:

2
-da una parte: una enorme conoscenza enciclopedica, formata da tutto quello che ho accumulato
nel corso di una vita
-e dall’altra: un sistema percettivo efficientisimo che mi separa la figura dallo sfondo, mi
raggruppa gli elementi che fanno parte dello stesso oggetto, alloca l’attenzione in maniera
corretta, localizza gli oggetti, insomma fa tutto quello che deve fare ma NON E’ IN GRADO di
ASSOCIARE, la rappresentazione della cosa che ho davanti, a un qualcosa di cui ho conoscenze
in memoria!
Quindi c’è un “gap” un “vuoto” tra PERCEZIONE e MEMORIA.
E questa cosa oggi la affronteremo dal punto di vista COGNITIVO, per cui la domanda è:

QUAL E’ IL CODICE e COME FACCIO A UTILIZZARLO, per METTERE ASSIEME MEMORIA E PERCEZIONE ?
questa è la domanda da cui oggi partiamo.

Riprendiamo un attimo quello che abbiamo detto finora riguardo alla PERCEZIONE, e anche in
parte della SENSAZIONE.
Abbiamo parlato di una serie di processi che si occupano di fare un’analisi dell’input visivo:
-si occupano di accorgersi che ci sono degli oggetti rispetto a uno sfondo-> e quindi abbiamo
parlato di separazione figura-sfondo-
-e si accorgono che all’interno di questi oggetti ci sono dei pezzi che vanno assieme : abbiamo
parlato di “integrazione degli attributi” e di “principi della Gestalt”; quindi sappiamo che nel
mondo vicino a noi esistono degli oggetto tra loro coerenti che sono separati da uno sfondo .
Abbiamo parlato anche di localizzazione: io so che questo oggetto che si trova vicino a me è
situato in una qualche parte del mio campo visivo, oppure del mio mondo tridimensionale: si trova
a una certa distanza da me, è più vicino rispetto a qualcos’altro, o è più lontano rispetto a
qualcos’altro. Quindi so che c’è un oggetto vicino a me, a una certa distanza. E questo non è poco!
Infatti vi ho detto che il ns sistema percettivo funziona sulla base di una informazione che è in larga
parte degradata! Tuttavia, anche se il mio sistema percettivo ha fatto dei grandi progressi- rispetto
al fatto di non sapere nulla in assoluto- manca ancora una informazione fondamentale! manca
l’informazione di: Che cosa ho davanti? Qual è il nome, Qual è il significato di quell’oggetto lì? (è
una palla, un gatto, una sedia o una teiera?)
Per rispondere a questa domanda il mio sistema cognitivo deve avere -da qualche parte-
un’informazione su che cos’è e come appare una palla, un gatto, una sedia ecc.

A quel punto io mi trovo con 2 elementi:


1)- il mio sistema cognitivo che da qualche parte ha delle informazioni su cosa sono e come
appaiono miliardi di oggetti, informazioni che si trovano nella mia memoria
2)-e tutto ciò che il mio sistema visivo sta raccogliendo dal mondo: che c’è un certo oggetto, e che
questo oggetto si trova a una certa distanza da me

La domanda è: COME FA IL SISTEMA VISIVO A VEDERE CHE QUELL’OGGETTO


CHE SI TROVA A UNA CERTA DISTANZA DA ME, CORRISPONDE A UN QUALCOSA
CHE C’E’ IN MEMORIA?
Probabilmente esiste un “formato comune”: come se voi andaste a cercare una parola in un
vocabolario (avete una parola in italiano-> andate a cercarla nel vocabolario italiano. Oppure
potrebbe essere un vocabolario di forme, o potrebbe essere un vocabolario di tipi di
rappresentazioni, però poi, oltre a questo “formato comune” ad un certo punto ci deve essere un
tipo di rappresentazione percettiva e mnestica che permettono il confronto per dare un
significato a quello che il mio sistema percettivo ha riscontrato esistere nell’ambiente vicino a me.

3
Partiamo da un esempio in cui gli stimoli che trattiamo sono lettere maiuscole (quindi si tratta di
stimoli semplici in quanto il numero delle lettere è limitato, invece gli oggetti che ci sono nel
mondo esterno sono infiniti, quindi esaminare il mondo esterno è più complicato)
Compito: lì sul foglio c’è un’informazione, sono presenti delle lettere, e io a ciascuna di queste
lettere devo assegnare un significato.
MA SULLA BASE DI CHE COSA AVVIENE QUESTO RICONOSCIMENTO?
-una possibilità è che il riconoscimento avvenga sulla base di CARATTERISTICHE VISIVE di BASE
(per es: sono state proposte una serie di caratteristiche che voi trovate in colonna, infatti nella 1°
colonna trovate tutte le possibilità: una linea dritta orizzontale, una linea dritta verticale, una linea
dritta diagonale orientata verso dx, una linea dritta diagonale orientata verso sx, una linea curva,
una curva chiusa, una V aperta, una H aperta, che contiene delle intersezioni, che contiene o non
contiene una discontinuità ecc. ecc.
Esistono quindi una serie di caratteristiche che sono state proposte, e per ciascuna delle lettere
che voi vedete nelle altre colonne, andiamo a vedere se quella caratteristica è presente o no.
Es. prendiamo la lettera “i” . La lettera i ha la caratteristica di avere una linea verticale, e poi
scendendo non trovate nient’altro se non la caratteristica di essere simmetrica.
In effetti la “i” è simmetrica”, ed è verticale.
Quindi ci sono una serie di caratteristiche che noi abbiamo in ciascuna lettera.
Se prendiamo la lettera “o” vediamo che è una cura chiusa e che è simmetrica.
Quindi combinando queste caratteristiche si riesce a costruire delle mappe di tutte le lettere che
avete davanti; quello che a noi interessa è che:
se noi creiamo dei “rilevatori” di queste caratteristiche semplici e quindi da un lato mettiamo
questi “rilevatori” e dall’altro lato mettiamo l’enciclopedia ossia questa tabella che vedete qui,
succede che il rilevatore dice: “in questo momento ho davanti a me una curva aperta verso l’alto
ed è simmetrica”  l’unica lettera che corrisponde a questo, è la lettera “U”.
A quel punto il sistema è in grado di funzionare e dire: “la lettera che sto guardando è una “U”.

Quindi questo delle lettere è un modello estremamente semplice ossia è un modello semplificato
perchè restringe il campo solamente alle lettere dell’alfabeto latino e maiuscole.
Però va oltre, perché mi dice che “abbiamo una serie di rilevatori”.
Quindi quello che è critico per noi è che: ad un certo punto il sistema riesca a raccogliere
l’informazione su N caratteristiche (e queste caratteristiche sono tutto quelle che abbiamo visto
nella 1° colonna) e dopo che ha raccolto l’elenco di caratteristiche di quello che ho davanti-> lo
confronta con la mia conoscenza enciclopedica (quello che c’è nella tabella) e il risultato di
questo confronto -> è la lettera che ho davanti.
Ovviamente questo è un modello molto semplice perché funziona così per lettere con questo font:
lettere maiuscole e lettere dell’alfabeto latino, ma noi siamo in grado di fare molto di più, anche
semplicemente nel campo della lettura: maiuscolo, minuscolo,corsivo e molti tipi di font diversi.
Quindi il rischio è -per utilizzare questa rappresentazione- di dover estendere all’infinito la lista di
caratteristiche che io devo rilevare, quindi c’è il rischio che questo sistema non sia particolarmente
efficiente. Ciò nonostante i primi Modelli Connessionisti utilizzavano un sistema di questo tipo per
distinguere delle lettere  E Trovavano 2 effetti interessanti:
-il 1° effetto è che erano anche abbastanza accurati. L’accuratezza è un “buon” dato che ci dice
che il sistema riesce a comportarsi bene rispetto al riconoscimento di lettere.
Tuttavia a noi psicologi interessa soprattutto che il sistema si comporti in maniera simile alle
persone: e quello che fanno le persone per la maggior parte del tempo è commettere errori.
Infatti una caratteristica della cognizione umana è quella di essere esposta a degli errori
sistematici, cioè a dei bias.
4
Quindi una misura della somiglianza di un sistema artificiale alla cognizione umana può anche
essere quella di replicare gli errori tipici.
-2° effetto: il sistema in effetti tende a confondere delle lettere che -in condizioni per es. di
scarsa visibilità- anche noi tendiamo a confondere, come ad es. confondiamo la “c” con la “g” o
con la “o”; ma per esempio confondiamo molto meno la “g” con la “b”. (o la g con il 9 -se lo
estendo anche ai numeri. Può infatti essere esteso anche ai numeri)
Quindi questo è interessante per 2 motivi:
1)- pur essendo “un primo modo” semplificato (semplificato in quanto funziona solo su un certo
tipo di stimoli) è pur sempre “un primo modo” per affrontare il problema di come fare a mettere
assieme il percetto con un significato.
Quindi questo comincia ad affrontare il problema di cui stiamo parlando oggi: COME FACCIO A
COLMARE IL GAP, il VUOTO CHE C’E’ TRA PERCEZIONE e SIGNIFICATO, cioè Come faccio a mettere
assieme il percetto con un significato.
2)-Dall’altra parte è stato anche la base dei primi modelli artificiali di visione, per cui voi vi
trovate sul cap dell’Atkinson una parte relativa alle reti connessioniste che facevano esattamente
questo! Avevano dei rilevatori di caratteristiche e, sulla base di questi rilevatori di caratteristiche e
di una serie di pesi che venivano appresi dalla rete, imparavano a identificare delle lettere e
nell’identificarle apprendevano anche a fare degli errori tipici che fanno delle persone.

Fin qui abbiamo parlato di lettere e, come vi ho detto questo può essere esteso anche ai numeri.
Diventa più complesso nel momento in cui si passa agli oggetti reali, perché gli oggetti in sé sono
molto più complessi perché sono composti da +parti, rispetto a una lettera, inoltre gli oggetti
pongono anche dei problemi un po’ diversi: ad es. una lettera noi la vediamo sempre “di fronte”
-eccetto che non sia una lettera tridimensionale dell’insegna di un negozio, ma in questo caso
allora diventa un oggetto (l’insegna) e non una lettera.
Quindi finora abbiamo parlato di lettere viste di fronte, ma se ci spostiamo nel mondo degli
oggetti abbiamo:
- il problema della “struttura” dell’oggetto
- e il problema della “prospettiva”

E questo significa che le cose diventano molto più complicate e qui abbiamo 2 TEORIE
importanti relative al RICONOSCIMENTO DI OGGETTI:
-la teoria di Biederman
-e la teoria di Marr

Biederman ha proposto la TEORIA DEL RICONOSCIMENTO VISIVO in cui il risultato dell’analisi visiva
è confrontato con delle rappresentazioni mantenute in memoria a lungo termine ( e questo è
quello di cui abbiamo parlato relativamente alle lettere), in cui per ciascun oggetto noto è
rappresentata la forma.
Quindi questo significa che adesso ho la stessa tabella di prima, che però adesso:
-oltre a comprendere un elenco di caratteristiche (es. ha/non ha delle linee verticali, ha/non ha
delle parti curve, e/non è simmetrica)
- comprende anche delle forme tridimensionali che, nel loro insieme, rappresentano la struttura
dell’oggetto.
Quindi secondo Biederman queste rappresentazioni sono composte (io vi faccio vedere dei disegni di
come Biederman si rappresentava queste immagini) da forme basilari/elementari tridimensionali, i geoni,
che sono continuamente confrontate con i risultati dell’analisi visiva.
5
I geoni sono le forme geometriche che si vedono nei giochi dei bambini e che loro mettono
assieme per fare qualcosa che assomigli a un telefono, a un cavallo, a una persona ecc, quindi c’è il
cubo il cilindro, il mezzo cono, il parallelepipedo ecc

Secondo Biederman i Geoni costituirebbero la base della percezione degli oggetti, Quindi tra queste forme
ci sarà: il cilindro, il cono, il cubo, la sfera ecc (ci sono 36 geoni) Così come i bambini utilizzano queste forme
per costruire ogni tipo di oggetto, così anche noi siamo in grado di utilizzare quei solidi per rappresentarci le
cose dal mondo.

Ad es: nella progettazione 3D gli elementi di base della costruzione di solidi 3D sono i geoni. Quindi si va a
costruire delle figure sulla base di elementi semplici, e poi si va a deformarli, unirli, arricchirli, ad applicare
delle textures ecc. Quindi per lungo tempo la base della programmazione 3D è stata questa.

Ma DA COSA PARTE BIEDERMAN?


Parte dal fatto che noi siamo in grado di riconoscere facilmente degli oggetti quando sono
rappresentati in maniera completa (un’asse da stiro, una macchina fotografica, un aereo e una
scrivania) Per alcuni di questi oggetti facciamo un po’ più di fatica nel senso che per qualcuno di
questi oggetti ma non per tutti, facciamo un po ‘ più di fatica perchè diventa un po’ meno
prototipico quando noi togliamo dei pezzi (per es. il primo, se non ci avessero detto che era
un’asse da stiro, sarebbe stato un oggetto un po’ bizzarro, perché non sta in piedi!. Il secondo
oggetto invece anche togliendo dei pezzi rimane ancora una macchina fotografica, il terzo anziché
un aereo sembra più un tagliacarte, infatti per essere un aereo manca la coda e manca la testa. Il
quarto è poco riconoscibile come scrivania.
Viceversa se noi andiamo a togliere dei pezzi di segmento, ossia a togliere lo stesso numero di
parti nere che avevamo tolto nella 2° colonna, paradossalmente l’oggetto rimane più visibile,
cioè mantiene di più la sua identità rispetto alla versione precedente.
Quindi se io vado a togliere dei componenti faccio un danno maggiore, rispetto a quando vado a
degradare, cioè a togliere dei pezzi di linea.
Quindi ci deve essere un qualcosa di particolare che non ha a che vedere con il fatto che le linee
siano complete o tratteggiate, perché (tutto sommato voi comunque vedete che quella è un’asse
da stiro, e l’altro è un aereo) nel togliere 1 componente si perde qualcosa in più!  quindi
Nelle COMPONENTI ci deve essere qualcosa di “centrale”.

E sulla base di questa e di altre evidenze Bierman propone la TEORIA DEI GEONI: un ristretto
numero di oggetti tridimensionali che costituiscono i “primitivi” del sistema di riconoscimento
degli oggetti. (sono 36 geoni che combinati assieme vanno a creare degli oggetti) .
Partiamo dal più semplice, l’ abasciur (l’ultimo in basso a dx) : a quello ci arrivate combinando il n.
3 con il n. 4
La valigia : ci arrivate combinando il n.5 con il n. 2
La torcia: il n. 3 con il n. 2 e con il n. 3

L’idea di Biederman è che attraverso queste forme elementari (di base) noi siamo in grado di
costruire la struttura di tutti gli oggetti di cui siamo a conoscenza, e quindi ritiene che questa sia
l’ossatura della nostra cognizione di come sono composti gli oggetti.

6
Questa teoria di Biederman è senz’altro un bel passo avanti perché mi permette di passare da un
numero infinito di forme – che sono quelle che un oggetto può avere- a un numero di forme
finito !
(quindi con questo ho risolto già un sacco di problemi)
Inoltre questo numero finito di forme può essere -come vedete- modulato, ridimensionato. (per es.
negli esempi che voi vedete sulla sx, il geone n.3 è + grande rispetto al geone n.4; ma per costruire
l’ abasciur io devo rimpicciolire il n.3. E devo deformare il n.2 e schiacciarlo lungo un lato, per
ottenere il parallelepipedo delle dimensioni della valigia.
Quindi: i geoni sono delle forme primitive, (forme di base, elementari) che io posso deformare,
secondo quanto mi serve; posso realmente usarli per modellare la struttura degli oggetti intorno
a me.
Quindi il mio sistema percettivo -a questo punto- non deve più fare delle operazioni complicate,
ma quello che deve fare è cercare geoni. E una volta che il mio sistema percettivo ha trovato i
geoni, li vado a confrontare con quello che so che succede nel momento in cui metto assieme un
geone n.3 con un geone n. 5 e, una volta che ho capito cosa ho davanti, vedo una tazza da tè.

Quindi Biederman cosa ha fatto ?


-restringe il numero infinito di caratteristiche tridimensionali che può avere un oggetto,
a un numero finito, -quindi restringe alle 36 componenti (o geoni)- e facendo questo riesce anche
a dare un obiettivo un po’ più fattibile al sistema percettivo, che è quello di andare a trovare quegli
elementi all’interno del mondo che ho di fronte.
Qui vediamo ancora geoni: a sx vedete come posso metterli assieme per costruire un cavallo, una
persona, uno struzzo, ecc.
Ma in realtà a noi interessa di più quello che succede a dx perché a destra io ho rappresentato il
fatto che questi geoni noi li possiamo deformare , quindi io posso ad es. allungare il cilindro, il
cono, la piramide, ad es. il pallone da football io lo posso allungare e schiacciare alle estremità,
posso schiacciare il bicchiere di vino, quindi i geoni non sono delle strutture fisse ma diventano
delle basi flessibili per la costruzione del mondo esterno.

Ma qual è il problema, ossia i limiti dei geoni?


(li vediamo in questa slide e anche nella slide successiva)

Un 1°problema sta in questo: se “l’eleganza” del Modello di Biederman stava nell’aver ridotto
l’infinita complessità del mondo  a un numero finito (36) di elementi, nel momento in cui io
dico che per spiegare l’infinita complessità del mondo con un numero finito di elementi, io devo
applicare un numero infinito di trasformazioni, voi capite che “quello che ho buttato fuori dalla
porta mi rientra dalla finestra” , cioè anche se i geoni sono pochi MA HO LA POSSIBILITA’ di
MODIFICARLI all’INFINITO,ecco che la complessità che ero riuscito a ridurre, mi ritorna indietro !
Questo è 1 dei punti su cui questa Teoria di Biederman arranca !
Però almeno è un modello che cerca di rispondere alla DOMANDA DI BASE che ci eravamo posti
prima, e la domanda di base è :

QUAL È LA RAPPRESENTAZIONE INTERMEDIA CHE MI PERMETTE DI METTERE ASSIEME


PERCEZIONE E CONOSCENZA? (percezione e significato)

Mi viene chiesto di ripetere il problema della teoria di Biederman:


Per spiegare Uno dei problemi della teoria di Biederman, riparto da quello che è uno dei pregi
della teoria.

7
Uno dei pregi della teoria era che, nonostante le caffettiere, le sedie, gli occhiali ecc. possano
apparire in un numero infinito di modi, il modello di geoni riesce a descrivere l’infinita varietà di
oggetti utilizzando un numero finito di componenti primitive.
Quindi io passo da: infiniti modi attraverso cui il mondo può apparire,-> a 36 forme primitive da
trovare nell’ambiente circostante. In effetti il mondo attorno a noi è fatto quasi tutto di scatole,
oggetti tondi o cose combinate l’una con l’altra.
E in questo consiste appunto l’”eleganza” del modello ossia questo era 1dei punti “a favore” della
teoria di Biederman.
Tuttavia poi il Modello ci dice che è vero che le forme primitive/i geoni di base sono 36, ma per
rappresentare gli infiniti oggetti del mondo io li posso modificare in un numero infinito di modi :
allungandoli, accorciandoli, schiacciandoli, stringendoli di lato, piegandoli su se stessi, per
approssimare meglio le cose del mondo. Ma facendo queste operazioni qui, a sto punto non ho
più 36 forme ma ne ho 36 moltiplicato il numero infinito di deformazioni che io ho fatto! Quindi le
forme diventano di nuovo infinite !! Quindi potendo modificare all’infinito i geoni ,ecco che la
complessità che ero riuscito a ridurre, mi ritorna indietro !
Questo è uno dei punti critici, dei limiti del modello di Biederman!

Tuttavia il modello di Biederman è importante perchè ha cercato di affrontare quello che è uno
dei problemi cruciali:
COME FARE A LEGARE/METTERE ASSIEME/UNIRE PERCEZIONE E SIGNIFICATO.

Nel momento in cui io unisco, faccio un ponte tra: quello che il mio sistema percettivo rileva
nell’ambiente, e una struttura nota  a quel punto ho a mia disposizione anche tutte le altre
proprietà/caratteristiche dell’oggetto (cavallo struzzo ecc).

Quindi il modello di Biederman riesce veramente a fare “il salto”  dalla PERCEZIONE
all’ IDENTITA’ di un OGGETTO

Però abbiamo detto che il modello dei geoni di Biederman ha anche dei limiti:
- Uno è quello legato alla complessità  complessità intesa come infinito numero di
deformazioni
ma poi ci sono una serie di problemi legati all’estensione, cioè al contesto reale:
- la struttura dell’ambiente e in particolare le relazioni tra oggetti: distanza, occlusioni ecc.

Finora non abbiamo parlato della relazione che c’è tra un oggetto e l’altro, e molto spesso noi
riusciamo a riconoscere un oggetto non solamente grazie alle sue caratteristiche tridimensionali
ma anche sulla base di “come appare la superficie”: es. superficie in tessuto o in metallo ecc. Se io
vi presentassi un automobile interamente ricoperta di velluto, sarebbe sicuramente un qualcosa
che, nonostante abbia le caratteristiche tridimensionali proprie di una macchina, voi fareste più
fatica a riconoscere, proprio perché c’è un’informazione -quella della superficie- che è
incongruente con quello che voi conoscete della macchina.
Ma il modello di Biederman non entra mai nel merito del ruolo della tessitura !

Inoltre il modello di Biederman “fa a botte”, è in contrasto con il modello di Gibson che afferma
che l’informazione non ha bisogno di elaborazione cognitiva.
Invece nel modello di Biederman il “centro”, il “cuore” del modello è proprio il sistema
cognitivo che va a creare e deformare la struttura e le forme degli oggetti.

8
(io: secondo Gibson le informazioni sono già presenti nella stimolazione percepita dal soggetto e da quest'ultimo
possono essere immediatamente colte senza che debbano intervenire processi di elaborazione. Il soggetto non si trova
dunque né a dover rielaborare in maniera costruttiva il percepito, né a integrarlo in alcun modo: deve solamente cogliere
le informazioni percettive disponibili nell'ambiente).

Inoltre c’è un ulteriore domanda:

QUAL E’ IL FORMATO IN CUI SONO RAPPRESENTATI gli OGGETTI in MEMORIA A LUNGO TERMINE?
PROTOTIPI o ESEMPI ?

C’è un discreto dibattito sul fatto che gli oggetti in memoria a lungo termine siano rappresentati
come “PROTOTIPO” (quindi come l’esempio più tipico di una certa categoria cioè ”come
tipicamente appare” qualcosa di una certa categoria) o come un “ESEMPIO”, (quindi un qualcosa
di reale che io riesco a identificare).
Per es. : prototipo di mammifero  tutti abbiamo in mente un prototipo di mammifero però può
avere delle caratteristiche che non coincidono necessariamente con nessun animale esistente,
perché “mammiferi” siamo noi umani , ma sono anche le balene, i pipistrelli ecc.
Quindi noi possiamo avere una rappresentazione di “mammifero” ma questa rappresentazione
può non coincidere con nessun mammifero realmente esistente!
Allo stesso modo voi potreste avere una buona rappresentazione di “che cos’è una sedia”, senza
che questa coincida con nessuna delle sedie che voi avete visto nel corso della vs vita. E’ un
qualcosa di sufficientemente flessibile da adattarsi sia alla sedia in cui siete seduti in questo
momento, sia alla sedia che c’è in dipartimento a Cesena, sia allo sgabello che gira su se stesso, sia
alla poltrona e a mille altri tipi di sedie diverse. Il vs “prototipo” funziona bene e vi permette di
definire qualunque “sedia” come tale (cioè come sedia) ma haimè non esiste, cioè non coincide
con niente del mondo esterno!
Oppure
come “ESEMPI: può essere che nella memoria a lungo termine io non ho delle rappresentazioni
di cose che non esistono, ma ho delle rappresentazioni di cose di cui ho avuto esperienza.
Quindi il mio ESEMPIO di “sedia” è la sedia su cui sono seduto in questo momento, è la sedia che
avevo in casa quando ero piccolo ed ho imparato che cos’è l’oggetto “sedia”, oppure è la sedia
della mia scuola elementare, -> quindi l’ESEMPIO è un qualcosa che coincide con un oggetto del
mondo reale .

E il modello di Biederman non entra nel merito di questo punto, cioè se noi utilizziamo delle
rappresentazioni per prototipi o delle rappresentazioni per esempi. Lui lascia la domanda aperta

Rispondo alla domanda che mi è stata fatta rispetto a Biederman:


Biederman non si esprime rispetto a quale di questi due -prototipi o Esempi- sia il modo in cui
vengono mantenute le rappresentazioni in memoria; perché comunque sia, anche se io mi ricordo
come “ idea di sedia”, la mia sedia delle elementari, avrò sempre una struttura tridimensionale, e
quella struttura tridimensionale sarà sempre una struttura tridimensionale basata sull’oggetto che
ho visto realmente.
Biederman lascia la “domanda aperta”, cioè Biederman non entra nel merito di questo punto, non
si esprime per quanto riguarda i prototipi e gli esempi. Risponde ad altre domande ma non entra
nel merito di questo.

9
Qui vedete che questa è la stessa immagine dell’altra volta, sono le stesse persone dell’altra volta.
Noi siamo sufficientemente in grado di distinguere ciascuno di questi e anche le persone là in
fondo, infatti riusciamo a vedere che ci sono delle persone più distanti da noi, SE PERO’ noi
facciamo così (??) sono ancora in grado di vedere -se voi notate il masso ho fatto comparire una
persona che vi appare come “molto piccola”- in realtà è la stessa persona che c’era là davanti ma
semplicemente l’ho portata qui vicino a noi. E’ ancora composta come una persona umana, quindi
noi siamo in grado di riconoscerla come “una persona”, secondo il modello di Biederman, perché
ha pur sempre il geone della testa, il geone del tronco, ecc. però rispetto agli indici prospettici
(alle distanze) il modello non dice nulla! Invece voi sapete che gli indici prospettici aiutano a
costruire la rappresentazione di una persona: in questo caso abbiamo l’impressione che la persona
-man mano che si allontana da noi- diventi sempre più grande, fino ad arrivare di dimensione
normale quando si trova più avanti (**sbaglio: dovrebbe essere corretto dire si avvicina a noi. Confronta con la
slide)
Il modello di Biederman però tutto questo non lo spiega !

C’è quindi un altro modello, il modello di MARR - che storicamente è stato creato prima (1982),
mentre quello di Biederman è successivo, è del 1990- che mette al centro del RICONOSCIMENTO
di OGGETTI degli INDICI di PROFONDITA’
(mentre il modello di Biederman metteva al centro del riconoscimento di oggetti la struttura fisica
dei geoni).

COSA METTE AL CENTRO MARR?


Marr parla di indici di profondità.
E parte osservando che alcuni indici di profondità non dipendono dalla rappresentazione di
angoli e forme, e partiamo esattamente da quelli di cui abbiamo parlato prima, ossia tessitura,
visione binoculare, parallasse, tuttavia sono fondamentali per formare un’immagine dotata di
profondità.
E Marr introduce -oltre alla rappresentazione a 3 dimensioni della scena, un’altra dimensione,
che è quella a 2 dimensioni e ½ .

COS’E’ la RAPPRESENTAZIONE a 2 dimensioni e ½ ?


In primo luogo noi abbiamo che a livello sensoriale qualcosa colpisce la ns retina: stimolo
prossimale. Sulla nostra retina arriva o l’immagine di una macchina vista di lato, o l’immagine di
una macchina vista di ¾, ma comunque sia sulla nostra retina arriva qualcosa. E fin qui non c’è
nulla di rivoluzionario: è bidimensionale, inoltre sappiamo bene che ha tutti i limiti della ns retina,
(e su questo abbiamo già detto molto quando abbiamo parlato di “sensazione”) e ancora noi non sappiamo
niente, in particolare non sappiano niente delle caratteristiche tridimensionali di quello che
abbiamo davanti; in particolare se guardate l’immagine sulla sx , non fate fatica a immaginare che
potrebbe essere un cartonato della macchina, ma non necessariamente, potrebbe essere una
figura tridimensionale. Diventa una costruzione del ns sistema visivo nel momento in cui
osserviamo un oggetto della vita reale.
E come facciamo?
Nella vita reale noi abbiamo varie forme di informazione e prima di tutto abbiamo delle
discontinuità percettive, i contorni: il mio sistema percettivo rileva i contorni.
(e fin qui siamo a quello che abbiamo già detto a proposito della sensazione)
Qui siamo bidimensionali: ho raccolto informazioni rispetto ai contorni dell’oggetto che ho di
fronte a me. Tuttavia abbiamo anche altre forme di informazione: la direzione della luce.

10
La luce è riflessa in modo diverso e proietta delle ombre in modo diverso, a seconda di dove
punta sull’oggetto. La luce che punta sul cofano proietterà in una direzione diversa rispetto a
quella che punta sul tettuccio della macchina. Sotto la macchina ci sarà una zona d’ombra. Le
ruote avranno una illuminazione particolare legata al fatto che si trovano sotto la carrozzeria e
sono più o meno visibili dal ns punto di vista, ecc. ecc.
Ci saranno quindi una serie di informazioni luminose che dipendono dall’orientamento, e ci
danno delle informazioni rispetto all’orientamento della macchina, e alla profondità.
Quindi fino a questo punto io non ho ancora costruito una rappresentazione 3D della macchina,
però rispetto all’informazione che avevo prima -che ho un oggetto con certi contorni, ho un certo
disegno della macchina di fronte a me- , a quel punto io ho: un disegno della macchina, con certi
contorni, e ho anche una certa informazione ambientale che mi comincia a raccontare qualcosa
su che pezzi dell’oggetto io sto davanti.
Questa è una rappresentazione che non è ancora un oggetto tridimensionale, ma non è
neanche più quello bidimensionale!  E’ l’oggetto prevalentemente bidimensionale con in più
dell’informazione ambientale che dipende da “come” l’oggetto è orientato nello spazio.
Infine il mio sistema, sulla base di tutto questo -> passa al modello completo degli oggetti nella
scena.
Quindi qui (?) si arriva ad avere una rappresentazione basata su una struttura tridimensionale.
Qui (?) si capisce bene: c’è una macchina organizzata in questo modo: ha un corpo principale, con
4 ruote sotto, con dei vetri fatti con questo materiale, ecc.
Il 3° livello, quello nella figura 4, è un livello completamente tridimensionale e astratto.
Il 3° è un livello dove l’informazione bidimensionale viene integrata con l’informazione relativa
alla direzione della luce.
Il 2° livello è un livello in cui io conosco solamente i contorni dell’oggetto che mi sta davanti,
infatti il 2° livello è come se fosse un disegno (il disegno non ha profondità)
Il 1° livello è quello che colpisce la mia retina

Un altro esempio è questo: vedete che qui c’è una tazzina e la luce colpisce con un certo angolo.
Nella 1°rappresentazione, quella che c’è a sinistra, non è rappresentato ancora niente di
tridimensionale, se non il fatto che ci sono alcuni angoli più chiari e alcuni angoli più scuri, e alcune
transizioni tra il chiaro e lo scuro. Solo questo!
Il 2°comincia a dare delle interpretazioni a questa informazione luminosa: c’è una zona vuota tra
l’ombra più vicina e quella più lontana; questa è la parte visibile della tazzina; l’ombra più vicina si
curva verso chi guarda; là sul retro c’è l’ombra proiettata dall’oggetto tridimensionale; il contorno
dell’oggetto si abbassa -dal bordo alla base- , e poi lassù in alto c’è un’ulteriore ombra ricurva
rispetto a chi guarda; insomma a quel punto il mio sistema sta raccogliendo tutta l’informazione
luminosa presente nell’ambiente -e in questo caso presente in quella tazzina-, informazione
luminosa che è in grado di raccontarmi qualcosa rispetto all’oggetto che ho di fronte.
Dopo che ha raccolto quell’informazione luminosa  la elabora e riesce a passare alla
rapprentazione di 2 dimensioni e 1/2 – perciò il B cioè quello in mezzo, è la rappresentazione di 2
dimensioni e ½, nel senso che è bidimensionale ma comincia ad acquisire l’informazione legata
alla prospettiva.
Il pannello C invece è la rappresentazione tridimensionale: mi sono creato una rappresentazione
che ho di fronte a me una tazzina. E una volta che io ho in mente di avere di fronte a me una
tazzina, me la posso immaginare vista da sopra, da davanti, vista da un lato, o vista dall’altro lato,
ossia posso manipolarla mentalmente come voglio.
Però a quella io ci devo arrivare, e ci arrivo sulla base di inferenze che faccio sulla base della
prospettiva da cui mi arriva la luce.
11
Quindi la differenza principale tra il modello di Marr e quello di Biederman è
il fatto che
nel modello di Marr la LUCE, la PROSPETTIVA e gli INDICI DI DISTANZA, giocano un ruolo molto
importante  perché mi permettono di crearmi una rappresentazione della PROFONDITÀ degli
oggetti e quindi della loro LOCALIZZAZIONE SPAZIALE.

Invece Biederman
si è concentrato prevalentemente sulla STRUTTURA TRIDIMENSIONALE DELL’OGGETTO.

Facciamo una pausa e poi iniziamo la lezione di recupero.

2.24.03.2

Nella 1° parte abbiamo parlato del RICONOSCIMENTO degli OGGETTI e abbiamo visto qual è uno
dei grossi problemi che noi dobbiamo affrontare: trovare un codice comune tra PERCEZIONE e
MEMORIA.
(es: se troviamo una parola in italiano andiamo a cercarla nel vocabolario di italiano->in questo
caso il codice comune è il codice della parola, e la vs rappresentazione arriva a trovare quella
parola tra le varie pagine scritte che avete davanti e la va a confrontare con qualcosa che è a vs
disposizione e che è appunto il vocabolario.
Questa metafora è stata presa a prestito da Biederman per l’idea dei geoni, ma è anche la
metafora dei modelli connessionisti per l’idea del riconoscimento sulla base delle caratteristiche
semplici, e in generale questi modelli sono dei mezzi che hanno permesso di capire qualcosa di più
sul modo in cui noi diamo significato agli oggetti.
L’altro aspetto del modo in cui noi diamo significato agli oggetti è quello legato al fatto che noi
NON diamo sempre lo stesso significato agli oggetti in quanto noi diamo un significato agli
oggetti sulla base del contesto.
Il contesto molto spesso è tutto !!!.
(es. preso dal libro di testo: la forma di un oggetto che per noi europei è un po’ strana, ma se visto
fuori da una casa americana può essere facilmente riconosciuto come una cassetta delle lettere; e
che visto all’interno di una cucina può essere facilmente riconosciuto come una forma di pane con
una fetta tagliata. Ovviamente l’oggetto è lo stesso! quindi questo ci dice che in sé non è qualcosa
che intrinsecamente fa protendere per una o per l’altra interpretazione, tuttavia il contesto in cui
si trova mi dice che difficilmente in cucina ci sarà una cassetta delle lettere, e difficilmente sul
vialetto di casa ci sarà una forma di pane!
quindi l’interpretazione che noi diamo di un oggetto è legata:
-sia alle sue caratteristiche fisiche
-sia al contesto -in senso lato- in cui l’oggetto si trova (e poi vedremo come possiamo operazionalizzare
un po’ meglio questo contesto)

Questa è la base dell’importanza del contesto: l’avrete già visto in molti altri corsi.
In generale voi sapete che c’è una macro distinzione tra informazione bottom up e
fattori top down che interagiscono in diversi processi cognitivi.
Nel ns caso ci interessa la percezione, e nel caso della percezione succede che:
-noi abbiamo una informazione fisica (per es. l’attivazione di recettori sulla retina, o qualunque
cosa appartenga al mondo della sensazione) che va a costruirsi in maniera via via più complessa,

12
ma in maniera grossomodo “obbligatoria”, “passiva”; cioè qual è tutta l’elaborazione che io
posso fare al mio stimolo visivo “in entrata” ? andrò a rilevare i contorni, i colori, ecc.
Tuttavia la mia percezione non dipende in maniera stereotipata da quello che arriva alle mie
retine, ma dipende anche da quello che io mi aspetto di osservare, da quello che sto cercando,
da quello che “io so” che c’è là fuori.
Tutte le conoscenze precedenti fanno parte dei fattori top down: la memoria, l’attenzione,
l’attività che state svolgendo.
Invece tutto quello che arriva dal mondo esterno sono fattori bottom up
Il risultato di queste 2 informazioni dà luogo al fenomeno della PERCEZIONE , cioè quello che io
percepisco esserci nel mondo intorno a me.

E in questo caso partiamo da qualcosa che noi sperimentiamo continuamente e che è il fenomeno
butcher on the bus, cioè il macellaio sull’autobus: succede che se voi andate in macelleria sapete
che incontrate il vs macellaio, e quello vicino a casa mia si chiama Ivan. E io so che se vado nella
macelleria di Ivan e vedo uno che assomiglia a Ivan,  con ogni probabilità è Ivan!
Se invece prendo l’autobus e incontro un signore che mi sembra di conoscere, e magari
cominciamo anche a parlare; essendo io una persona estremamente dubbiosa, io inizio a
chiedermi: lo conosco o non lo conosco, l’ho incontrato prima d’ora? Faccio bene a parlargli?
Magari solo immagino di conoscerlo, in realtà è solo una persona che ho incontrato di sfuggita, l’
ho solo visto da qualche parte; ad un certo punto scendo dall’autobus e mi rendo conto che era il
mio amico macellaio che incontro tutte le volte che vado nella macelleria.
Ma perché ho fatto fatica a capire che era Ivan il mio macellaio?
Eppure Ivan aveva la sua stessa voce, la sua faccia, statura, i suoi stessi capelli, si esprimeva nel suo
solito modo, tuttavia cosa variava?  variava il contesto.!
La macelleria è un contesto in cui io mi aspetto di incontrare il macellaio Ivan mentre l’autobus è
un contesto in cui io mi aspetto di incontrare chiunque altro.
Allo stesso modo io ho una rappresentazione mnemonica molto più ricca quando incontro uno
studente dentro l’aula -di cui magari mi ricordo la domanda che mi ha fatto durante qualche
lezione- rispetto a quando incontro lo stesso studente sul treno Bologna-Cesena: so di averlo già
visto all’università ma non mi ricordo se durante una conferenza, una lezione, una sessione di
laurea ecc.
Domanda:
PERCHE’ IN ALCUNI CONTESTI IL RICONOSCIMENTO FUNZIONA BENE, ma se poi IL CONTESTO
CAMBIA, il RICONOSCIMENTO FUNZIONA MOLTO MENO BENE?

Proprio perché buona parte del RICONOSCIMENTO non è legato solamente a “da che geoni è
formata la faccia di Tizio o di Caio”, ma è legato anche al fatto di “chi mi aspetto di trovare in un
determinato contesto” questo è un fenomeno che ci dice che:
NON sono SOLO I GEONI ma è anche il CONTESTO che CI PERMETTE DI DARE UN SIGNIFICATO A
QUELLO CHE ABBIAMO DAVANTI.

Altra cosa: (non so se questa immagine l’ho presa dal libro o da un’altra parte)
Se voi vedete questa immagine, potete vederci cose diverse. Cosa ci vedete?
questo è un volto intermedio tra (salta audio): voi vedete che sono tutte deformazioni continue
della stessa figura, per cui parto dalla 1° in alto a sx in cui è molto facile riconoscere un volto di
uomo, ed è molto difficile riconoscere una donna; arrivo all’ultima in basso a dx in cui è molto
facile riconoscere una donna ed è molto difficile riconoscere un uomo. In mezzo ci sono tutti i
gradi intermedi.
13
A seconda che: io vi faccia vedere l’immagine subito dopo aver visto il volto di uomo, oppure
subito dopo aver visto il volto della ragazza a terra, posso dare un peso maggiore a una
interpretazione oppure all’altra.
Quindi io posso creare degli stimoli ambigui (nel senso che stanno a metà tra 2 interpretazioni
diverse) in modo da poter essere interpretati in due modi diversi.
Molti di voi li avranno visti entrambi: sia la donna seduta a terra, sia il volto di uomo.
Volendo avrei potuto dare un bias in un senso o nell’altro, e difatti questo esperimento lo
vedremo domani, ed è un esperimento fatto nel 1932, e lo faremo anche noi e useremo degli
stimoli ambigui e andremo a modificare quello che i partecipanti riferiscono di aver visto.

Le persone tendono a vedere una cosa piuttosto che l’altra perché possono esistere degli stimoli
ambigui che io posso manipolare sulla base dell’esperienza.
Quindi tra i vari fattori, oltre agli stimoli ambigui c’è anche l’esperienza
Infatti il fatto di aver visto in precedenza il volto o il fatto di aver già visto in precedenza la donna,
potrebbe dare un bias, cioè favorire, una delle 2 interpretazioni; quindi lo posso fare o in fase di
presentazione o in fase di test. (posso presentare lo stimolo e poi dire: disegnami il volto che hai
visto o disegnami la donna che hai visto)

Dopo che vi ho introdotto il ruolo del contesto, mi riallaccio a quello che in altre lezioni vi ho già
detto del contesto quando vi ho parlato delle frequenze spaziali e del fatto che il ns sistema
percettivo genera delle ipotesi percettive che poi va a testare.
(è quell’animazione dell’asciugacapelli che vi avevo fatto vedere)
Vi avevo fatto vedere uno schema molto cognitivo e molto poco “neuro”, nel senso che vi avevo
parlato di ipotesi percettive, però non avevo fatto riferimento a nessun modello neuroscientifico .
In realtà ce n’è uno ed è il modello di Bar (anno 2003 o 2004) (controlla il nome se scritto ok).
E’ la stessa cosa di quello che vi avevo fatto vedere l’altra volta: c’è uno stimolo -che è sempre
l’asciugacapelli- e c’è sempre una persona che lo guarda. L’unica differenza tra qui e l’altra volta è
che: l’altra volta vi ho fatto vedere un modello senza un cervello, e adesso invece vi faccio vedere
lo stesso modello ma con il cervello e le strutture che secondo Bar sono coinvolte
nell’interpretazione del significato dell’oggetto.
Quindi:
questo oggetto deve entrare nel mio campo visivo e la sua rappresentazione -prima di tutto le
basse frequenze (per il fenomeno della precedenza globale)- arrivano alle aree visive primarie
(perché la sua proiezione sulla retina è acquisita, trasdotto i segnali neurali, e trasmessa attraverso
le strutture talamiche fino alle visive primarie, che ne analizzano le caratteristiche sensoriali
(quelle di basso livello).
E fin qui non c’è niente di nuovo rispetto a quanto detto finora.
A questo punto però abbiamo uno stimolo che non è chiaro, perché -come dicevamo l’altra volta-
quell’asciugacapelli lì, ossia quella figura sfuocata lì, potrebbe essere in realtà tante cose.
E Bar allora ipotizza un percorso di questo tipo: che le aree frontali -legate alla presa di decisione-
ricevano un input dalle aree visive e  generino delle ipotesi.
Le ipotesi (come vedete) sono delle ipotesi nitide.
Quindi: ho visto qualcosa di sfuocato e quel qualcosa di sfuocato potrebbe essere un
asciugacapelli o un trapano o una brugola o una pistola  questa informazione viene inviata alle
aree deputate all’elaborazione degli oggetti che si trovano nella corteccia inferotemporale: viene
fatto un matching tra quello che è arrivato alle aree visive e queste ipotesi e avviene il
riconoscimento dell’oggetto.
Perché questo ve l’ho rimesso qui?
14
Innanzitutto perché questo è un po’ più completo rispetto a quello che avevamo visto l’altra volta,
ma anche perché
il modello di Bar integra in maniera molto interessante il concetto di “contesto”
Perché in questo modello ci sono 2 tipi di contesto ed entrambi agiscono nello stesso momento
ossia nel momento in cui le aree legate alle prese di decisioni creano delle ipotesi precettive che
poi vengono trasmesse alle strutture inferotemporali (cioè temporali inferiori) .
Il 1° modo in cui si crea un effetto-contesto è il contesto del globale rispetto al locale: il mio
globale è arrivato prima e quindi crea un contesto per l’analisi delle caratteristiche locali che
arrivano dopo. (cioè la 1° informazione che arriva alle aree visive è quella globale, ed è sfuocata).
Poi questa informazione viene trasmessa alle aree frontali.  Viene creato un modello  poi
questo modello viene ri-trasmesso alle aree temporali e qui funge da contesto all’analisi
successiva, e quindi più tardiva, delle caratteristiche locali.
Quindi il globale fa da contesto per il locale e quindi il globale è in grado di influenzare il locale!
e questo è molto importante!!! perché il fatto che il globale faccia da contesto per il locale e
quindi sia in grado di influenzare il locale è anche uno degli effetti base dell’ EFFETTO NAVON

Se vi ricordate, l’effetto principale dell’effetto Navon consisteva in 2 aspetti:


-la velocità il globale è + veloce del locale (ma la velocità è interessante fino ad un certo punto)
-l’informazione globale può modulare quella locale. Ma non viceversa!

Es: se io dovevo rispondere alla lettera globale, e quella locale cercava di interferire, non subiva
nessuna interferenza.
Ma se io dovevo rispondere a quella locale e quella globale mi interferiva, allora avevo una
interferenza enorme!
Quindi c’era un effetto contesto del globale sul locale ma non viceversa !!

Quindi Il modello di Bar che include questo passaggio in cui l’informazione globale -sfuocata-
viene utilizzata come base per l’analisi locale successiva/più tardiva, permette di spiegare com’è
che :
-il globale abbia un effetto sul locale (perché viene prima e funge da base), ma non accada
viceversa! Perché questo?
Perché nel momento in cui io analizzo le caratteristiche locali cioè i dettagli, le cose piccoline,
l’analisi delle cose grosse è già fatta, è già andata quindi non può avere ormai nessun ruolo.

Quindi il modello di Bar riesce a mettere assieme:


- il concetto di inferenza (percezione con inferenza)
- con l’analisi globale e locale
-e una prima definizione di contesto, in cui il contesto è all’interno dello stesso sguardo, ossia
all’interno dello stesso momento di gestione dell’informazione.
Io guardo cosa c’è di fronte a me: e prima vedrò tutta l’informazione grossolana e poi man mano
diventano più nitidi i dettagli. Quindi l’informazione più grossolana guiderà la mia analisi dei
dettagli. Quindi all’interno di quello che io vedo in un dato momento, il grossolano cioè il globale
fa da contesto al locale.
Questo è il 1° modo in cui si può operazionalizzare l’effetto contesto.

Il 2° modo in cui si può operazionalizzare il contesto è legato alle aree deputate alle
prese di decisione: se io in un certo momento ho degli obiettivi, sto cercando qualcosa, sono in un
certo stato, allora la mia presa di decisione avrà un bias nei confronti di “creare alcune ipotesi
15
percettive rispetto ad altre”. L’altra volta vi ho fatto l’esempio: se io sono in ferramenta sarà più
probabile che io trovi un trapano e una brucola; ma se sono in una armeria sarà più facile che io
trovi una pistola, mentre se sono dal parrucchiere sarà più facile trovare un asciugacapelli.
Ovviamente questo non ha nulla di percettivo!
La relazione di queste inferenze con la percezione è un qualcosa che ha a che vedere con la
conoscenza del luogo dove mi trovo e quindi quali alternative sono possibili per gli oggetti che
ho davanti a me.
Quindi questo Modello di Bar è utile perché permette di mettere assieme un po’ di cose diverse:
-il contesto -chiamato- “allargato” legato alle attività, che agisce attraverso la creazione di
alternative diverse tra loro
-e il contesto -chiamato- “percettivo” che si crea tra :
 aspetti grossolani/globali/basse frequenze spaziali di un’immagine,
 e aspetti locali ossia dettagli fini, cose piccoline

Tornando al ns caso giuridico ossia il caso della persona che aveva sparato a una tenda pensando
di avere di fronte un orso, e uccidendo in tal caso una persona, beh, il nostro modello potrebbe
essere proprio un modello di questo tipo: la tenda non era una tenda ben visibile, anzi era anche
meno visibile di così, perché io qui ve l’ho messa sfuocata ma in visione diurna; in realtà avrei
dovuto farvela in visione notturna e in visione notturna sarebbe solamente la visione di “un
qualcosa” là davanti.
Però attenzione! So che non sono in casa mia, in luogo sicuro, ma so che sono nel bosco in
campeggio e so che vicino a me ci possono essere delle tende ma anche degli orsi! E so anche che
l’orso è un animale aggressivo, quindi per me è molto importante rilevare la presenza di un orso
 ed è proprio questo che porta a spingere la rappresentazione di quello che ho davanti verso
-non quello che necessariamente ha la miglior verosomiglianza , perché ce l’avranno avuta molto
bassa tutti e due- ma verso quello che ha la rilevanza massimale maggiore. Nel dubbio, sparo.
(così ha ragionato la persona).
E nel caso di Bar abbiamo la stessa cosa:
2 ipotesi a livello di presa di decisione, di cui 1 è + forte dell’altra.  e tra l’ipotesi forte e
l’ipotesi debole, vince quella forte.
Quindi nel caso descritto il sistema ha usato informazioni precedenti la comparsa dell’oggetto,
e queste informazioni sono: nella zona ci sono orsi in libertà, e l’orso è un’animale pericoloso 
queste informazioni hanno determinato una maggiore rilevanza dell’interpretazione “orso”
rispetto all’ interpretazione “tenda”.
Ora vi è chiaro cosa può portare la percezione verso una interpretazione piuttosto che l’altra: la
rilevanza emozionale.
Ad es. quando siamo in una strada buia di notte si tende a scambiare dei suoni di per sé del tutto
innocui, con suoni potenzialmente minacciosi. Il suono è sempre lo stesso ma quello che cambia è
il contesto emozionale.
Questo che vi mostro adesso è un classico effetto del contesto: se state leggendo queste lettere
dall’alto verso il basso leggete A B e C mentre se leggete da sx verso dx le leggete dodici tredici
quattordici: il simbolo che c’è in mezzo è sempre lo stesso! Solo che in un caso lo leggete come
una B e nell’altro caso lo leggete come tredici. In entrambi i casi non serve fare nessuno sforzo
perché risulta come una delle possibili varietà di B che potete osservare oppure può essere uno
dei possibili tipi di tredici che potete osservare.
Il mondo esterno è molto spesso ambiguo (per tutte le ragioni di cui abbiamo parlato nella prima
parte in cui abbiamo parlato di “sensazione”) e le ns conoscenze/esperienze precedenti ci
portano a interpretare in maniera erronea gli stimoli ambigui che ho davanti a me.
16
Quindi nei casi in cui la mia percezione di stimoli ambigui nel mondo esterno è guidata da
conoscenze precedenti (memoria) mi porta a interpretare in maniera errata ciò che ho davanti.

Se voi guardate questa slide che vi mostro, chi già lo conosce non mi scrive, invece chi non la
conosce cosa vede? Alcuni di voi vedono un coccodrillo, un bosco ecc. Invece la cosa più
importante è che c’è un cane.
Adesso che vi ho detto che c’è un cane alcuni di voi riusciranno a vederlo. Per gli altri che non
riescono a vederlo vi dico che questo è un dalmata visto da dietro e piegato con la testa verso il
basso: si vedono le 2 zampe dietro, il sedere, la zampa anteriore sx e la testa piegata verso il basso
con un orecchio verso il lato. La parte nera al centro dell’ immagine è la testa vista dal lato sx e dal
dietro. Tutto quello che si vede nella parte più alta è il fianco sx dell’animale. Ora tutti voi vedete
che c’è un cane!
Ma c’è un problema, ossia il fatto che questa è esattamente la stessa slide che vi avevo fatto
vedere prima, eppure prima alcuni di voi vedevano un coccodrillo un bosco ecc.
Quindi com’è che dopo aver visto questa roba qui il cane diventa + visibile?
Diventa + visibile perché l’interpretazione di uno stimolo ambiguo (ambiguo così come lo era quel
volto/figura di donna che vi avevo fatto vedere prima) può assumere un senso o -in questo caso-
un senso diverso a seconda delle mie memorie precedenti, cioè della mia storia/di quello che ho
visto prima.

Quindi nelle 2 lezioni di oggi ho voluto sottolinearvi non solo il ruolo delle caratteristiche
strutturali degli oggetti nel fare delle inferenze e comprendere il significato degli oggetti, ma ho
voluto anche introdurre il ruolo del contesto. Non è semplicemente un’elaborazione bottom up di
quello che ho davanti, cioè non è un’elaborazione completamente obbligatoria di quello che
osservo, MA è soprattutto un’elaborazione attiva guidata dalle mie memorie, dalle mie
aspettative e dal contesto in cui mi trovo.
Ed è soprattutto in questo senso qui che la percezione deve essere vista come un fenomeno attivo
e non come una “fotografia”!
 E’ sempre sbagliato descrivere il funzionamento cognitivo come un qualcosa di “statico”!
ad es è sbagliato ritenere che la memoria sono delle fotografie; no! La memoria non sono
delle fotografie per il semplice fatto che neanche la percezione è una fotografia! Noi non
abbiamo proprio niente che riproduca in maniera “fedele” il mondo circostante!!
Il ns sistema percettivo ha una percezione estremamente distorta del mondo circostante (per
tutte le ragioni dette nella lezione sulla sensazione) e tutto quello che poi fa, in modo attivo,
–“attivo” sì ma permeabile agli scopi del sistema- serve a dare un senso a quello che si trova
intorno.

Ma tutti gli oggetti sono elaborati in modo simile?


Cioè il mio sistema visivo funziona nello stesso modo sia quando guardo una mela, sia quando
guardo una gatta, sia quando io guardo la MIA gatta? In un certo senso sì perché tutti questi
oggetti devono comunque passare nella mia retina: o passano nella retina o io non ho idea di
che cosa ho davanti. Tuttavia alcuni stimoli -da un certo punto di elaborazione in poi- hanno
un percorso diverso dagli altri, ossia sono elaborati in aree corticali dedicate, come per
esempio i volti (nell’area FFA),o anche alcune parti del corpo, o i luoghi, mentre tutto il resto
degli stimoli ossia tutto quello che non rientra in queste categorie “privilegiate” per motivi
biologici ed evoluzionistici viene elaborato in maniera simile.
Per motivi biologici/evoluzionistici: io devo muovermi nel mondo, devo riuscire a percepire
bene i segnali che gli altri mi danno attraverso i volti, e devo anche riuscire a comprendere
17
bene i movimenti di parti del corpo, quindi in questi casi è giustificato dal punto di vista
evoluzionistico il fatto di avere delle aree corticali dedicate cioè specializzate per alcuni tipi
di stimoli, mentre tutto quello che non rientra in queste categorie “privilegiate”, viene
elaborato in maniera simile

E ora parliamo di queste categorie privilegiate, e in particolare dei VOLTI.


Oramai si sa per certo che i VOLTI abbiano delle caratteristiche speciali, invece su alcune di
queste categorie privilegiate c’è ancora un po’di dibattito. Quindi quello che io voglio fare
adesso è riportarvi una parte di questo dibattito. E parto da uno degli effetti più solidi -nel
campo della psicologia generale della percezione- che è
l’ EFFETTO DI INVERSIONE DEI VOLTI, che funziona così:
Qui vi presento 2 facce : una faccia “normale” (questa ragazza) e la stessa faccia “invertita”.
Su questo effetto ci sono molte illusioni e sul libro mi pare ci sia con Tony Blair; la prima forse
era stata fatta con la ministra Thatcher; ce ne sono molte.
A me quello che ora interessa fare è riprendere questo EFFETTO, perché al di là di ingannare o
non ingannare, sta di fatto che non è facilissimo e non è poi così ovvio vedere che gli occhi
sono “girati”. Voi lo avevate già visto e ormai non vi ingannate più, ma per una persona che
non l’ha mai visto non è così ovvio.
Se io ad es. vi presento 2 sedie, uno guarda e rapidamente vede che la sedia a sx ha il bracciolo
tagliato.
Domanda di un ragazzo: io continuo a non vedere la differenza nell’immagine ribaltata.
Prof: c’è il fatto che l’immagine ribaltata ha gli occhi girati. Se guardate l ‘immagine a testa in
giù è la stessa cosa che vi avevo messo qui (?) così.
Ed è più difficile da vedere nei VOLTI, che non negli oggetti.
Nell’oggetto se io vi dico che c’è qualcosa di strano nel bracciolo a sx, voi lo vedete! Cioè
vedete che c’è qualcosa di strano nel bracciolo a sx .
Questo fenomeno -ovviamente sempre un oggetto rispetto a un altro- è meno evidente nel
caso di altri stimoli: ad es. case e mobili . Infatti se io vado a vedere l’accuratezza -in questo
compito di discriminare quando hanno qualcosa di strano o quando non hanno qualcosa di
strano- le persone sono molto più accurate per gli altri oggetti che non per i volti.
Per i volti infatti misteriosamente diventiamo meno in grado di discriminare queste 59:06.
Quindi questo è un 1° effetto che ci racconta che per i volti succede un qualcosa che non
succede per gli altri oggetti: nella struttura di un volto c’è un qualcosa che riesce a
compensare per delle differenze più “locali” : il fatto che il volto sia organizzato con 2 occhi 1
naso 1 bocca, c’è un qualcosa che riesce a essere informativo rispetto a quel volto, ad es.
riesce a dirci che è il volto della stessa ragazza, in tutte e due le versioni, solo che in una delle
due l’immagine è rovesciata. E questo è possibile anche se ci sono delle piccole differenze: a
livello sensoriale sono diversi !--> Il punto è che il ns sistema percettivo sembra trattare i
VOLTI in maniera diversa rispetto agli altri oggetti.

L’altra questione legata alla percezione dei VOLTI è l’area FFA (area fusiforme facciale) la
quale è attivata durante la presentazione e il riconoscimento dei volti.
A noi quest’area ci interessa perché l’attività della FFA è modulata dalle trasformazioni
percettive (rovesciamento o deformazioni) che influenzano il riconoscimento dei VOLTI.
Questo vuol dire che man mano che un volto viene reso meno visibile – per es. andate a
scomporlo, come in un puzzle,  l’attività della FFA va a calare quindi l’attività non è
legata solo al fatto che c’è un volto, ma anche al fatto che quel volto sia più o meno visibile.
L’attività della FFA diventa maggiore o minore in base al grado di riconoscimento del volto
18
E secondo Nancy Kanwisher negli individui l’elaborazione dei volti è una specializzazione
innata, ossia noi nasciamo con un “modulo”, che abbiamo acquisito durante l’evoluzione,
che serve per analizzare i volti umani, proprio perché i VOLTI sono degli stimoli socialmente
rilevanti: è importante riconoscere l’espressione nei volti degli altri! Per adeguare i ns
comportamenti alla situazione.
Noi utilizziamo continuamente questo modulo quando comunichiamo con le altre persone,
proprio per avere un feedback.
Quindi il punto centrale della Nancy Kanwisher è che ci sia un modulo innato specializzato per
i VOLTI.
Ma esiste anche un’altra ipotesi, che sostiene che è l’elevatissima familiarità con i VOLTI a
determinare la facilitazione dell’elaborazione di questi stimoli, e non la presenza di un
“modulo innato”. Secondo questa ipotesi non c’è un modulo presente già alla nascita, bensì è
un modulo che la persona si crea con l’esperienza o meglio col fatto che dalla mattina alla sera
la persona è in continuo contatto con i volti di altri individui.
Come si fa a testare queste ipotesi?
Questa ipotesi collega l’attività dell’area FFA -che è un’area all’interno delle aree visive-
all’apprendimento e precisamente a una dimensione dell’apprendimento, che è la familiarità.

E’ possibile testare questa ipotesi?


Isabel Gauthier in molti studi ha testato l’ipotesi che la FFA sia modulata dall’apprendimento
per stimoli che non sono “ volti”.
Quindi lei voleva dimostrare che stimoli che non sono volti -che non sono riconosciuti come volti
e quindi non avrebbero dovuto elicitare un’attività nella FFA- man mano che diventano più
familiari, incrementano l’attività di FFA; questo sarebbe stato il pattern che si aspettava la
Gauthier.
Quindi vediamo cosa ha fatto:
Vi ho premesso che stiamo testando l’area FFA un’area all’interno delle aree visive.
Nelle prossime 4 slide c’è il ragionamento della Gauthier, che vuole collegare l’attività
dell’area FFA con l’apprendimento. (con la familiarità)
Quindi lei vuole andare a testare l’attività dell’area FFA che si trova all’interno della corteccia
visiva; ed è un’area che non si occupa di caratteristiche semplici -come possono essere
l’orientamento o il contrasto come avviene in V1- bensì di caratteristiche più complesse,
quindi la Gauthier crea degli stimoli che NON sono volti -i greebles-ma che in realtà non sono
neanche tanto dissimili dai volti, in modo da attivare delle aree che siano più o meno
coerenti con quelle attivate da un volto.
Ripeto:
Siccome la Gauthier vuole indagare un’area visiva che analizza i VOLTI, ha creato degli stimoli
che non sono volti ma grossomodo ci assomigliano. E Gauthier crea questi personaggi, che
chiama GREEBLES, che sono delle creaturine generate al computer, che sono come noi ossia
variano in genere, famiglia, identità.
Quindi ci sono i greebles di un genere e greebles di un altro genere, e ognuno ha la sua
identità.

Quindi abbiamo 2 componenti:


-la 1° è quella visiva e l’abbiamo risolta con uno stimolo che grossomodo potrebbe avere delle
caratteristiche simili a un volto (o non essere così dissimile).
-la 2° è quella dell’ apprendimento. Con l’apprendimento cosa voglio fare? Voglio prendere
delle persone che all’inizio li vede tutti uguali -qui ce ne sono solo 2 ma voi immaginatevi tutta
19
una varietà di greebles- e io vi chiedo di distinguerli per sesso: ci sono 2 sessi, il glob e il glip. Io
vi faccio fare tutto un training per distinguere i 2 generi. Ora se io vi faccio vedere il glob della
famiglia Osmit , voi mi dovete dire che quello lì è glob.
Quindi vi faccio tutto un training con tutti quegli stimoli lì -ovviamente ci sono alcune
caratteristiche che rimangono stabili, tipo ad es. il fatto che dietro hanno le orecchie verso
l’alto- e ci sono delle caratteristiche che permettono di disambiguare una famiglia dall’altra, un
sesso dall’ altro, una identità dall’altra.
Nel riquadro vedete 2 greebles che sono dello stesso sesso, della stessa famiglia, ma variano di
identità infatti uno ha un nome e l’altra ha un altro nome. E anche i nomi vedete che sono
delle parole senza senso.

Quindi cosa faceva la Gauthier ?


Attraverso dei trening molto lunghi facevano imparare alle persone a distinguere i vari
greebles; quindi facevano diventare le persone degli esperti di greebles. Voi capite che se le
persone prima non erano esperte di greebles e poi diventano esperte di greebles, vuol dire che
nel frattempo qualcosa dev’essere cambiato, e ovviamente sarà cambiato qualcosa anche
nelle aree cerebrali coinvolte nell’analisi dello stimolo che hanno di fronte.
E qui arriviamo al cuore della domanda di Isabel Gauthier, infatti lei dice:
-Se la FFA è dedicata ai volti e solo ai volti, io posso presentare anche un miliardo di greebles
ma poiché non sono volti, la FFA non presenterà mai un effetto apprendimento!--> Perché è
legata ai volti e non all’apprendimento!!!!
-Se invece la FFA è un’area la cui attività è legata a degli stimoli che hanno grossomodo
l’aspetto dei greebles (più o meno una protuberanza sul davanti, 2 cose a lato, e delle cose
attorno alla protuberanza che abitualmente chiamiamo occhi) allora nel momento in cui io
faccio diventare le persone esperte di questi stimoli qui (i greebles)  dovrò per forza di cose
osservare un effetto apprendimento!
Invece L’“Effetto apprendimento” non è previsto nell’ipotesi del “modulo innato” specializzato
per i volti.
Cosa trova Isabel Gauthier? Trova che:
-prima del treining- trova che l’area FFA risponde molto ai volti e pochissimo ai greebles. 
-dopo il treining trova che non c’è differenza tra volti e greebles .
Questo dimostra che il treining ha avuto 2 effetti:
- Ha aumentato la risposta ai greebles
- Ha ridotto la risposta ai volti
E questo ha dimostrato che l’attività dell’area FFA sicuramente è legata ad oggetti che hanno
una forma grossomodo vicina a quella di un volto (tenete presente che anche se si tratta di
stimoli complessi stiamo pur sempre parlando di aree visive).
Inoltre è stato anche dimostrato che l’area FFA non è blindata per alcuni stimoli
predeterminati e fissati lì dentro dall’evoluzione, ma è possibile dimostrare che l’attività
dell’area FFA aumenta in seguito all’apprendimento, per altre categorie di stimoli: per es. i
greebles.
Quindi la possibilità è che l’area FFA ha sicuramente a che vedere con i volti che noi
osserviamo, ma si è legata all’altissima familiarità che abbiamo con i volti.
Questo articolo è del 1999 e tuttora si sta sperimentando su questo punto, proprio perché è un
punto molto caldo. Una delle possibilità è che:
dividendo le persone in 2 gruppi ossia le persone che vedono i greebles come volti e le persone
che non lo fanno, -> quelle che mostrano l’incremento di attività della FFA dovrebbero essere
quelle persone che assimilano i greebles ai volti, secondo l’ipotesi di Isabel Gauthier.
20
In realtà i dati sono un po’ nel mezzo, quindi i dati non sono poi così conclusivi, per cui
anche sulla FFA è in corso un certo dibattito su quale sia il ruolo di 1 fattore specifico che è la
familiarità, l’apprendimento;
Quindi è ampiamente possibile che anche l’attività dell’area FFA sia legata -almeno in parte-
a un apprendimento che viene dall’ambiente e dal fatto che siamo esposti continuamente
alla visione di volti di persone.

Passiamo ora alla PROSOPOAGNOSIA


La prosopoagnosia è la condizione delle persone che possono descrivere percettivamente un
volto, ma potrebbero non essere in grado di dire che cosa sia o a chi appartenga. La persona
quindi non ha nessun problema sensoriale ma non riesce ad associare un significato al volto.
Vi faccio notare che qui adesso stiamo parlando di dati che ci raccontano che i volti hanno
qualcosa di “speciale” rispetto agli altri stimoli. Quindi di “speciale” potrebbe anche essere che
alcune persone hanno un danno selettivo ossia hanno un danno solo per quanto riguarda la
capacità di associare un significato a un volto.
Sicuramente avrete già parlato della prosopoagnosia per cui non ci ritorno e vi faccio vedere
solo questi 3 esempi -che oltre a raccontarci il fatto che alcune persone non sono in grado di
riconoscere i volti- ci fanno capire le conseguenze che ciò ha sulla vita di queste persone.
La 1° è una persona con prosopoagnosia fin da quando era piccola e andava a scuola: il
problema principale era farsi degli amici, e questo era un problema perché per lei tutte le
persone erano uguali. Allora l’unico modo per farsi degli amici era acquisire familiarità con le
persone che avevano delle caratteristiche che le rendevano molto diverse dagli altri : la ragazza
con i capelli rossi, o lo spilungone ecc. ecc, insomma caratteristiche che dal punto di vista
percettivo si riesce a riconoscere facilmente e che non richiede l’analisi del volto.
Il 2° caso è una persona con prosopoagnosia acquisita dopo che aveva già intrapreso la sua
attività di medico e per il medico non riconoscere il volto dei pazienti è un grande problema.
La soluzione che trova questo medico è di essere “aperta” verso i pazienti cioè spiegare a tutti i
pazienti che cosa le era successo, e prima di fare qualunque azione o comunicazione
controllare sempre 3 volte con chi stava parlando.
Il 3° caso ci fa capire le conseguenze nella vita di tutti i giorni: ovviamente non ha senso
guardare un film, o un dibattito televisivo se tutte le persone appaiono le stesse in quanto
tutte hanno la stessa faccia!

Passo ora a darvi questo dato:


sembra che i bambini fin dalle prime ore di vita mostrino maggior attenzione -intesa come
tempo di osservazione- per i volti, rispetto ad altri stimoli.
La percezione visiva dei bambini nelle prime ore di vita è estremamente limitata, tuttavia è
stato riportato che il tempo di osservazione per un volto di questo tipo è maggiore rispetto a
un volto scomposto in cui gli elementi sono i medesimi ma sono disposti in maniera diversa.
Quindi questo è l’altro dato che viene spesso riportato “a favore” della specializzazione della
FFA nell’elaborazione di volti, rispetto ad altri stimoli.

Quindi nel loro complesso questi dati ci dicono che i volti sono sicuramente lo stimolo con cui
abbiamo a che fare più spesso nella ns vita.
Una volta diventati adulti esistono dei meccanismi che ci permettono di operare in maniera
ottimale su questi stimoli.
A tutt’oggi c’è dibattito su quando iniziano a svilupparsi nel bambino ovvero quando inizia
questa specializzazione.
21
Ma una volta che abbiamo acquisito questa eccezionale capacità di elaborare i volti, questo ci
permette di analizzarli in maniera diversa rispetto ad altri stimoli (come è evidente nel 1°
esempio che vi ho fatto, quello del 1:29:47……...- un esempio molto interessante perché ci
racconta che nella struttura di un volto c’è un qualcosa che lo rende IMMUNE DA UNA
DEGRADAZIONE che invece colpirebbe degli altri oggetti (case, mobili ecc)

Domani faremo l’ultima parte sulle COSTANZE dopodichè dichiaro chiuso l’argomento
PERCEZIONE.

22