Sei sulla pagina 1di 5

Color associations in abstract semantic domains di Douglas Guilbeault (2020)

PRESENTAZIONE PAPER DI MARTINA MARIA PONTURO


L’articolo lega i principi della embodied cognition al Natural Language Processing
(NLP) e alla Computer Vision. Il paper è fortemente intriso degli studi di Lakoff, in
particolare dal libro “Da dove viene la matematica” pubblicato con il collega Nunez.
Secondo i due autori, qualsiasi produzione dell’essere umano deriva dal suo essere
“corpo immerso in un ambiente”. La capacità astrattiva deriva quindi dall’esperienza
quotidiana di tipo relazionale e dalle capacità biologiche del suo corpo immerso nel
mondo, tra cui in particolare del cervello. Il linguaggio è una qualità e una capacità
emergente dell’essere umano; ha origine biologica e dipende dall’accoppiamento
mente-mondo.
Lakoff e Nunez definiscono la metafora come un processo centrale del pensiero
quotidiano e non un mero abbellimento: essa è lo strumento basilare che rende
possibile il pensiero astratto. Uno dei principali risultati della scienza cognitiva è che
i concetti astratti sono compresi tipicamente in termini di concetti più concreti
attraverso le metafore. Questo fenomeno è studiato scientificamente da più di due
decenni. Uno dei risultati principali è che le mappe metaforiche non sono arbitrarie
ma sistematiche. Le metafore concettuali sono usate inconsciamente, senza sforzo e
automaticamente nel dialogo quotidiano: sono parte dell’inconscio cognitivo. Molte
di esse sorgono spontaneamente dalle correlazioni nella nostra esperienza comune,
soprattutto nella nostra esperienza di bambini. Le metafore si strutturano all’interno
di mappe concettuali metaforiche formate da domini sorgente e domini obiettivo,
collegati fra loro da una struttura inferenziale, che consente di connettere a una
sorgente concreta (ad esempio uno spazio fisico) un obiettivo astratto (per esempio
uno stato d’animo). Così succede nella metafora concettuale “Gli stati d’animo sono
posizioni” come indicato ad esempio dall’espressione “Sono al limite della rabbia”,
dove il limite indica lo stato fisico e la rabbia indica lo stato d’animo.
Potremmo chiederci perché il colore in questi studi. Diciamo intanto che il colore è
sempre stato uno dei principali mezzi di comunicazione usati dall’uomo, anche nelle
metafore linguistiche. Infatti, è in grado di descrivere concetti tramite i vari livelli di
astrazione, compresi quelli che mancano di referenti visibili diretti. Un esempio
lampante è la strofa del mitico BB King: “I could play the blues and then not be blue
anymore”.
Gli approcci multimodali NLP hanno alcuni vantaggi:
 integrano testi e immagini;
 esulano dagli approcci canonici basati sul testo;
Color associations in abstract semantic domains | Douglas Guilbeault

 si avvalgono di modelli di semantica distribuzionale multimodale.


Le immagini possono derivare associazioni tra parole. Tuttavia, questi modelli non
sono progettati esplicitamente per rilevare l’informazione semantica rilevante per gli
esseri umani, perché operano in uno spazio RGB (red-green-blue) che non
rappresenta la percezione umana del colore. Guilbeault si serve invece di un
approccio automatizzato all’analisi multimodale, che rileva associazioni di parole in
base alle distribuzioni di colore delle immagini Google corrispondenti alle parole
target; sfrutta inoltre tecniche di NLP e computer vision. E, per la prima volta,
l’ipotesi viene testata in un dominio sensoriale specifico, appunto quello del colore.
L’indagine rileva se il colore venga usato per rappresentare concetti astratti, se sia
importante per associare concetti fra domini semantici differenti e se possa
codificare relazioni astratte fra concetti (di tipo gerarchico o di somiglianza
semantica).
Metodologie: dapprima sono state selezionate tre tassonomie (emozioni, generi
musicali e discipline)1 e in seguito i ricercatori hanno identificato i termini di ricerca
per ogni ambito recuperandone i vari iponimi dal database WordNet. All’interno di
questo database di lemmi inglesi, le parole sono raggruppate in Synset (“set di
sinonimi”) e raggruppano insiemi di sinonimi, che possono essere intesi con una sola
definizione proprio perché esprimono lo stesso senso. L’ontologia lessicale WordNet
è stata però affiancata da giudizi umani in crowdsourcing1, proprio per dimostrare
che questo raggruppamento non è arbitrario ma riflette gli assunti della embodied
cognition. I termini sono poi serviti per acquisire immagini dal portale di Google
Image e l’acquisizione di tutti gli iponimi di ciascuna tassonomia ha poi permesso il
computo dell’astrattezza di ogni parola in base al suo fattore di ramificazione,
ovvero il numero di sottoinsiemi indicizzati di una data parola nell’albero
tassonomico completo.
Vediamo nel dettaglio le tassonomie per discipline (lemma inglese) che restituisce 7
synset, ovvero 7 possibili significati. Gli autori hanno selezionato discipline n.01. che
include 20 termini di discipline accademiche, poi utilizzati come termini di ricerca di
Google Image. Per le emozioni gli autori hanno selezionato il synset feeling n.01.,
che rappresenta qualsiasi sensazione forte. Hanno scoperto però che molte parole
non rappresentavano sensazioni comuni, tra queste citiamo la parola “irascibile”:
hanno quindi dovuto scegliere parole coerenti con le teorie psicologiche comuni, in
modo da selezionare parole come paura, tristezza, odio, desiderio, passione. Per i
generi musicali è stato selezionato il synset music_genre.n.01, che riconosce generi
musicali espressivi. Hanno identificato solo i principali generi musicali, che
incapsulano quelli più riconosciuti; ne hanno poi aggiunto 4 (ambient, electronic…)

pag. 2
Color associations in abstract semantic domains | Douglas Guilbeault

affermatisi nell’ultimo decennio, ma non rilevati da WordNet, che è fermo con gli
aggiornamenti al 2005.
I ricercatori hanno raccolto i primi 100 risultati per ogni termine della ricerca di
Google Image tramite API Python (modellati dall’algoritmo PageRank, strumento
molto innovativo e che riesce integrare anche i dati di ricerca con cui gli utenti
interagiscono più frequentemente). Queste immagini sono state raccolte dallo
stesso indirizzo IP negli Stati Uniti nel 2019.
Si calcolano infine le distribuzioni cromatiche percettivamente uniformi per ciascun
termine e si compiono elaborate operazioni informatiche di compressione,
branding e conversione. Questo ha permesso di comparare la distribuzione del
colore tra i vari termini di ricerca.
I risultati: la variabilità del colore nelle immagini aumenta all’aumentare
dell’astrattezza delle parole di ricerca. In secondo luogo, una maggiore associazione
di colore fra i concetti astratti non ne vieta una coerenza: gli studiosi hanno invece
ritrovato un clustering non casuale, ma coerente con gli assunti dell’embodied
cognition.
Entriamo nel dettaglio dei clustering presi in esame. Le discipline accademiche si
distinguerebbero in due cluster: le materie umanistiche (storia, legge e
letteratura…) presenterebbero tonalità calde rossastre e bluastre, mentre le materie
scientifiche (chimica, fisica e matematica…) presenterebbero tonalità fredde
bluastre e grigiastre. Le emozioni si distinguerebbero invece in tre cluster: le
emozioni fra il nero e il rosso (per desiderio, odio e passione), emozioni rossastre e
giallastre più luminose (per felicità, gioia e amore) ed emozioni con toni scuri fra il
bluastro e il grigiastro (per paura, tristezza e vergogna). Infine, abbiamo due cluster
per i generi musicali: tonalità più calde (per country, folk, rock’n roll) e tonalità
bluastre più scure (per pop, techno, blues). La modularità dei cluster nelle tre
tassonomie è troppo grande per essere causale.
I ricercatori hanno notato che la coerenza semantica dei risulati di clustering è
corroborata da una correlazione altamente significativa fra la somiglianza di colore e
la similiarità semantica fra i termini di ricerca.
A quali conclusioni sono approdati gli studiosi? Lo studio ha confermato non solo
che i concetti astratti possono essere associati a colori nelle immagini online, ma che
queste stesse associazioni possono codificare relazioni originariamente viste come
simboliche e amodali, come la struttura gerarchica e la similarità. Inoltre, i risultati
forniscono prove a favore dell’E.C., suggerendo che anche le proprietà astratte
dell’architettura semantica possono partecipare in un’interfaccia multimodale con le
pag. 3
Color associations in abstract semantic domains | Douglas Guilbeault

informazioni sensoriali; coerentemente con quanto ci si aspettava, il core codifica sia


la mappatura metaforica sia le relazioni affettive contemporaneamente. Inoltre, si è
discussa l’abilità del metodo proposto nell’identificare la coerenza estetica del
linguaggio, che permette di identificare sia la dimensione logica che affettiva nei
campi semantici. I modelli di coerenza estetica sono evidenti nelle visualizzazioni t-
SNE di concetti astratti secondo le loro distribuzioni di colore. Le emozioni dal colore
più rossastro come amore e desiderio si legano a discipline qualitative
(“umanistiche”), mentre le tonalità più bluastre delle discipline quantitative non si
legano a nessuna emozione ma fanno cluster con termini indicanti la razionalità. Un
colore può quindi partizionare sottoclassi all’interno di campi semantici astratti
riflettendo il contrasto affettivo tra le sottoclassi. I concetti concreti hanno colori
mediati dalle proprietà intrinseche degli stessi oggetti, mentre l’associazioni tra
colori astratti dipende da relazioni affettive non-arbitrarie. Lo stesso vale per i
generi musicali. Generi come il punk-rock e il metal si avvicinano più ai colori di
emozioni come la paura, mentre un genere come il latino-americano si lega per
colori a emozioni come amore e desiderio.
Limiti e problematicità. Innanzitutto, per i ricercatori è stato difficile valutare le
implicazioni cognitive dei risultati poiché il colore si presta a dimensioni
interpretative. A complicare la mappatura di colore dei singoli termini di ricerca vi
sta il contesto (ad esempio un determinato numero di oggetti). In terzo luogo, non
tutti i file presentano origini digitali, poiché oltre alle immagini create digitalmente
vi sono anche fotografie e ibridi, che presentano maggiore granulosità nei colori.
Inoltre, vi è da considerare gli usi progettati del colore, che implicano l’uso del
colore come strumento stilistico ed estetico. La prevalenza di usi progettati del
colore nei risultati di Google Image suggerisce che i processi cognitivi coinvolti nella
costruzione di immagini online contibuiscono alle associazioni di clustering nei
colori. Sarà importante per la ricerca fornire un metodo adeguato a distinguere usi
concreti da usi progettati del colore. La fisica potrebbe integrare colori bluastri,
perché le sue immagini includono concetti blu come l’acqua, il cielo e il mare,
mentre la legge è associata a colori più marroni e rosso, perché nelle sue immagini
sono spesso presenti libri e scene di aule giudiziarie che implicano mobili di legno. La
scoperta che le distribuzioni dei colori delle parole astratte si raggruppano in modo
semanticamente coerente è guidata sia da differenze negli oggetti concreti associati
alle parole che da usi progettati del colore nella produzione di immagini online.
Anche i pregiudizi culturali influiscono nelle associazioni di colore, collegati alla
rappresentazione ed espressione di genere, soprattutto tra le discipline. Gli autori

pag. 4
Color associations in abstract semantic domains | Douglas Guilbeault

propongono l’applicazione di questo metodo per ricerche future incentrate su altre


culture, proprio per realizzare la coerenza estetica universale.

pag. 5

Potrebbero piacerti anche