Sei sulla pagina 1di 13

Pietro Spataro - L’Apprendimento: Il condizionamento operante

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

1 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

Indice

1. THORNDIKE E LA LEGGE DELL’EFFETTO ................................................................................................... 3


2. LA GABBIA DI SKINNER ........................................................................................................................... 6
3. I PRINCIPI DEL RINFORZO ........................................................................................................................ 9
BIBLIOGRAFIA ................................................................................................................................................. 13

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

2 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

1. Thorndike e la legge dell’effetto

Gli animali e gli esseri umani non si limitano a reagire agli stimoli esterni: essi si impegnano

attivamente in azioni finalizzate ad ottenere determinati stimoli o cambiamenti ambientali (il cane

gratta alla porta per farsi aprire; noi premiamo un interruttore per accendere la luce in una stanza).

Queste azioni sono definite risposte operanti, in quanto operano sul mondo in modo da produrre

particolari effetti, oppure risposte strumentali, poiché fungono da strumenti per ottenere un

particolare cambiamento. Il processo attraverso il quale uomini e animali apprendono a produrre

tali risposte è detto condizionamento operante (o, talvolta, condizionamento strumentale). Esso

può essere definito come un processo di apprendimento mediante il quale gli effetti

(conseguenze) di una risposta influenzano la probabilità che essa sia prodotta di nuovo in futuro.

Figura 1. La gabbia-problema di Thorndike e tempo necessario per uscire in funzione del numero di prove

I primi studi sul condizionamento operante furono pubblicati da Thorndike (1898), il quale

utilizzava una procedura molto diversa da quella di Pavlov. Egli si serviva di una particolare

apparecchiatura nota come gabbia-problema (puzzle box): si trattava di una piccola gabbia che

l’animale poteva aprire dall’interno sollevando un gancio o premendo una leva (si veda la Figura

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

3 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

1). Nei suoi esperimenti, Thorndike introduceva dei gatti affamati (uno per volta) dentro la gabbia,

con il cibo bene in vista all’esterno. Non appena rinchiusi nella gabbia, i gatti eseguivano molte

azioni diverse nel tentativo di uscire (graffiare le sbarre o fare pressione contro il coperchio), finché,

casualmente, riuscivano a sollevare il gancio o a premere la leva che apriva la porta e gli

permetteva di raggiungere il cibo. Ripetendo questa procedura molte volte, lo studioso notò che,

in media, il tempo necessario per compiere l’azione appropriata e uscire dalla gabbia diminuiva in

maniera costante, finché i gatti erano in grado di far scattare il gancio (o la leva) subito dopo

essere stati rinchiusi dentro la gabbia (si veda la Figura 1).

Figura 2. Meccanismi alla base della legge dell’effetto

Basandosi sui risultati degli esperimenti effettuati con la gabbia-problema, Thorndike formulò

la cosiddetta legge dell’effetto, la quale assume che le risposte che in una particolare situazione

producono un effetto soddisfacente acquistano maggiori probabilità di essere prodotte in futuro

nella stessa situazione, mentre le risposte che producono effetti insoddisfacenti hanno minori

probabilità di essere prodotte di nuovo nella stessa situazione. Negli studi di Thorndike, la situazione

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

4 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

presumibilmente consisteva nell’insieme di immagini, suoni e odori esperiti dall’animale quando

veniva rinchiuso nella gabbia: all’inizio tali stimoli evocavano molte risposte diverse (ad esempio,

grattare contro le sbarre della gabbia), una sola delle quali era in grado di aprire la gabbia;

tuttavia, una volta aperta la gabbia, l’effetto soddisfacente prodotto dall’accesso al cibo

rafforzava la risposta corretta, per cui le probabilità che il gatto, trovandosi nella stessa situazione,

producesse la stessa risposta aumentavano rapidamente gabbia (si veda la Figura 3 per uno

schema).

Figura 2. Meccanismi alla base della legge dell’effetto

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

5 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

2. La gabbia di Skinner

Lo studioso che più di tutti ha contribuito ad approfondire e a divulgare i principi del

condizionamento operante è stato Burrhus Skinner (1904-1990). Intorno al 1930, egli ideò

un’apparecchiatura che ben presto divenne nota come ‘gabbia di Skinner’: essa consisteva in

una gabbia contenente una leva su cui l’animale poteva agire in modo da ricevere un pezzetto di

cibo. Rispetto alla gabbia-problema di Thorndike, i vantaggi ottenuti con questo semplice metodo

erano notevoli:

• in primo luogo, dopo aver risposto la prima volta, l’animale rimaneva chiuso nella gabbia e

poteva quindi continuare a fornire altre risposte (al contrario, utilizzando la gabbia-

problema, l’animale doveva essere costantemente riposizionato all’interno della gabbia);

• in secondo luogo, poiché la quantità di cibo dispensata ad ogni risposta era piccola, un

animale affamato doveva produrre molte risposte prima di saziarsi;

• in terzo luogo, le risposte potevano essere registrate attraverso dispositivi automatici e il

processo di apprendimento poteva essere descritto in termini di variazione nella frequenza

di risposta (si veda la Figura 3).

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

6 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

Figura 3. Tipica curva di frequenza delle risposte di un gatto che apprende a premere la leva in una gabbia di Skinner

Skinner non si limitò soltanto a creare un’apparecchiatura più efficiente per lo studio

dell’apprendimento negli animali, ma coniò anche una nuova terminologia. Secondo questo

studioso:

• il termine risposta operante indica qualunque atto comportamentale in grado di produrre

un effetto sull’ambiente;

• il termine condizionamento operante indica il processo attraverso il quale l’effetto di una

risposta operante modifica la probabilità che essa sia nuovamente prodotta in futuro;

• inoltre, il termine rinforzo si riferisce al cambiamento dello stimolo che è prodotto dalla

risposta operante e che fa aumentare la frequenza della risposta stessa.

Così, in un tipico esperimento con la gabbia di Skinner si ha che: a) la pressione della leva è

la risposta operante; b) l’aumento della frequenza con cui la risposta viene prodotta è un esempio

di condizionamento operante; c) il rilascio di un pezzetto di cibo costituisce un rinforzo.

Analogamente, in un esperimento con la gabbia-problema (Throndike), l’azione di sollevare il

gancio corrisponde alla risposta operante, l’aumento della rapidità con cui l’animale esegue la

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

7 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

risposta a ogni nuova prova è un esempio di condizionamento operante, e l’uscita dalla gabbia e

l’accesso al cibo rappresentano i rinforzi.

Secondo Skinner, alcuni stimoli, come il cibo per un animale affamato o l’acqua per un

animale assetato, rappresentano rinforzi naturali. D’altra parte, negli esseri umani, determinati

stimoli possono acquisire il valore di rinforzo anche in seguito ad un precedente apprendimento:

Skinner chiamò utilizzò il termine ‘rinforzi condizionati’ per riferirsi a questo secondo tipo di rinforzi. Un

esempio classico è il denaro: una volta compreso ciò che è possibile comprare con il denaro, la

maggior parte degli esseri umani apprende a comportarsi in modo da guadagnarne il più

possibile.

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

8 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

3. I principi del rinforzo

Skinner e i suoi collaboratori hanno studiato molti fenomeni legati al condizionamento

operante. In primo luogo, nella gabbia di Skinner, il rinforzo viene emesso soltanto dopo una

risposta corretta. Tuttavia, in alcuni casi, il ratto messo in una gabbia di Skinner non preme mai la

leva, o un gatto rinchiuso in una gabbia-problema non riesce mai ad alzare il chiavistello. In questi

casi, il rinforzo non viene mai emesso e quindi la risposta corretta non può essere condizionata. Per

ovviare a questo problema, Skinner ideò una procedura nota come ‘tecnica del modellamento’

(o shaping), che consiste nel rinforzare ogni risposta che si avvicina a quella desiderata (ad

esempio, si potrebbe rinforzare il gatto ogni volta che si avvicina al lato della gabbia che contiene

la leva), finché quest’ultima viene prodotta e può essere rinforzata. In effetti, le persone che

addestrano animali (ad esempio, in un circo) si servono di questa tecnica per insegnare loro ad

eseguire particolari compiti.

Al pari del condizionamento classico, Skinner scoprì che, se non porta più a ottenere un

rinforzo, una risposta operante condizionata diminuisce di frequenza in maniera graduale, fino a

scomparire del tutto (i ratti cessano di premere la leva se non ricevono più cibo e le persone

smettono di sorridere a chi non contraccambia). Il mancato rinforzo di una risposta operante e il

conseguente declino nella sua frequenza sono indicati col termine ‘estinzione’. Anche in questo

caso, l’estinzione non è mai totale: il semplice passare del tempo può portare ad un recupero

spontaneo, e una singola risposta rinforzata può riportare la frequenza di risposta al livello

precedente all’estinzione.

All’inizio della procedura di condizionamento, è preferibile adottare uno schema di rinforzo

continuo, in cui la risposta operante è costantemente rinforzata. Tuttavia, in seguito è spesso

proficuo utilizzare uno schema di rinforzo parziale, in cui la risposta viene rinforzata solo alcune

volte. Skinner e colleghi hanno identificato quattro principali schemi di rinforzo parziale:

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

9 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

• Schemi a rapporto fisso: il rinforzo si verifica sempre dopo n risposte (dove ‘n’ è un numero

intero maggiore di 1); per esempio, in uno schema a rapporto fisso 5, il rinforzo viene

sempre fornito in corrispondenza della quinta risposta, dopo quattro risposte non rinforzate.

• Schema a rapporto variabile: il numero di risposte necessarie ad ottenere il rinforzo varia in

modo tale che la media sia pari a n; per esempio, in uno schema a rapporto variabile 5, il

rinforzo può essere fornito dopo 7 risposte non rinforzate e successivamente dopo 3 risposte

non rinforzata (la media di 7 e 3 è pari a 5).

• Schema a intervallo fisso: tra due risposte rinforzate successive deve passare un intervallo di

tempo fisso; ad esempio, in uno schema a intervallo fisso di 30 secondi, viene rinforzata una

risposta emessa dopo almeno 30 secondi di distanza dall’ultima risposta.

• Schema a intervallo variabile: il tempo che deve trascorrere tra due risposte rinforzate

successive varia in modo che la media sia pari a n; ad esempio, in uno schema a intervallo

variabile di 30 secondi, la risposta può essere rinforzata dopo 10 secondi e poi dopo 50

secondi di distanza dalla risposta precedente, in modo che la media sia pari a 30.

Un vantaggio connesso all’uso di schemi di rinforzo parziale è dato dal fatto che essi

rendono la risposta condizionata molto resistente all’estinzione. Infatti, ratti che passano da uno

schema a rapporto continuo ad uno schema a rapporto parziale in cui i rinforzi sono sempre più

rari fino ad annullarsi del tutto, spesso producono centinaia di risposte non rinforzate prima di

smettere di rispondere. Secondo Skinner (1953), questo fenomeno aiuta a spiegare perché i

giocatori d’azzardo continuano a scommettere anche quando non vincono da parecchio tempo:

essi sono vittime degli schemi ad intervalli variabili che caratterizzano praticamente tutte le slot

machine e in cui le vincite ricorrono ad intervalli variabili. Secondo questa interpretazione

cognitiva, i giocatori d’azzardo continuano a giocare perché hanno appreso che la prossima

scommessa potrebbe essere quella che li farà vincere.

Come accennato pocanzi, nella terminologia adottata da Skinner, un ‘rinforzo’ è qualsiasi

processo che aumenta la probabilità che una certa risposta venga emessa: esso può essere

positivo o negativo. Un rinforzo positivo si ha quando l’arrivo di uno stimolo gradito (ad esempio il

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

10 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

cibo, il denaro, o dei complimenti) in seguito ad una risposta aumenta la probabilità di produrre la

stessa risposta in futuro. D’altra parte, un rinforzo negativo si ha quando la rimozione di uno stimolo

spiacevole in seguito ad una risposta rende la risposta stessa più probabile in futuro. Tipici rinforzi

negativi sono le scosse elettriche, le compagnie sgradevoli, i rimproveri, i rumori forti, e qualsiasi

altra cosa che un organismo cerchi attivamente di evitare.

Figura 4. Significato di rinforzo positivo, rinforzo negativo, punizione positiva e punizione negativa

Utilizzando la stessa terminologia, una ‘punizione’ può essere considerata come un

processo opposto al rinforzo, in cui le conseguenze di una risposta fanno diminuire (anziché

aumentare) la probabilità di emettere la stessa risposta in futuro. Anche la punizione può essere

positiva o negativa. Una punizione positiva si ha quando l’arrivo di uno stimolo sgradito (una scossa

elettrica per un ratto o un rimprovero per una persona) diminuisce la frequenza di risposta; al

contrario, una punizione negativa si ha quando la rimozione di uno stimolo gradito (la sottrazione di

cibo ad un ratto affamato o di denaro ad una persona) fa diminuire la frequenza di risposta (si

veda la Figura 4 per un riassunto).

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

11 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

È importante notare che uno stesso stimolo può agire sia da rinforzo che da punizione: ad

esempio, un genitore che rimprovera il figlio assume che il bambino consideri il rimprovero come

una punizione; tuttavia, esso potrebbe rappresentare anche un rinforzo per il bambino, se il suo

scopo era quello di attirare l’attenzione su di sé.

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

12 di 13
Pietro Spataro - L’Apprendimento: Il condizionamento operante

Bibliografia

• Schacter, D. L., Gilbert, D. T., & Wegner, D. M. (2014). Psicologia generale.

Bologna: Zanichelli.

• Gray, P. (2012). Psicologia. Bologna: Zanichelli.

Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).

13 di 13

Potrebbero piacerti anche