Sei sulla pagina 1di 46

1

L’Apprendimento degli Animali

di Roger Abrantes

2
L’Apprendimento degli Animali

di Roger Abrantes

Tratto da

Animal Trainers Handbook


Edito da Roger Abrantes

Wakan Janka Publishers 2014

Copertina e layout di Roger Abrantes


Foto in copertina di Roger Abrantes
© 2014 Roger Abrantes

TUTTI I DIRITTI RISERVATI. Il contenuto di questo libro e’ protetto dalle Leggi e Trattati
Internazionali sul Copyright. E’ proibita qualsiasi ristampa non autorizzata o uso del presente
materiale. E’ vietata la riproduzione anche se parziale di questo libro, cosi come ne e’ vietata la
trasmissione in ogni forma o con qualsiasi mezzo, sia elettronico che meccanico, incluse la
fotocopiatura, la registrazione o anche la conservazione su qualsiasi mezzo di archiviazione e recupero
dati senza espressa autorizzazione scritta dell’autore/editore.

3
INDICE

Prefazione pag.

Capitolo 1 : L’apprendimento pag.

Capitolo 2: I Segnali pag.

Capitolo 3: Discriminazione, generalizzazione e controllo degli stimoli pag.

Capitolo 4: Incrementare e decrementare un comportamento pag.

Capitolo 5: Il programma dei rinforzi pag.

Capitolo 6: Procedure operanti avanzate pag.

Capitolo 7: Il Piano di Azione (POA) pag.

Bibliografia ed altre letture suggerite pag.

Links (in Inglese) pag.

Libri della serie pubblicati pag.

4
Prefazione
Questo opuscolo e’ tratto da un capitolo del mio libro “Animal Trainers Handbook” e potreste
trovare in esso sporadici riferimenti ad altri Capitoli o Sezioni dello stesso. Alcuni di questi
capitoli e sezioni sono stati anche pubblicati separatamente, come questo opuscolo. Potrete
trovare questi opuscoli nel sito web dell’Istituro Etologico di Cambridge all’indirizzo
www.ethology.eu :
 “Evolution – An Introduction” by Roger Abrantes ;
 “Animal Welfare” by Anabela Pinto-Poulton ;
 “EFR for Animals” by Maria J.Cunha ;
 “Think Out Of the Box – A guide to an open and critical mind” by Roger Abrantes;
 “Anatomy and Physiology” By Alessandra Bouquet ;
 “Animal Learning” by Roger Abrantes ;
 “Ethology” by Roger Abrantes ;
 “Measuring Behavior” by Roger Abrantes ;
 “Animal Training” by Roger Abrantes ;
 “Mission SMAF” by Roger Abrantes.

L’apprendimento degli animali e’ la scienza che studia come gli animali imparano i vari
comportamenti che mostrano. Un buon addestratore traccia dei buoni piani di azione. Un
buon piano di azione fornisce all’addestratore un orientamento sicuro ma anche una
sufficiente flessibilità per aggirare ogni problema che, inevitabilmente, affiora. Per fare
questo, avete bisogno di solide fondamenta nella teoria dell’apprendimento animale. Questo
piccolo libro vi fornirà i principi di base necessari per trasformare le vostre sessioni
addestrative in esercitazioni di scienza applicata ed arte ispirata, al posto di congetture.
Le vostre sessioni addestrative saranno sicuramente più gratificanti sia per voi che per il
vostro animale se avrete maggiore coscienza e conoscenza di ciò che state facendo.

Vi auguro una piacevole lettura,


Roger Abrantes

5
CAPITOLO 1 : L’APPRENDIMENTO

L’apprendimento e’ il processo con il quale l’individuo risponde ai cambiamenti


dell’ambiente circostante con corrispondenti cambi ed

Riepilogo del Capitolo


adattamenti del comportamento. L’apprendimento

L’apprendimento e’ un
comporta un cambio del comportamento indotto dalle
cambiamento del
comportamento.
conseguenze dello stesso.
Dobbiamo distinguere tra cambi nel normale corso dei
Nel condizionamento
classico, l’associazione tra due comportamenti che derivano da fattori motivazionali e
diversi stimoli, uno condizionato
ed uno incondizionato, elicita lo quelli che derivano dall’apprendimento. Ad esempio,
stesso comportamento che
diventa condizionato. se un predatore lascia passare una preda senza
Nel condizionamento assalirla, potrebbe dipendere dal fatto che, in quel
operante, uno stimolo
incrementa la frequenza di un momento, non e’ affamato. Differentemente, potrebbe
comportamento quando
rinforzato e la diminuisce quando ignorare la preda a causa di una recente esperienza di
punito.
insuccesso nella caccia a quel tipo di preda, ed in
questo caso si parla di apprendimento.
L’apprendimento sembra essere la capacità di mettere in connessione almeno due
esperienze pregresse come causa ed effetto o, in altre parole, comportamento e
conseguenze. Cosi come nel condizionamento classico, stimolo e risposta sono
connessi, nel condizionamento operante ad essere connessi sono stimoli e
rinforzi o punizioni. Sequenze comportamentali complesse richiedono grandissima
motivazione ed abilità per essere associate. Possiamo insegnare ad un cane a sdraiarsi
per riflesso (condizionamento classico) oppure rinforzando l’azione
(condizionamento operante) ma, per insegnargli il riporto abbiamo la necessità di
una lunga serie di rinforzi che ci conducano, attraverso diverse fasi, al nostro
obiettivo finale (modellamento del comportamento o, in inglese, shaping).
L’associazione, come ad esempio la capacità di mettere in connessione due
differenti esperienze (come causa ed effetto), la memoria e la motivazione sono
condizioni necessarie per l’apprendimento in tutte le forme di vita complesse.
E’ attraverso il primo contatto con il mondo esterno che il neonato acquisisce
conoscenze di vita che, più tardi, faranno la differenza tra la vita e la morte. Imparare
che l’acqua e’ bagnata, il fuoco scotta, che il contatto con oggetti duri provoca dolore,
che qualcosa ha un gusto delizioso e qualcosa altro non lo ha, sono un insieme di
informazioni che vengono acquisite attraverso il contatto con il mondo esterno.

6
Gli animali giovani si impegnano in varie attività ed esplorano situazioni sconosciute
poiché gli stessi non ne conoscono il probabile esito : non hanno esperienza sulle
conseguenze del loro comportamento. La loro
curiosità li guida all’esplorazione, nonostante la Cos’e il comportamento?

titubanza legata alla loro innata paura, mentre la L’apprendimento puo’ cambiare un
comportamento, ma non tutti i
pronta reazione a tutto ciò che può ucciderli o cambiamenti sono conseguenti
all’apprendimento. I cambiamenti del
ferirli frena il loro atteggiamento di curiosità. comportamento dovuti all’età’
(maturazione), traumi, droghe o
Una relazione ben bilanciata tra questi due fattori malattie non sono classificate tra quelli
conseguenti all’apprendimento.
pone nella giusta dimensione l’apprendimento
Il comportamento e’ tutto ciò che un
avanzato. E’ la prima cosa che i cuccioli animale mostra. Ciò nonostante, dal
punto di vista scientifico, necessitiamo
apprendono se vogliono sperare di sopravvivere. di una definizione operativa del
comportamento. Da questo ne deriva
La curiosità nei giovani animali rappresenta la che il comportamento e’ qualsiasi
cosa che l’individuo mostra che e’
motivazione. possibile per noi misurare.

L’imprinting è il primo tipo di apprendimento Il primo task quando studiamo un


comportamento e’ quello di definire,
per esposizione ambientale sugli animali giovani, operativamente, uno specifico
comportamento.
particolarmente forte poiché avviene durante un
Comportamento Operante e
periodo critico nel quale lo sviluppo neurologico Rispondente
Si definisce comportamento
e’ ancora in fase di crescita. Quanto appreso in operante quello controllato dalle
conseguenze dello stesso (es. Un ratto
questo periodo rimarrà con l’animale per tutto il indica il TNT perche’ quel
comportamento produce una
resto della sua vita e sarà, per la maggior parte, ricompensa in cibo).
un processo irreversibile. Si definisce comportamento
L’apprendimento e’ un cambiamento del rispondente quel comportamento
elicitato da uno stimolo. Uno stimolo
comportamento. Un comportamento può elicita una risposta (es. la vista del cibo
elicita salivazione).
cambiare in due modi: (1) o può incrementare Quando addestriamo un animale,
usiamo maggiormente procedure
in frequenza, intensità e/o durata oppure (2) può operanti, sebbene elementi di
comportamenti corrispondenti
decrescere in frequenza, intensità e/o durata. saranno sempre presenti nel
background.
L’apprendimento può pertanto cambiare la
frequenza, intensità e/o durata di un
comportamento.
Quando accediamo alla curva di apprendimento di ogni specifico animale, stiamo, in
pratica, misurando la frequenza, la durata e/o l’intensita’ del comportamento in
questione comparandolo con i valori acquisiti misurando lo stesso comportamento
registrato nelle medesime condizioni prima che la sessione di apprendimento abbia
inizio.

7
Gli animali mostrano differenti livelli di apprendimento e la selezione naturale ha
favorito differenti strategie. Alcune specie mostrano un comportamento, o una serie
di comportamenti, immediatamente dopo essere nati
Aspetti evolutivi o alla schiusura delle uova, ma anche una limitata
dell’apprendimento.
appropriatezza nel cambiare il loro comportamento in
Quando un animale impara, il
suo repertorio comportamentale funzione dei cambiamenti dell’ambiente. Altri si
cambia per sempre. Nonostante
un animale possa estiguere o comportano esattamente al contrario: non mostrano
dimenticare un
comportamento che ha appreso, quasi nulla alla nascita ma mostrano grande capacità
l’animale non tornerà mai al suo
stato precedente. nel rispondere in modo differente al variare
Apparentemente disimparare e’
un inibizione ad imparare ciò dell’ambiente circostante. I primi sono adatti ad un
che si e’ precedentemente
appreso.
ambiente che presenta piccoli cambiamenti periodici

L’apprendimento cambia la
dell’ambiente, mentre i secondi si adattano meglio a
formazione dell’animale ed e’, di
fatto, un cambiamento alla
cambiamenti più veloci e radicali dello stesso. Mentre
propria idoneità (fitness). E’
possibile che le conseguenze
i primi sono maggiormente istintivi i secondi hanno
dell’apprendimento siano
adattative all’incremento della
maggiori capacità di apprendimento.
propria idoneità.
Un comportamento muta solo come risposta ad un
L’idea che l’apprendimento sia di preciso stimolo (comportamento convenzionale)
tipo adattivo e’ stato riconosciuto
sia da diversi psicologi o come risultato delle sue conseguenze
(Thorndike 1911, Seligman 1970)
che etologisti (Lorenz 1965). (comportamento operante).
Un comportamento operante e’ disciplinato dagli
eventi posteriori al suo presentarsi. Il comportamento operante non causa l’evento
posteriore ma precede molto spesso gli stessi.
Il condizionamento classico e’ il procedimento di apprendimento nel quale uno
stimolo incondizionato (e non appreso) si presenta simultaneamente ad uno stimolo
condizionato (appreso) per elicitare una stessa risposta che, per tale motivo, diventa
una risposta condizionata (appresa). Nel condizionamento classico, cosi come Pavlov
lo descrive, accomuniamo la visione del cibo al suono della campanella che elicita la
salivazione; dopo diverse ripetizioni, il suono della campanella, da solo, elicita la
salivazione. Il condizionamento classico e’ anche chiamato condizionamento
Pavloviano oppure condizionamento convenzionale.
Il condizionamento classico si basa sui riflessi. Un riflesso e’ incondizionato quando
uno stimolo, anch’esso incondizionato, elicita una risposta incondizionata. I
riflessi incondizionati non sono appresi; essi sono innati, come ad esempio chiudere

8
gli occhi quando qualcosa si avvicina velocemente agli stessi. Molti riflessi
incondizionati hanno funzioni di salvavita.
Un riflesso condizionato comprende uno stimolo
condizionato che elicita una risposta
Burrhus Frederic Skinner
condizionata. Questa si definisce appresa.
Burrhus Frederic Skinner
(USA, 20 marzo 1904-18 Il condizionamento avviene secondo con le seguenti
Agosto 1990) era uno
Psicologo americano, autore, regole:
inventore, sostenitore di
riforme sociali e poeta. Dal
1. Lo stimolo che si vuole condizionare deve essere
1958, fino al pensionamento
nel 1974, fu professore di
neutro prima di essere condizionato; ad esempio non
Psicologia all’Universita’ di
Harvard. Fu l’inventore della
deve essere associato a nessuna specifica risposta
gabbia di condizionamento
operante (la gabbia di
(tecnicamente, un non-stimolo) ;
Skinner) e sviluppo’ la sua
2. Lo stimolo condizionato deve essere
personale filosofia di scienza
chiamata Behaviourismo contemporaneo a quello incondizionato, o al massimo
Radicale.
appena precedente, ma mai successivo ;
3. Gli stimoli condizionati ed incondizionati devono essere ripetuti più volte
contemporaneamente ;
4. Dopo un periodo nel quale gli stimoli incondizionati e condizionati non
vengono presentati insieme, si rende nuovamente necessario il
condizionamento.
Dobbiamo distinguere tra stimolo e oggetto dello stimolo. Nell’esempio di
Pavlov, lo stimolo e’ il suono e l’oggetto dello stimolo e’ la campanella.
Alcuni addetti ai lavori si riferiscono a stimoli condizionati ed incondizionati e a
risposte o riflessi condizionali o incondizionali. Tale terminologia e’ l’esatta
traduzione dall’originale scritto da Pavlov.
Skinner (1937) introduce una distinzione tra comportamento operante e
comportamento convenzionale. Il comportamento operante e’ un’azione
spontanea che avviene senza uno stimolo evidente, mentre il comportamento
convenzionale include tutti i comportamenti assunti in risposta ad uno stimolo
ben identificabile.
Skinner ritiene che tutti i comportamenti operanti siano stati modificati ed
efficacemente controllati attraverso rinforzi contingenti prevalenti. La filosofia
comportamentale descritta da Skinner provoca una rivoluzione nelle tecniche
sperimentali che hanno una prevalenza anche al giorno d’oggi.

9
Skinner determinò le procedure operanti libere nelle quali consentire agli
animali di indulgere liberamente in varie attività, mentre gli sperimentatori
tentavano di manipolarne le conseguenze.
Il condizionamento operante e’ la forma di

Ivan Petrovich Pavlov


modificazione del comportamento più utilizzata

Ivan Petrovich Pavlov


dagli addestratori di animali.
(Russia, 14 settembre 1849 –
27 febbraio 1936) fu un
Per operante si intende qualsiasi cosa che possa
fisiologista ed uno psicologo.
Fu insignito del premio Nobel
cambiare il comportamento di qualcuno o che
in Fisiologia e Medicina nel
influenza l’ambiente circostante.
1904 per le ricerche condotte
sul sistema digestivo. Pavlov e’ Ad esempio per operante si intendono i Rinforzi.
universalmente riconosciuto
per aver descritto per primo il Se un evento, seguito da una risposta, ne
fenomeno del condizionamento
classico, chiamato anche incrementa la frequenza, l’evento stesso può
condizionamento
Pavloviano. essere considerato un rinforzo. La possibilità che
una risposta sia ripetuta quando seguita da un
rinforzo e’ altissima. Il rinforzo e’ necessario nel condizionamento operante allo
stesso modo in cui sono necessari due stimoli per condizionare un
comportamento riflesso. I rinforzi sono eventi operanti o stimoli che
incrementano la frequenza di una certa risposta. Possono essere negativi o
positivi in dipendenza del fatto che possano incrementare o rimuovere un
comportamento.
Anche le Punizioni sono operanti, ma esse decrementano la frequenza di una
certa risposta; possono essere negative o positive, cosi come i rinforzi.
Nel condizionamento operante usiamo rinforzi positivi e negativi cosi come
punizioni positive o negative. Entrambe possono essere condizionate o
incondizionate. Alcuni autori si riferiscono ai rinforzi come ricompensa,
apportando ulteriore confusione ad una terminologia che già di per se e’ difficile.

10
CAPITOLO 2 : I SEGNALI

Un segnale e’ qualsiasi cosa significhi qualcosa per


Riepilogo del Capitolo
qualcuno. Qualsiasi cosa che significa qualcosa per
I Segnali o Stimoli
discriminativi cambiano il
qualcuno ha un impatto sul comportamento
comportamento degli animali.
dell’individuo in questione. Un segnale cambia il
Un segnale ha una forma ed un
significato.
comportamento di un animale. I segnali sono anche
chiamati stimoli, segni/indici (inglese: cues), ma il
Un SD comunica a chi lo riceve
che potrebbe essere disponibile un termine tecnico che li definisce e’ “segnali” (nel
rinforzo qualora mostri un certo
comportamento. contesto etologico del termine) o stimoli (nel
Un SΔ (S-delta) comunica contesto dell’apprendimento). I segnali sono anche
all’animale che non verrà concesso
alcun rinforzo stimoli discriminativi (SD) in quanto come
stimoli specifici producono specifici comportamenti;
gli animali discriminano i vari stimoli.
Esempio 1: Quando io dico “Hello” a qualcuno, la persona gira il volto verso di me.
Esempio 2: Quando dico “Come” al mio cane, lui corre verso di me.
Esempio 3: L’odore del TNT induce il ratto ad infilare il naso nel terreno e rimanere
in tale posizione per 5 secondi (poiché gli abbiamo insegnato a fare cosi).
Esempio 4: Se io ondeggio con le mie mani di fronte al cavallo, questo arretra.
Ciao, vieni, l’odore del TNT, e l’ondeggiare con le mani sono tutti segnali o stimoli
discriminanti poiché essi producono uno specifico comportamento associato ad essi e
solo ad essi.
Un segnale comprende sempre un significato ed una forma.
Nell’Esempio 1: il significato della parola “Hello” e’ “gira il tuo viso verso di me”
oppure “guardami” e la forma e’ la parola inglese “Hello”.
Nell’esempio 2: il significato di “Come” e’ “Corri da me adesso” e la forma e’ la parola
inglese “Come”.
Nell’esempio 3: il significato e’ “metti il naso nel terreno per 5 secondi” e la forma e’
l’odore del TNT.
Nell’esempio 4: il significato e’ “arretra” ed il segnale e’ l’ondeggiare delle mie mani.
Il significato di un segnale e’ ciò che chi invia il segnale vuole che chi lo riceve
faccia. Colui che lo riceve deve imparare ad associare specifici segnali con altrettanti
specifici comportamenti. Questa associazione tra stimoli e comportamento e’
l’essenza della teoria dell’apprendimento. Diciamo che un animale ha appreso un

11
comportamento quando questo mostra quel determinato comportamento dopo aver
ricevuto il segnale appropriato.
La forma di un segnale e’ ciò che il ricevente apprende da colui che lo invia. E’ la
forma fisica del segnale. Se e’ vero che non possiamo

SMAF – un modo preciso per vedere, toccare, annusare o assaggiare un significato,


descrivere i segnali
possiamo però trasmettere questo con la forma del
SMAF ha visto la luce all’inizio
degli anni ’90 come il tentativo di
segnale.
creare qualcosa che fosse utile a
descrivere accuratamente o a
Esempio 1: l’interlocutore sente la parola Hello;
pianificare il processo di
apprendimento e le strategie di
Esempio 2: il cane sente il suono Come;
lavoro nell’addestramento degli
Esempio 3: il ratto annusa l’odore del TNT;
animali. Nel testo principale di
questo libro abbiamo omesso la Esempio 4: il cavallo vede le mie mani ondeggiare.
maggior parte delle trascrizioni in
SMAF per una maggiore leggibilità La forma può essere qualsiasi cosa che abbia il fine
del testo.
Nonostante ciò, invitiamo tutti gli di far percepire lo scopo della stessa al ricevente.
studenti interessati all’argomento
dell’apprendimento degli animali Le forma deve avere la giusta intensità cosi che
cosi come tutti gli addestratori a
studiare meticolosamente possa essere percepita dal ricevente. Se mi
l’Appendice SMAF dove
abbiamo riportato tutte le chiamassero in una sala piena di gente che
spiegazioni del manuale. Come
sempre, quando apprendete un chiacchiera, potrei non sentire il richiamo. Lo stesso
nuovo linguaggio, ci vorrà un po’
di tempo affinché prendiate principio va applicato nell’addestramento degli
confidenza con lo SMAF. La
precisione dello SMF apre nuove animali. Ad esempio, i cani sono ottimi rilevatori
prospettive nel campo dei processi
di comunicazione ed dell’odore del TNT; se gli facciamo annusare una
apprendimento ed e’ altamente
auspicabile dedicare un po’ di quantità minima di tale esplosivo potrebbero non
tempo allo studio di esso.
rilevarlo. C’e’ un limite alle capacità dei sensi degli
animali al di sotto o al di sopra del quale l’animale
non sarà in grado di ricevere il segnale e, per tale motivo, non reagirà allo stesso.
Dobbiamo sempre definire il significato e la forma di tutti i segnali in
dettaglio e con attenzione cosi che possano essere evitate confusioni. Alcuni segnali
richiedono una lunga descrizione.
Per esempio, il segnale seduto per il cane significa “metti il tuo sedere sul pavimento
e tienilo li finche non ti arriva un altro segnale” ed una delle forme di questo segnale
e’ “seeeduto” (con la “e” allungata). In questo caso e’ molto semplice descrivere
brevemente la forma del segnale. Nonostante ciò, se volessimo dare lo stesso segnale
con le mani, cosa molto comune tra i proprietari di cani, la forma del segnale sarebbe
“un movimento verso l’alto con la mano destra passando di fronte al naso del cane”.

12
Gli stimoli discriminativi (SD) hanno caratteristiche differenti e in un processo di
apprendimento e’ utile che sappiamo distinguere tra di essi.
Un SD e’ un segnale (stimolo) che comunica al ricevente che un rinforzo (premio)
potrebbe essere disponibile qualora lui mostri uno
L’utilizzo, spesso errato, del specifico comportamento.
SΔ (S-delta)
Esempio: Ogni qualvolta io dico “seduto” al cane,
Un SΔ (S-delta) e’ un segnale
(stimolo) che comunica al
indico che un rinforzo (premio) potrebbe essere
ricevente che nessun rinforzo sarà
disponibile.
disponibile se e quando lui siederà.
E’ un segnale importante, cosi
come tutti i segnali SD troppo
Un SD non e’ una garanzia che il premio sarà
spesso ignorati, purtroppo, dagli
addestratori di animali.
disponibile. Come mostreremo nel capitolo 4,
Molti, se non tutti gli addestratori
differenti programmi di rinforzo produrranno rinforzi
Inglesi, utilizzano la parola “off”,
“finish”, “end” come SΔ e spesso lo a diverse velocità. Ciò che un SD comunica e’ che un
fanno in maniera randomica senza
insegnarne il significato rinforzo potrebbe essere disponibile. Al primo stadio
all’animale.
L’SΔ dovrebbe essere sempre un di apprendimento i rinforzi saranno disponibili in
distinto e particolare segnale che
l’animale non può confondere. misura maggiore rispetto a quando non saranno
All’Istituto Etologico di
Cambridge, cosi come nel testo di disponibili, anche ogni volta che l’animale produce il
questo libro, noi utilizziamo
Free,sound (la parola inglese Free) comportamento voluto.
e Free,body (voltare le spalle
all’animale) e definiamo questi Un SΔ (S-delta) e’ un segnale (stimolo) che comunica
stimoli con la stessa precisione
con la quale definiamo gli altri al ricevente che nessun rinforzo (ricompensa) sarà
segnali.
In sintesi: siate precisi nell’utilizzo disponibile per nessun particolare comportamento.
di qualsiasi SΔ cosi come per gli
SD.

Esempio: Ogni qualvolta io dico “Free” al cane, indico


che nessun particolare comportamento assuma produrrà un rinforzo (ricompensa).
Sottolineo che la parola “Free” deve essere pronunciata.
Un Sβ (S-beta) e’ un segnale (stimolo) che comunica al ricevente che nessun rinforzo
(ricompensa) sarà disponibile per il comportamento mostrato, ma che un ulteriore
comportamento, nell’ambito della stessa sessione addestrativa, potrebbe essere
rinforzato con un premio.
Esempio: Quando dico “Wrong” (sbagliato) al cane, gli indico che lo specifico
comportamento appena tenuto (come ad esempio “terra”) non otterrà un premio
(rinforzo). Un altro comportamento evidenziato durante la stessa sessione
addestrativa, come ad esempio “rotola” potrebbe essere rinforzato da un premio.
Sottolineo che la parola “Wrong” (sbagliato) deve essere pronunciata.

13
Un Sγ (S-gamma) e’ un segnale (guida) che induce chi lo riceve a mostrare un certo
comportamento. Un Sγ e’ intrinsecamente un SD , specialmente nel caso in cui un SD
e’ facilmente riconducibile dall’animale ad uno specifico comportamento.
Esempio: Quando io tengo in mano una ricompensa e con un movimento all’insù
della mano effettuato di fronte al naso del cane induco il cane a sedersi, sto
presentandogli un rinforzo. Altri esempi sono gli usi diffusi di ricompense attraenti
per il cane, giochi e l’applicazione di compressioni di bassa intensità.
Il termine Sγ e’ utile per indicare il fatto che stiamo usando un SD con una
caratteristica speciale, come ad esempio un aspetto caratteristico particolare
dell’elemento guida di un segnale.
Un segnale (o stimolo) Sπ (S-pi) trasmette al ricevente l’imminenza dell’arrivo di una
punizione (punizione condizionata). In etologia, un Sπ e’ un avvertimento, una
minaccia.
Esempio: Quando dico “Hum” (con un tono di voce basso) al cane, indico allo stesso
che e’ imminente l’arrivo di un inibitore a meno che il cane non mostri (o cessi di
mostrare) uno specifico comportamento.
Un Sπ e’ una punizione condizionata (parleremo delle punizione nel seguente
capitolo 3) ed alcuni potrebbero trovarlo ridondante. Nonostante ciò, il termine e’ di
certo utile quando ci troveremo a pianificare una sessione addestrativa in alcuni
particolari contesti come vedremo più avanti.
Un SD richiede un addestramento preventivo. Ad eccezione del Sγ, che potrebbe
produrre nell’animale il comportamento voluto alla prima volta che viene presentato
all’animale (e questo proprio perché e’ un Sγ), tutti gli altri stimoli richiedono un
certo numero di sessioni addestrative prima che l’animali li associ ad un determinato
comportamento.

14
CAPITOLO 3 : DISCRIMINAZIONE, GENERALIZZAZIONE E
CONTROLLO DELLO STIMOLO

Riepilogo del Capitolo Discriminazione, o discriminazione dello stimolo, e’


Un Segnale e’ qualsiasi cosa che definita la capacità dell’animale di distinguere tra
significhi qualcosa per qualcuno.
differenti stimoli scegliendo il comportamento da
Qualsiasi cosa che significa
qualcosa per qualcuno ha un adottare in riferimento a quello specifico stimolo.
impatto sul comportamento
dell’individuo in questione. Tutti gli animali possono discriminare tra i vari stimoli:
Un Segnale cambia il questi sono ricevuti dai sensi e, conseguentemente,
comportamento di un animale.
l’accuratezza della discriminazione tra i vari stimoli
dipende anche dalle capacità precipue degli specifici
sensi di cui gli animali sono in possesso. A seconda della specie, alcuni stimoli sono
più forti per alcuni animali rispetto ad altri. La selezione naturale ha modellato
queste specifiche capacita’ attraverso il tempo, consentendo ad ogni animale, ed in
particolare a ciascuna specie, di affinare le proprie abilita’ nell’ambiente naturale in
cui vive.
La discriminazione e’ l’opposto della generalizzazione; maggiore e’ la
discriminazione, minore e’ la generalizzazione e viceversa.
Nell’addestramento Pavloviano alla discriminazione accoppiamo
ripetutamente uno stimolo condizionato (CS) con uno stimolo incondizionato (US) e
presentiamo un altro stimolo condizionato senza un US. Designiamo il primo stimolo
con CS+ ed il secondo con CS-.
Ci sono varie forme di addestramento discriminante operante: tutti essi hanno in
comune la caratteristica che differenti stimoli e differenti comportamenti hanno
differenti conseguenze. Spesso siamo stupiti da come gli animali imparano a
discriminare tra i vari stimoli mostrando il corretto comportamento di fronte a
ognuno di questi. Tuttavia dimentichiamo che la discriminazione degli stimoli e’ ciò
che l’animale compie costantemente ogni giorno della sua vita e questo, senza dubbio,
e’ quello che gli consente di sopravvivere.
Nell’addestramento operante discriminante semplice, uno stimolo SD indica
che uno specifico comportamento produce un rinforzo, mentre un altro stimolo di
tipo SΔ, indica che nessun comportamento produrrà un rinforzo.
Esempio: alcune gabbie di Skinner emettono un suono “bip” (SD) indicando
all’animale che c’e’ la possibilità di ricevere un rinforzo mostrando un determinato

15
comportamento, ed un suono diverso “bop” (SΔ) indica che nessun comportamento
particolare produrrà un rinforzo.
L’addestramento operante discriminante complesso, prevede la presentazione
contemporanea di due stimoli SD all’animale, uno dei quali indica che un dato
comportamento verrà rinforzato ed un altro che lo stesso comportamento verrà
punito. Una variazione dello stesso tipo di addestramento prevede che un SD indichi
che un certo comportamento potrebbe produrre un rinforzo corposo ed altamente
desiderabile mentre un altro SD indica che sarà disponibile un rinforzo povero e poco
desiderabile. Ci sono molti modi di combinare diversi SD per insegnare all’animale a
mostrare differenti comportamenti. La bravura e la conoscenza della materia da parte
di un buon addestratore può condurre a risultati incredibili.
L’addestramento discriminante senza errori, e’ una procedura che riduce
enormemente il numero di errori che l’animale compie durante l’addestramento
discriminante. Imparare a discriminare tra vari stimoli richiede tempo ed
inevitabilmente produce degli errori. E’ un procedimento per tentativi (prove) ed
errori. A volte non e’ auspicabile consentire all’animale di commettere molti errori
poiché gli stessi conducono ad elicitare risposte emotive di errore (scarso successo)
punendo cosi l’atto dello sforzo che l’animale fa per raggiungere l’obiettivo.
Nell’addestramento discriminante senza errori presentiamo lo stesso stimolo in due
modi differenti: un SD nella sua forma e durata normali ed un SΔ in forma debole (es.
poco visibile o di scarsa durata). L’animale avrà un comportamento corretto in
presenza del SD che conseguentemente produrrà un rinforzo, mentre non presenterà
alcun comportamento in presenza dello stimolo SΔ. Gradualmente incrementeremo
la forma e la durata dello stimolo SΔ finché non apparirà nella sua forma più normale
ma l’animale non mostrerà ancora il giusto comportamento.
Nella maggior parte dei casi, nell’addestramento discriminante i rinforzi sono gli
stessi quando l’animale mostra differenti comportamenti stimolati da differenti SD.
Per esempio, un ratto deve premere una leva quando vede una luce rossa ed un altro
quando vede una luce verde. Il comportamento corretto produce lo stesso rinforzo,
nel caso un pellet di cibo, a prescindere da quale delle due leve abbia premuto
correttamente. Gli esperimenti indicano che si può aumentare la velocità di
apprendimento e ridurre il numero di errori concedendo differenti rinforzi per
differenti comportamenti. Tale tecnica prende il nome di effetto in uscita
differenziale (DOE).

16
Esempio: premendo la leva uno quando vede la luce rossa, il ratto riceverà un
rinforzo in cibo, mentre premendo la leva giusta quando vedrà la luce verde riceverà
dell’acqua come rinforzo.
La generalizzazione e’ l’inverso della discriminazione e si manifesta quando
diversi stimoli producono lo stesso comportamento. Più saranno uguali gli stimoli,
più sarà facile che gli animali facciano una generalizzazione degli stimoli.
La generalizzazione dello stimolo e’ un fatto naturale ed indispensabile nella
lotta alla sopravvivenza. Fatta eccezione per un numero limitato di stimoli, la maggior
parte di quelli prodotti in un laboratorio sperimentale non sono mai uguali. Le nuvole
non sono mai uguali a quelle del giorno prima, per questo predatori e prede
sembrano leggermente diversi quando appartengono alla stessa specie. Non di meno,
tutti gli animali devono essere in possesso di una buona abilità nel generalizzare gli
stimoli. Il difficile nella generalizzazione degli stimoli consiste nel presentare stimoli
che producono un certo tipo di rinforzi (o punizioni) in presenza di uno specifico
comportamento in una categoria differente dalle altre. Il fallimento in questa
operazione può avere conseguenze disastrose. Mettere il cibo nutriente e quello
velenoso nella stessa categoria non e’ di certo una buona idea (ad esempio i funghi
sono un buon esempio in tal senso).
La selezione naturale ha aiutato i vari organismi viventi ad implementare la
capacità di discernere tra quello che e’ un buon cibo e quello che non va mangiato. Se
gli effetti della selezione naturale non sono cosi presenti le esperienze prendono il
sopravvento. Mentre la capacità di generalizzare e’ innata, gli animali imparano a
generalizzare stimoli particolari attraverso prove ed errori (esperienze). Nelle
situazioni di addestramento osserviamo generalizzazioni continue specialmente se le
prove non sono fatte sotto il controllo stretto e diretto di un ambiente di laboratorio.
Ad esempio, gli addestratori di cani fanno affidamento sulla capacità di
generalizzazione del proprio cane per far seguire ad uno stimolo corretto il corretto
comportamento.
Abbiamo detto che un comportamento e’ controllato dallo stimolo quando
l’animale mostra questo consistentemente, in presenza di un determinato stimolo,
ma non in assenza dello stesso stimolo o in presenza di uno stimolo diverso.
Il controllo degli stimoli e’ un fatto naturale, non e’ il risultato di esperimenti di
laboratorio o addestramento particolare. Possiamo vedere il controllo degli stimoli in
tre modi diversi:

17
1. Lo stimolo esercita il controllo sugli animali. Questo e’ vero in quanto in
questo modo gli animali posso mostrare uno specifico comportamento con
relativa alta frequenza in presenza dello stimolo in questione attribuendo
pieno significato a questo ed al perché l’animale per prima cosa impara a
discriminare. Controllarlo non significa pensare che l’animale e’ costretto (nel
rispondente significato del condizionamento) a mostrare il comportamento
una volta che lo stimolo compare. L’animale ha sempre una scelta: esso mostra
più spesso il comportamento poiché spesso tale comportamento e’ rinforzato.
Questo spiega perché l’animale cerca un riparo quando piove, va a caccia
quando e’ affamato, fugge quando e’ spaventato da una minaccia.
2. L’animale controlla l’ambiente circostante. Questo e’ vero poiché l’animale sa
cosa fare per arrivare a conseguire certi risultati e non spreca energia e tempo
tentando varie ed erronee alternative.
3. L’animale cambia l’ambiente circostante. Questa possibilità alternativa
appartiene solo alla razza umana. Quando conosciamo le conseguenze che uno
stimolo e’ in grado di produrre possiamo cambiare l’ambiente circostante cosi
che quel tale comportamento abbia meno possibilità di manifestarsi. Se per
esempio dedico di dimagrire, sicuramente evito di contornarmi di cibo e di
andare in giro per ristoranti. Il fumatore che desidera diminuire la quantità di
sigarette fumate o smettere di fumare, eviterà i bar ed i posti dove vari stimoli
lo possono indurre a fumare.

18
CAPITOLO 4 : AUMENTO O DECREMENTO DI UN COMPORTAMENTO

Come abbiamo visto, quando addestriamo un


Riepilogo del Capitolo
animale possiamo aumentare o diminuire
I Rinforzi incrementano la
frequenza di un comportamento, (decrementare) la frequenza, l’intensità’ e/o la durata
le Punizioni lo decrementano.
di un comportamento che fa parte del repertorio
La Contingenza e la Contiguità
influiscono sull’efficacia di rinforzi dell’animale. Non possiamo insegnare all’animale un
e punizioni.
comportamento che lo stesso non e’ in grado di
Rinforzi e punizioni possono
essere condizionati o mostrare.
incondizionati, positivi o
negativi.
Di norma utilizziamo due strumenti per cambiare la

I rinforzi incondizionati
frequenza e/o l’intesita’ di un comportamento:
dipendono dal livello di
privazione.
un’incrementatore (rinforzi) ed un

I rinforzi condizionati devono


decrementatore (punizioni). Il termine corretto
essere di regola associati a quelli
incondizionati.
per definire queste procedure e’ detto rinforzo
(quando si presenta all’animale un rinforzo positivo o
Il Successo nell’addestramento
degli animali si consegue si toglie una punizione positiva) e punizioni
attraverso l’uso appropriato di
tutti e quattro gli elementi del (quando si presenta all’animale un rinforzo negativo
condizionamento operante.
o si toglie un rinforzo positivo). Tuttavia, sin da
quando questi termini sono stati introdotti, sembra
che gli stessi generino confusione in molti addestratori poiché la stessa parola ha
differenti connotazioni nel linguaggio di tutti i giorni e, per tale motivo, sono stati
introdotti i termini incrementatore e decrementatore. Nel testo che segue, useremo i
termini classici ma non esitate a tradurli nel modo a voi più consono o in nuovi
termini quando coniati.
Rinforzi e punizioni non sono ne’ cose buone ne’ cose cattive. Esse vengono
applicate solo per diminuire o incrementare un certo comportamento. Non possiamo
dire che l’animale ama i rinforzi ed odia le punizioni: non sappiamo nulla in
proposito. Possiamo invece sapere, attraverso un’attenta osservazione, qual’e
l’impatto che ha un certo stimolo sul comportamento dell’animale. Solo da qui in
avanti potremo classificare i differenti stimoli come rinforzi o punizioni. Se uno
stimolo non cambia il comportamento dell’animale, allora esso non e’ ne’ un rinforzo
ne’ una punizione. In linea generale, possiamo comunque dire che i rinforzi tendono
ad essere cose desiderabili mentre le punizioni sono avversive, ma non dobbiamo

19
dimenticare che una cosa desiderabile potrebbe essere avversiva allo stesso tempo e
viceversa.
Rinforzi e punizioni sono molto particolari. Un certo stimolo e’ un rinforzo o una
punizione per uno specifico comportamento in un
Un avvertimento in merito contesto specifico, in un determinato momento e per
alle punizioni
un certo individuo. Un rinforzo in un certo momento
Le Punizioni sono divenute
oggetto di dispute nell’ambito può essere una punizione ed in un altro un rinforzo
della comunità degli animali da
compagnia negli ultimi 10 anni.
cosi come potrebbe essere vero l’opposto.
Ciò e’ accaduto a causa di
molteplici fattori. Primo su tutti, la
Tutti gli organismi viventi sono soggetti
parola punizioni in se stessa elicita
spiacevoli reazioni nella maggior
costantemente a rinforzi e punizioni provenienti da
parte delle persone, non
comprensibili dal momento che
ogni possibile fonte, da ogni altro organismo,
per punizioni si intende un
dall’ambiente naturale o dal proprio sistema
avversivo, quindi uno stimolo che
comunque si vorrebbe evitare di endogeno. Tutti gli organismi viventi adattano il loro
infliggere. Secondo fattore e’ la
tendenza a romanzare il rapporto comportamento al fine di ottenere il massimo dei
esistente con i nostri animali ed il
termine punizioni non compare rinforzi ed il minimo delle punizioni. Due proprietà
in questa relazione. Terzo fattore
e’ la grossa errata confusione sul del processo di rinforzo e di punizione inficiano la
significato della parola punizioni
nell’alveo della teoria loro efficacia considerevolmente: la contingenza e
dell’apprendimento. Punire o
punizioni non hanno niente a la contiguità.
che vedere con la violenza, con il
ferimento, col dolore o la La contingenza e’ il grado di correlazione tra il
mutilazione sebbene molte di
queste riguardino la maggior parte comportamento e le sue conseguenze. Ad esempio, se
degli organismi. Una punizione
e’ semplicemente uno stimolo che un cane riceve del cibo per mostrare un certo
decrementa uno specifico
comportamento in un determinato comportamento, gli abbiamo insegnato questo, ma
individuo, in un determinato
momento, in determinate se riceve del cibo senza mostrare il comportamento
circostanze. E’ semplicemente un
avversivo in quella particolare che vogliamo l’apprendimento sarà più lungo.
occasione. Potrebbe essere un
avversivo anche in altre situazioni Molti piccoli rinforzi, ma altamente centellinati,
ma potrebbe anche essere un
rinforzo. Il cibo e’ un rinforzo nella ottengono spesso più risultati che pochi e copiosi
maggior parte delle situazioni ma,
se somministrato ad un animale rinforzi scarsamente contingentati. Lo stesso vale per
nauseabondo, funzionerebbe come
punizione. le punizioni: più alto sarà il contingentamento delle
stesse tra comportamento e punizione, più veloce
sarà la soppressione del comportamento indesiderato.
La contiguità, in riferimento al gap tra il comportamento e le sue conseguenze,
potrebbe essere un rinforzo o una punizione. La contiguità, anche definita
sincronizzazione temporale, e’ un fattore molto importante che influenza la
frequenza nel comportamento operante e la velocità dell’apprendimento. Studi

20
condotti mostrano che più veloci sono le conseguenze di un comportamento mostrato
dall’animale e più velocemente esso apprenderà. Tale risultato si applica anche per le
punizioni e per la soppressione dei comportamenti. Nonostante ciò, rinforzi e
punizioni devono essere idealmente applicate simultaneamente o
immediatamente dopo che l’animale ha mostrato il comportamento
voluto.
Rinforzi e punizioni devono avere la giusta intensità per essere efficaci. Non
pensate mai che la contingenza sia più importante della misura del rinforzo; un
grande rinforzo e’ meglio di uno piccolo. Lo stesso vale per le punizioni: una lieve
punizione con bassa intensità potrebbe non modificare il comportamento
indesiderato (ed in questo caso non sarebbe una punizione) o inficiarlo solo
minimamente.
Classifichiamo i rinforzi e le punizioni come condizionati o incondizionati.
Rinforzi incondizionati e punizioni sono anche chiamati rinforzi e
punizioni primarie poiché non dipendono dalla loro associazione con altri stimoli.
La maggior parte di essi agiscono su bisogni primari, basati quindi su necessità come
ad esempio il cibo e l’acqua che sono, appunto, rinforzi primari. L’efficacia dei
rinforzi primari, cibo, acqua, la cordialità, il contatto, variano considerevolmente con
il livello di privazione. I rinforzi incondizionati subiscono l’effetto della sazietà
dell’animale. L’efficacia del cibo come rinforzo decrementa man mano che l’animale
ne riceve e cesserà di essere un rinforzo allorché l’animale sarà sazio; a quel punto,
sottrarre il cibo non avrà neanche la funzione di punizione.
Rinforzi condizionati e punizioni non sono innati e devono essere appresi
attraverso l’associazione con rinforzi primari o punizioni. Sono definiti anche
rinforzi secondari o punizioni. Dopo alcune ripetizioni, l’animale impara che c’e’
un’associazione tra uno stimolo neutro (un non stimolo) ed un rinforzo
incondizionato o una punizione. In tal modo lo stimolo neutro diventa un rinforzo
condizionato o una punizione. Il suono del clicker e’ un rinforzo condizionato poiché
dobbiamo associarlo molte volte al cibo, cosi che il ratto associ il suono del clicker al
cibo. Questa associazione e’ definita rispondente o associazione Pavloviana.
I rinforzi condizionati e le punizioni sono deboli quanto quelli
incondizionati, ma hanno diversi vantaggi: non perdono di efficacia a causa della
sazietà o della privazione, possono essere somministrate con maggior senso di
immediatezza, sono meno invasive,sono efficaci in differenti situazioni. Detto questo,

21
dobbiamo ricordarci che dobbiamo bilanciarle con i rinforzi incondizionati e
punizioni al fine di non fargli perdere il loro valore (sottoporsi quindi ad estinzione).
Gli addestratori devono usare rinforzi e punizioni dopo averci ben pensato. Esistono
strumenti efficaci nella modificazione del comportamento. Un utilizzo inappropriato
di entrambi può avere effetti collaterali indesiderati che debbono essere evitati ad
ogni costo.
Un rinforzo (uno stimolo desiderato) e’ qualsiasi cosa che incrementa la frequenza,
la durata e/o l’intensità di un certo comportamento quando questo sia concesso o
negato simultaneamente o immediatamente dopo che il comportamento voluto abbia
avuto luogo.
Esempio: Se io do una ricompensa al mio cane, e
Rinforzi e punizioni: ciò incrementa la velocità con la quale il cane si
somministrateli con cura !!
siede, la ricompensa assume valore di rinforzo per
Rinforzi e punizioni sono strumenti
potenti nella modifica comportamentale. il comportamento di “seduto” eseguito dal mio
Quando utilizzati correttamente, sono
veloci ed efficaci. Nonostante ciò, entrambi cane in quello specifico momento.
possono crearci dei problemi qualora
siano distribuiti in maniera erronea e
Ci sono due tipi di rinforzi: quelli positivi e quelli
possono condurre ad effetti collaterali
indesiderati.
negativi.
Rinforzi troppo frequenti per tutte le specie
di comportamento ed il livello di difficoltà’
Un rinforzo positivo e’ qualsiasi cosa che
che richiediamo all’animale possono
portare un soggetto a non lavorare sotto
incrementa la frequenza, la durata e/o l’intensità
pressione o ad arrendersi quando il
di un certo comportamento quando questo sia
successo non arriva immediatamente.
Questo tipo di animali e’ difficile da concesso o negato simultaneamente o
addestrare. Per esempio, quando modelli il
comportamento di un animale dovrai immediatamente dopo che il comportamento
premiare ogni comportamento che questo
assume per giungere, per approssimazione, voluto abbia avuto luogo.
al risultato finale. Un animale che si
arrende non ci da nessuna possibilità di Esempio: se io do una carota al mio cavallo e ciò
addestrarlo.
L’utilizzo di troppe punizioni possono incrementa la velocità con la quale questi si
sfociare in comportamenti di lotta,
aggressività’, apatia, annullamento o anche avvicina a me, la carota assume valore di rinforzo
impotenza.
Sia i rinforzi che le punizioni sono soggette per quel dato comportamento in quella precisa
a generalizzazione (vedi capitolo 3) che
può ostacolare tutte le future sessioni di circostanza.
addestramento dell’animale.
Un rinforzo negativo e’ qualsiasi cosa che
incrementa la frequenza, la durata e/o l’intensità
di un certo comportamento quando questo sia rimosso simultaneamente o
immediatamente dopo che il comportamento voluto abbia avuto luogo.
Esempio: Se l’allentamento del guinzaglio (e di conseguenza del collare) del mio cane
avviene nel momento stesso in cui lui cessa di tirare, si può dire che l’allentamento

22
della pressione che prima esercitavo e’ un rinforzo negativo al comportamento di
non-tirare del mio cane in quella determinata circostanza.
Una Punizione e’ qualsiasi cosa che decrementa la frequenza, la durata e/o
l’intensità di un certo comportamento quando questo sia presentato o rimosso
simultaneamente o immediatamente dopo che il comportamento abbia avuto luogo.
(Possiamo anche dire che la punizione consiste nel sottrarre un rinforzo positivo o nel
presentare un rinforzo negativo)
Ci sono due tipi di punizioni: quelle positive e quelle negative.
Una punizione positiva e’ qualsiasi cosa che decrementa la frequenza, la durata
e/o l’intensità di un certo comportamento quando presentata simultaneamente o
immediatamente dopo che il comportamento abbia avuto luogo.(La punizione
positiva e’ la presentazione di un rinforzo negativo)
Esempio: Quando tiro il guinzaglio del mio cane perché non vuole mostrare un certo
comportamento, io sto (positivamente) punendo lo stesso. Il risultato che voglio
ottenere e’ che diminuisca la frequenza con la quale il cane tira il guinzaglio.
Una punizione negativa e’ qualsiasi cosa che decrementa la frequenza, la durata
e/o l’intensità di un certo comportamento quando rimosso simultaneamente o
immediatamente dopo che il comportamento voluto abbia avuto luogo. (La punizione
negativa consiste nel ritiro di un rinforzo positivo).
Esempio: Se io non concedo al mio cane un premio quando gli dico “seduto” e lui non
siede, inibisco il comportamento del mio cane nel non sedersi in simili circostanze;
ne consegue che il non premiarlo e’ un inibitore negativo per avversare il suo sedersi
in particolari circostanze.
L’incitamento (inglese: tease) e’ una variazione di un’inibizione negativa che
prevede che il rinforzo positivo (di norma incondizionato, ma non necessariamente)
sia nascosto anziché rimosso. L’incitamento incoraggia il ricevente a mostrare il
comportamento recentemente rinforzato, quindi accrescendo la partecipazione attiva
nel processo di apprendimento.
Esempio: Mostro temporaneamente, salvo poi nasconderlo, il rinforzo positivo (ad
esempio un premio in cibo) al fine di incoraggiare la performance di uno specifico
comportamento che, di norma, e’ quello già rinforzato più recentemente.
Le quattro procedure operanti, rinforzo positivo, rinforzo negativo, punizione
positiva e punizione negativa sono complementari l’una a l’altra. L’utilizzo di una
di esse non esclude la necessità di utilizzarne un’altra. In alcune situazioni di

23
apprendimento potremmo riuscire a raggiungere l’obiettivo desiderato utilizzando
una sola o due delle procedure indicate. Nonostante ciò , a lungo andare, i buoni
addestratori si troveranno ad utilizzare tutte e quattro le procedure ovviamente per
obiettivi diversi. Nel corso degli studi condotti, abbiamo scoperto che e’ virtualmente
impossibile addestrare un animale (umani inclusi) senza l’utilizzo combinato di
rinforzi e punizioni sia condizionati che incondizionati; la chiave del successo risiede
nella perfetta sincronizzazione dei tempi, nell’intensità’ e nell’appropriatezza dello
strumento che utilizziamo per ogni specifica situazione.
La sotto riportata tabella sintetizza l’uso dei quattro principali strumenti utilizzati nel
comportamento operante come incrementatori o decrementatori del comportamento
stesso.

Per incrementare un comportamento Per ridurre un comportamento


Presentare lo stimolo Rinforzo Positivo Inibitore Positivo
Rimuovere lo stimolo Rinforzo Negativo Inibitore Negativo

24
CAPITOLO 5 : IL PROGRAMMA DEI RINFORZI

Un programma di rinforzi (RS - reinforcement


Riepilogo del Capitolo
schedule) indica la frequenza con la quale un
Il Programma dei Rinforzi
indica la frequenza con la quale un comportamento vada rinforzato. Differenti
comportamento viene rinforzato.
programmi di rinforzi producono particolari
Un programma di rinforzo
continuo rinforza un
modelli e diverse rapidità nel porre in atto i
comportamento ogni talvolta
questo viene mostrato. Il rinforzo
comportamenti. I più comuni programmi di rinforzi
continuo conduce ad un rapido
incremento della velocità di
utilizzati dagli addestratori sono quelli denominati
esecuzione. Nei primi passaggi di
un processo di apprendimento, gli
continuo (CRF), intermittente (IRF), multiplo
addestratori utilizzano questo tipo
(MULT) e misto (MIX).
di rinforzo.
Un CRF (programma di rinforzo continuo) ha
Un programma di rinforzo
intermittente rinforza solo l’obiettivo di rinforzare determinati comportamenti
alcune volte un certo
comportamento quando ogni qual volta essi ricorrono. Il CRF conduce ad
manifestato.
una maggiore rapidità nel porre in atto il
comportamento.
Esempio: il classico Skinner box rinforza il comportamento del ratto ogni qualvolta
tocca una leva.
Durante il processo di insegnamento ad un animale dell’associazione tra il suono del
click ed il premio, l’addestratore somministrerà all’animale un premio ogni qualvolta
cliccherà. Nonostante ciò questo non e’ un esempio di CRF poiché l’associazione tra
click e premio e’ un’associazione rispondente e non operante. L’associazione operante
e’ basata sulla sequenza stimolo-comportamento-rinforzo. Nell’associazione
rispondente non c’e il comportamento ma la presentazione di due stimoli
contemporanei.
Un IRF (programma di rinforzo intermittente) rinforza un certo tipo di
comportamento quando questo si presenta, ma non in ogni occasione (solo qualche
volta). I più comuni IRF sono quelli ad intervalli variabili o quelli a variazione della
durata del programma.
Esempio: Il predatore che aspetta la preda non e’ mai rinforzato dopo averla attesa
per un periodo fisso.
Un rapporto fisso (RF) rinforza un comportamento dopo che lo stesso sia stato
ripetuto per un numero fisso di volte. La pianificazione RF conduce a pause post-

25
rinforzamento. Dopo essere stato rinforzato, il ratto avrà infatti la tendenza a
prendersi una pausa. (esempio: il lavoro a cottimo).
Un rapporto variabile (RV) rinforza un comportamento solo alcune volte,
normalmente dopo un certo numero di risposte
L’importanza del positive, ma mai a numero fisso. La pianificazione VR
programma di rinforzi
conduce a brevi pause post-rinforzamento rispetto a
Quando cerchiamo nelle mine in
un campo minato in situazioni quelle del FR e, perciò, produce normalmente più
operative reali, l’addestratore non
sa dove sono allocati gli ordigni ne’ comportamenti diversi nello stesso periodo.
se essi siano presenti nel campo
ispezionato. Per tali ragioni, (esempio: il comportamento predatorio).
l’addestratore non può rinforzare
le indicazioni provenienti da un Un intervallo fisso (IF) rinforza un
cane o da un ratto poiché queste
potrebbero rivelarsi false. Ciò non comportamento mostrato dopo che uno specifico
comporta alcun problema poiché
sia il cane che il ratto sono intervallo di tempo e’ trascorso. L’FI fornisce curve di
addestrati ad operare secondo il
programma di rinforzi diagramma diversamente altalenanti mentre l’FR
intermittente (IRF). Quest’ultima
condizione (addestrato ad operare produce una linea costante.
con rinforzi intermittenti) e’ molto
importante poiché diversamente Un intervallo variabile (IV) rinforza un
se non ricevesse alcun rinforzo pur
indicando l’odore del TNT questo comportamento mostrato dopo un periodo di tempo
porterebbe all’estinzione del
comportamento con conseguenze medio, ma mai ad intervalli fissi. Il VI produce livelli
altamente indesiderabili.
Lo stesso esempio e’ applicabile
di esecuzione altamente costanti, più alti di quelli
per i cani addestrati a scovare
esplosivi e narcotici all’interno
ottenuti con l’FI.
di veicoli o aeroporti.
Nell’incertezza che il cane trovi
Nella durata fissa (DF) il comportamento e’
qualcosa, andrà rinforzato solo il
comportamento di cercare.
rinforzato dopo una performance continua eseguita
per un tempo fissato.
Nella durata variabile (DV) il comportamento e’
rinforzato dopo una performance continua eseguita per un tempo variabile.
La pianificazione DF e DV dimostrano che l’aumento della performance e’ essa stessa
un rinforzo.
Possiamo combinare gli elementi della pianificazione in modo diverso allo scopo di
raggiungere una programmazione multipla di rinforzo (MULT) oppure una
pianificazione di rinforzo mista (MIX).
Il rinforzo differenziale (DR) e’ una procedura del condizionamento operante nel
quale alcuni tipi di comportamenti sono sistematicamente rinforzati ed altri non lo
sono. Il DR e’ normalmente utilizzato per trattare problemi comportamentali ma non
solo questi. Ad esempio, possiamo usare il DR in combinazione con una procedura di
estinzione per ridurre a zero la frequenza del comportamento indesiderato.

26
Tipi di rinforzo differenziato:
DRL (basso) – rinforza comportamenti che si presentano con frequenza non più alta
di un certo numero di volte in un periodo ben definito.
DRH (alto) – rinforza i comportamenti che si
Rinforzi e ricompense presentano almeno un certo numero di volte in un
Rinforzi e Ricompense non periodo ben definito.
sono la stessa cosa, sebbene gli
addestratori tendano ad utilizzare DRO (zero) – rinforza la completa assenza di uno
questi due termini in maniera
intercambiabile. specifico comportamento in un certo periodo
Rinforzo e’ il termine tecnico per determinato.
qualsiasi stimolo che produca
l’incremento del comportamento DRA (alternativo) – rinforza un comportamento che
che esso controlla.
e’ differente da un altro comportamento non
La Ricompensa e’ qualcosa
concessa in riconoscimento di un desiderato.
buon servizio reso, un premio, un
dono. DRI (incompatibile) – rinforza un comportamento
Nonostante i due termini abbiano che e’ incompatibile con un altro comportamento non
significati molto vicini, non
esprimono lo stesso significato. desiderato.
Nell’Apprendimento Operante Il rinforzo non contingente (NCR) e’ la
usiamo rinforzi e non
ricompense. procedura con la quale si forniscono rinforzi
indipendentemente dal comportamento. L’NCR può
creare impotenza e comportamenti casuali.
L’impotenza, o comportamento impotente, e’ lo stato con cui si definisce il
comportamento di un animale che non associa le conseguenze di quest’ultimo
presumendo che le stesse siano randomiche.
Il comportamento casuale e’ quel comportamento che e’ erroneamente associato
dall’animale senza essere elicitato da alcuno stimolo.
Abbiamo parlato di programma di rinforzi, ma abbiamo anche inserito le punizioni in
differenti programmi. Ad ogni modo, finché l’obiettivo delle punizioni resta quello di
decrementare la frequenza di un particolare comportamento, auspicabilmente
riducendolo a zero, le punizioni dovranno essere inserite nella programmazione di
rinforzi continua.

27
CAPITOLO 6 : PROCEDURE OPERANTI AVANZATE

Il modellamento del comportamento


Riepilogo del Capitolo (shaping) e’ una procedura utilizzata nel
Il Modellamento del condizionamento operante che include rinforzi
comportamento (shaping) e’
la procedura con la quale vengono successivi che vengono adeguati di volta in volta fino
rinforzati comportamenti che, per
successiva approssimazione, al raggiungimento del comportamento desiderato. La
conducono al comportamento
desiderato. maggior parte dei comportamenti che vogliamo
Il Concatenamento in avanti o ottenere sono abbastanza complicati, oppure
quello retrogrado sono due
tecniche di concatenamento che richiedono un alto grado di precisione nell’esecuzione
possiamo utilizzare.
degli stessi; questo rende impossibile per noi e per
Nella Estinzione Pavloviana
presentiamo ripetutamente uno l’animale che addestriamo raggiungere un risultato
stimolo condizionato (CS) senza
uno stimolo incondizionato (US). ottimale con immediatezza. Per tali ragioni dobbiamo
Nella Estinzione Operante seguire una procedura nella quale ci avviciniamo man
sottraiamo il rinforzo che
mantiene il comportamento. mano al nostro obiettivo finale e’ questo viene definito
Il Dimenticare (o la rimozione) modellamento (shaping).
e’ il deterioramento di
comportamenti appresi Quando modelliamo un comportamento, rinforziamo
conseguente ad un periodo nel
quale questi non vengono messi in
la versione del comportamento che e’ più vicina al
pratica.
nostro obiettivo e non andremo a rinforzare, invece,
comportamenti dei quali l’animale ci ha mostrato
versioni migliori. Più ci avvicineremo al nostro obiettivo finale, maggiori saranno le
difficoltà di ottenere un miglioramento della performance. Il nostro obiettivo per la
versione di comportamento da rafforzare potrebbe perciò essere meno ambiziosa.
Una catena di comportamenti e’ una sequenza di comportamenti connessi l’un
l’altro. Il concatenamento e’ il processo di addestramento con il quale addestriamo
un animale a produrre una catena di comportamenti.
Tutti noi ci riferiamo ai comportamenti come formati da una catena, non ad un
singolo comportamento; il comportamento della caccia, per esempio, consiste di una
catena formata dalla ricerca, dall’inseguimento, dall’uccisione e dal cibarsi della
preda. Ognuno dei citati elementi e’, in se stesso, una catena. In una catena di
comportamenti, l’animale deve eseguire tutti gli elementi della stessa in maniera
ordinata; ciascun elemento deve venire prima di un altro e dopo un altro.
Quando insegniamo ad un animale ad eseguire un comportamento concatenato,
dobbiamo, come prima cosa, suddividere l’esercizio in vari criteri facendo, ad

28
esempio, un analisi dell’obiettivo che ci proponiamo di raggiungere. Potremo quindi
iniziare, esercitando particolari criteri o rinforzando le performance ottenute nei link
eseguiti nel giusto ordine. Ci sono due modi per mettere insieme tutti i criteri in
catena: il concatenamento in avanti ed il concatenamento retrogrado.
Il Concatenamento in avanti e’ la procedura addestrativa nella quale
l’addestramento inizia con il primo anello della catena e prosegue aggiungendo, man
mano, altri seguenti anelli della catena addestrativa nell’ordine prescelto (da
anteriore a posteriore). Questa e’ la procedura maggiormente seguita
nell’addestramento degli animali probabilmente perché implica un ordine
sequenziale di comportamenti più aderente alla percezione della mente umana.
Esempio: Quando insegno ad un cane il riporto, inizio: (1) con il cane seduto alla mia
sinistra, (2) a correre a prendere il dummy dopo aver ricevuto il segnale (3) a
raccogliere il dummy dal terreno e tenerlo in bocca (4) a tornare da noi con il dummy
e sedersi in posizione di “piede” mantenendo in
bocca il dummy e (5) a lasciare il dummy dopo aver Il rinforzo del
concatenamento
ricevuto un segnale appropriato.
Un comportamento a catena
Il Concatenamento retrogrado e’ la procedura consiste di diversi comportamenti
o collegamenti (anelli di una
addestrativa nella quale l’addestramento inizia con catena) che normalmente devono
essere eseguiti in un determinato
l’ultimo anello della catena e prosegue aggiungendo, ordine e non in maniera
randomica. Ciascun anello
man mano, gli anelli precedenti della catena conduce a quello successivo della
catena. Il completamento con
nell’ordine prescelto (da posteriore ad anteriore). Il successo di un anello apre la
possibilità di cimentarsi nel
concatenamento retrogrado ha alcuni vantaggi in successivo. Ciò significa il
completamento con successo di un
quanto il primo criterio in ogni sessione e’ sempre il anello e’ rinforzato dalla
possibilità di cimentarsi nel
più difficile. I criteri sub seguenti nella catena sono successivo arrivando sempre più
vicino al completamento finale. E’
stati esercitati ripetutamente in precedenza e in questo modo che gli animali si
cimentano in catene di
l’animale li esegue con soddisfacente grado di abilità. comportamento complesso come
ad esempio la caccia. In situazioni
I criteri sub seguenti svolgono in tal senso funzione di di addestramento artificialmente
create da noi, il fine ultimo (lo
rinforzo a quelli seguenti. scopo terminale della catena) non
e’ particolarmente appagante (e
Esempio: Quando insegno al cane il riporto procedo rinforzante) per l’animale. Per tale
ragione il concatenamento
quindi cosi: (5) tengo il cane al piede con in bocca il retrogrado funziona cosi bene. Un
nuovo comportamento conduce a
riportello che dovrà rilasciare non appena riceverà quello successivo che funziona da
rinforzo poiché e’ stato già provato
l’ordine appropriato, (4) lo faccio tornare da noi con ed e’ conosciuto dall’animale.
il dummy e assumere la posizione di “piede”
mantenendo in bocca il dummy, (3) dovrà

29
raccogliere il dummy dal terreno e tenerlo in bocca, (2) dovrà correre a prendere il
dummy dopo aver ricevuto il segnale, (1) dovrà stare seduto alla mia sinistra nella
posizione di piede in attesa del segnale porta.
Il concatenamento retrogrado non richiede che il cane esegua la sequenza in ordine
inverso, aggiunge solo un anello alla catena di comportamenti richiesti nell’ordine
inverso pur se l’animale eseguirà la catena di comportamenti nel giusto ordine.
L’estinzione ha due differenti significati che possono essere confusi.
L’estinzione nel condizionamento Pavloviano e’ la procedura con la quale
presentiamo ripetutamente un CS (stimolo condizionato) senza US (stimoli
incondizionati).
Esempio 1 : Facciamo suonare la campanella ripetutamente (CS) senza far vedere il
cibo (US) allo stesso tempo: questo potrebbe estinguere la salivazione (CR – riflesso
condizionato) ed il suono della campanella (CS). Il suono della campanella inizia ad
essere uno stimolo neutro oppure un non-stimolo.
Esempio 2: Dopo aver stabilito l’associazione tra il suono del clicker (CS) ed il cibo
(US), se clicchiamo ripetutamente senza associare ad esso del cibo dopo un certo
tempo il click cesserà la sua funzione di rinforzo condizionato.
L’estinzione nel condizionamento operante e’ la procedura con la quale
sottraiamo i rinforzi che mantengono un certo comportamento.
Esempio : Se io non rinforzo il comportamento di un cane nell’indicare la cocaina per
un lungo periodo, questo comportamento andrà in estinzione (il cane smetterà di
indicare la cocaina).
I comportamenti appresi (che si identificano con quelli precedentemente rinforzati),
sono a volte difficili da estinguere. Potremmo osservare un incremento in un
comportamento in estinzione, una esplosione dell’estinzione. A volte il processo
di estinzione potrebbe causare scoppi d’ira emozionali e specialmente comportamenti
aggressivi. Un ratto che normalmente premendo la leva otteneva del cibo, potrebbe
mordere la leva stessa, un altro ratto o perfino l’addestratore. Un altro problema
dell’estinzione e’ che il comportamento decrementa lentamente.
Un ulteriore problema legato all’estinzione si verifica quando non tutti i rinforzi che
mantengono il comportamento sono sotto il controllo dell’addestratore.
L’estinzione e’ di norma sicura ed efficace ed e’ un’ottima alternativa alle
punizioni quando funziona. Un’altra alternativa per estinguere un comportamento e’
la combinazione tra una rigorosa procedura di estinzione con rinforzi differenziati.

30
Anche il dimenticare (rimuovere) implica che l’animale cessi di mostrare un
comportamento, ma per ragioni differenti di quelle che hanno suggerito l’estinzione.
Il dimenticare (rimuovere) e’ il deterioramento
dei comportamenti appresi quando questi non sono
Le variabili del dimenticare
messi in pratica per un lungo periodo. Il
C’e’ una stretta correlazione tra la
“dimenticare” avviene quando un cane non ha lunghezza dell’intervallo di
tempo nel quale non viene
l’opportunità di mostrare un determinato richiamato il comportamento ed il
dimenticare (rimuovere). Il tempo
comportamento per un lungo periodo di tempo. però e’ una variabile, non un evento;
cosi il tempo, da solo, non fa nulla.
Esempio: Se non do ad un cane la possibilità di Ciò che può causare la rimozione
sono gli eventi che intercorrono tra
scoprire ed identificare della cocaina per un certo l’apprendimento ed il momento in cui
desideriamo richiamare il
periodo, il cane cesserà di indicare la presenza della comportamento insegnato.
Le caratteristiche individuali cosi
stessa. come i fattori genetici possono
giocare un ruolo nella capacità di
La quantità di sessioni addestrative utilizzate per mantenere un’abilita’. La rilevanza
del contesto e’ certamente un fattore
insegnare un comportamento può influire sulla importante nella rimozione.
L’apprendimento avviene sempre in
rimozione, il sovrapprendimento riduce questo un contesto caratterizzato da stimoli
che hanno funzione di indici.
rischio. Potremmo aspettarci che l’animale
ricordi comportamenti che hanno
Il dimenticare (rimuovere) incrementa con la tratto sulle funzioni vitali piuttosto
che comportamenti meno rilevanti.
lunghezza del tempo nel quale non viene richiamato
La quantità di sessioni
il comportamento, ma il tempo non e’ da solo la addestrative utilizzate per
insegnare un comportamento può
causa della rimozione comportamentale. Quanto sia influire sulla rimozione, il
sovrapprendimento riduce questo
lungo questo tempo senza mostrare il rischio.
Il mantenimento del comportamento
comportamento finché non interviene la rimozione e’ anche influenzato dal conflitto
tra gli insegnamenti appresi
dipende da molti fattori: dall’individuo, precedentemente e quelli
successivi.
dall’importanza che riveste il comportamento stesso
per l’animale (in un contesto di naturalezza del
comportamento legato alla specie), dal grado di consolidamento del comportamento
(numero delle sessioni addestrative cui e’ stato sottoposto nell’apprendimento),
competizione con altri comportamenti correlati (appresi cioè prima o dopo),
cambiamenti contestuali.
C’e’ una terza via per far cessare ad un animale un determinato comportamento. La
prevenzione della risposta consiste nell’alterazione dell’ambiente finalizzato a
prevenire l’occasione di mostrare un determinato comportamento.
Esempio: Prevenire l’accesso del cane in posti dove potrebbe trovare scarpe da
mordere o, in alternativa, rimuovere le scarpe da ogni luogo dove il cane ha accesso.

31
CAPITOLO 7 : IL PIANO DI AZIONE (POA)

Riepilogo del Capitolo


I buoni addestratori pongono particolare attenzione
Fallire la pianificazione
equivale a pianificare il
nell’implementazione di ottimi piani di azione
fallimento.
(POA). Un buon POA fornisce all’addestratore delle
L’addestramento degli animali chiare linee guida, ma anche un’adeguata flessibilità
richiede un buon piano d’azione.
finalizzata ad aggirare i problemi che inevitabilmente
Un Piano di Azione richiede
preparazione. sorgono.
Un Obiettivo desiderato di
apprendimento e’ un traguardo
che dobbiamo definire Preparazione
chiaramente.
Quando si addestrano degli animali, dobbiamo
Non date nulla per scontato,
misurate ogni cosa. essere in grado di tracciare il nostro piano di azione.
Sia l’esperienza che le conoscenze acquisite
contribuiscono in maniera rilevante al successo
dell’operazione, ma una buona pianificazione e’ di certo un fattore chiave
determinante. Nessuna problema legato alla conoscenza e all’esperienza acquisita,
può essere risolto senza una adeguata preparazione: ciò porterebbe,
inevitabilmente, a fallire o ad ottenere risultati mediocri.
Un POA, a prescindere dal contesto, possa esso essere riferito alla propria carriera,
ad un evento sportivo o ad un lavoro di costruzione, deve includere come minimo i
seguenti contenuti :

1. Uno scopo ben definito ;


2. Una lista delle risorse umane ritenute necessarie ;
3. Una lista delle risorse materiali necessarie ;
4. Un programma ben definito dei successivi step di azione ;
5. Una lista di step di azione alternativa ;
6. Un criterio di determinazione dei risultati conseguiti in ciascuno step ;
7. Un calendario ;
8. Un registro per le annotazioni ;
9. Un budget di spesa;
10. Stato d’animo.
Nota bene : Sbagliare la pianificazione significa pianificare il
fallimento!
32
1. Scopo
Non c’e’ problema per quello che farai, ma sarebbe meglio definire, in
principio, lo scopo di quello che vuoi fare, altrimenti stai solo andando a
tentoni. Nessun animale, in natura, agisce a tentoni: in natura lo spreco di
energie e’ una penalità per la quale, alla fine, una animale potrebbe perdere la
sua vita. Una perdita di tempo significa sottrarre
Apprendimento contestuale tempo alla vita. Se non poni un obiettivo (uno
Tutto ciò che e’ appreso avviene scopo) al tuo addestramento, stai facendo perdere
nell’ambito di uno specifico contesto.
Quando questo contesto comprende tempo prezioso sia alla tua stessa vita che a quella
stimoli di alta intensità o
biologicamente significativi per dell’animale che tenti di addestrare.
l’individuo, l’animale tende ad
associare gli stessi con altri stimoli,
Lo scopo nell’addestramento degli animali può
risposte, e conseguenze di particolari
comportamenti.
essere definito come l’obiettivo formativo
Animali ben addestrati mostrano
spesso performance insufficienti
desiderato (DLO – desired learning objective) e
quando agiscono in ambienti
differenti. Ciò accade a causa
questo deve essere ben chiaro e ben definito.
dell’apprendimento contestuale.
Un buon addestratore e’ sempre
Nessuno dovrebbe sprecare tempo e risorse.
attento agli indici (ingl.:cues)
Sintetizza il tuo DLO in una frase: se non puoi
contestuali che possono pregiudicare
l’addestramento degli animali. Gli farlo in una sola frase o se la stessa risulta troppo
stages iniziali di un addestramento
potrebbero essere svolti in ambienti complessa, dividila in due o più parziali DLO.
nei quali sia possibile evitare ogni e
qualunque indice. Negli stages
successivi, l’addestratore potra’
introdurre degli indici irrilevanti Nota bene: se non hai un DLO sei uno che
mantenendo la risposta
comportamentale dell’animale ama sprecare il proprio tempo.
attraverso la presentazione di stimoli
desiderati.

2. Risorse Umane
Devi identificare quali persone ti sono necessarie per raggiungere lo scopo
prefissato dal progetto in questione, scegliendolo sulla base della esperienza e
delle conoscenze di cui dispongono. Se dai il via al progetto con persone che
dispongono solo parzialmente delle necessarie caratteristiche, otterrai un
risultato parziale. Se tu stesso non hai le necessarie conoscenze per portare a
compimento il progetto con successo, dovrai cercare di acquisire le necessarie
informazioni, conoscenze ed esperienze prima di iniziare.

Nota bene: Non sei un buon professionista se inizi un progetto per


il quale non sei pienamente qualificato.

33
3. Risorse materiali e budget (9)
Il POA (Piano di Azione) per l’addestramento degli animali non deve tener
conto necessariamente di tutti i punti in argomento (materiali, risorse e
budget). La pianificazione del budget potrebbe essere superflua se
l’addestramento in questione fosse parte di un progetto più ampio per il quale
siano state già stanziate delle risorse economiche. Nonostante ciò non
sottovalutate mai l’importanza del budget quando vi imbarcate in progetti più
ambiziosi o che richiedano un addestramento speciale. Per esempio, il
progetto “Camrat” (addestramento di ratti per missioni di ricerca e recupero)
richiese un proprio budget per l’acquisizione delle necessarie risorse (scenario
addestramento, pacchetti di recupero, videocamere, GPS, etc.) poiché le stesse
erano molto costose.
Un equipaggiamento scarso conduce a risultati scarsi, come detto già per la
pianificazione. Non iniziare un progetto prevedendo uno standard minimo di
equipaggiamenti con la speranza che la minima richiesta fatta possa aiutarti a
riceverne di migliori man mano che il progetto si sviluppa. Potresti
danneggiare il tuo equipaggiamento in maniera irreparabile o perdere parte di
esso per lungo tempo. Per esempio, se pianifichi di addestrare gli animali in
una gabbia automatizzata, condizionando il loro comportamento con un suono
come rinforzo, non partire prima che il suono prodotto corrisponda
esattamente a quello che volevi. Se parti con qualcosa che potrebbe essere
variato in seguito (seppure in senso migliorativo), potresti dover ripartire con l’
addestramento da zero (e probabilmente dover prima estinguere i
comportamenti acquisiti oppure contro-condizionare gli stessi).

Nota bene: L’equipaggiamento può essere buono o cattivo ma


abbastanza buono non dovrebbe esistere nel vocabolario di un
buon addestratore.

4. Gli steps del Piano di Azione (POA)


La maggior parte dei POA consistono di diversi steps, alcuni dei quali più
complicati ed alcuni meno. Dovrete usare principalmente la modellatura
progressiva che significa la ricerca per successiva approssimazione

34
dell’obiettivo finale che vi siete posti (DLO). Tuttavia, dovrete suddividere il
task in differenti steps ed avere ben chiaro e definito il DLO ed i POA per
ciascuno step.
Nota bene: Senza steps di azione realistici non riuscirete a
raggiungere completamente il vostro DLO.

Offuscamento 5. Steps alternativi del POA.


L’Offuscamento e’ il fallimento di Fatta eccezione per alcuni semplici processi,
uno stimolo, parte di uno stimolo
composto, che diventa stimolo niente procede nella vita secondo la linea
condizionato. Lo stimolo quindi
viene offuscato dallo stimolo che programmatica di un piano di base principale.
diviene condizionato.
Possiamo anche dire, in altre parole, Ciò e’ particolarmente riscontrabile nel campo
che lo stimolo che diventa
condizionato blocca lo stimolo che dell’addestramento degli animali come vi potrà
non lo e’.
Forti stimoli offuscano quelli essere confermato da tutti gli addestratori con
deboli.
La caratteristica principale di uno un certo grado di esperienza. Una
stimolo efficace e’ la sua intensità.
L’intensita’ di uno stimolo pianificazione accurata e’ senza dubbio
incondizionato e’ cruciale. Stimoli
forti producono migliori risultati di importante, ma altrettanto importante e’ avere
quelli deboli.
Un buon addestratore sceglie stimoli
almeno un paio di alternative di buon livello. Il
sia condizionati che incondizionati
con grande cura per evitare gli
buon addestratore, a differenza di quello
offuscamenti.
scarso, ha sempre un Piano B ed un Piano C
per superare fatti contingenti. Non avere
alternative al vostro Piano equivarrà a “mettere tutte le uova di cui disponete
in un unico paniere” (nota del traduttore: proverbio inglese qui tradotto
letteralmente. Il corrispettivo in italiano e’ “puntare tutto su una sola carta”).

Nota bene: la fortuna, a volte, e’ avversa sia alla preparazione che


alle opportunità.

6. Criterio per misurare il successo.


Disporre di un POA per ciascuno step significa sapere quando e’ possibile
passare da uno step a quello successivo. Tale criterio e’ definito criterio di
successo o controllo di qualità (QC – quality control). Per esempio, il criterio
di controllo per il condizionamento con il suono del clicker si ha quando il
cane si gira per 20 volte di fila verso la fonte del cibo (premio) quando ascolta
detto suono. Un buon addestratore deve valutare il reale comportamento del

35
cane e non basarsi su impressioni soggettive. “Penso che il cane reagisca
abbastanza bene al suono del clicker” e’ l’argomentare dell’addestratore scarso
ed una ricetta sicura per il fallimento.
Nota bene: non desumere nulla, accertati di tutto.

7. Calendario (crono programma).


Il crono-programma e’ importante per molteplici aspetti. Per prima cosa, esso
potrebbe intaccare il budget a disposizione ma, cosa più importante, il tempo
potrebbe influenzare decisamente il vostro programma di addestramento. Per
esempio, non servono due settimane per condizionare un cane con il suono del
clicker, cosi se il tempo previsto dal tuo crono programma va in conflitto col
POA hai certamente sbagliato qualcosa. Dovrai quindi cercare di correggere o
l’uno o l’altro (POA o crono programma) o chiedere consiglio ad un
addestratore più esperto.
Nota bene: Il crono programma e’ uno strumento per misurare il
successo.

8. Registro delle annotazioni


Gli addestratori devono sempre tenere un registro delle annotazioni (una sorta
di “diario di bordo”) nel quale annotare tutti i fattori rilevanti riscontrati
durante le loro sessioni addestrative. L’accurato riporto e la conservazione del
registro non sarà solo uno strumento scientifico che consentirà misure e
comparazioni ma anche fonte di informazioni ed ispirazione per le future
sessioni addestrative. Non fidatevi della memoria: consultate quanto scritto
sul registro.
Nota bene: Il Registro delle annotazioni e’ uno strumento
scientifico.

9. Budget.
Vedi quanto detto al punto 3.

10. Lo stato d’animo.


Quando addestri un animale, devi essere focalizzato completamente su di lui,
su te stesso e su quello che stai facendo. Se la tua mente e’ altrove, se sei

36
preoccupato per qualcosa d’altro o se sei nervoso (arrabbiato) non riuscirai a
raggiungere l’obiettivo che ti eri prefissato e stresserai, inutilmente, sia te
stesso che l’animale. Quando addestri conti solo tu e l’animale che stai
addestrando, libera la tua mente da qualsiasi altro pensiero. Se ti accorgi di
non essere nella condizione descritta, fermati, prenditi una pausa e riprendi
successivamente.
Nota bene: Devi essere nel posto giusto nel momento giusto.

Dygtig

All’inizio, non c’e’ problema con il suono che utilizzate come rinforzo condizionato. Tuttavia, proprio perché si
tratta di un rinforzo condizionato, necessita per accezione di essere condizionato.
Studi condotti hanno dimostrato che alcuni suoni sono migliori per alcuni scopi rispetto ad altri.
Per un evento più fortunato che compreso e voluto, e per il quale non erano stati condotti studi all’epoca, due suoni
hanno dimostrato di essere idonei come rinforzi: il suono del clicker ed il suono della parola dygtig.
Dygtig e’ una parola Danese che significa bravo (venne introdotta nell’addestramento degli animali dall’autore di
questo libro alla fine degli anni ’70). Il suo significato non e’ cosi importante in questo contesto; il fatto rilevante e’ che
il suono prodotto da questa parola ha le caratteristiche per essere recepito come un buon rinforzo dall’animale.
Dygtig, al pari del suono del clicker, deve essere condizionato ma si differenzia da quel suono poiché e’ emesso da un
essere umano. Nell’addestramento di animali sociali, come ad esempio cani e cavalli, Dygtig e’ più un rinforzo semi-
condizionato piuttosto che totalmente condizionato. L’accettazione, la sensazione di sicurezza sono rinforzi primari
per gli animali sociali e dygtig e’ immediatamente associato ad uno di essi.
Il suono del clicker non ha le stesse caratteristiche essendo un suono puramente meccanico; ciò nonostante e’ più
accurato e migliore per alcuni scopi.

Nell’addestramento degli animali, un Piano di Azione (POA – Plan of action) e’ un


programma che prevede uno o più steps primari di azione (PRS) ed un chiaro e ben
definito Obiettivo di apprendimento desiderato (DLO).
Per tracciare un POA dobbiamo definire un DLO ed avere una lista di segnali,
comportamenti e conseguenze (Toolbox).

Un obiettivo desiderato di apprendimento (DLO) e’ un traguardo. Il DLO deve


essere definito chiaramente.
Esempio 1: Voglio che il cane mi guardi e sieda
Esempio 2: Voglio che il ratto mantenga il naso nel buco contenente TNT per 3
secondi
Esempio 3: voglio che il cavallo indietreggi di tre passi
Dobbiamo necessariamente definire i termini come “Sit” nella nostra lista di segnali
ma non necessariamente nel nostro DLO.

37
Una Toolbox e’ una lista nella quale sono elencati tutti i segnali, i comportamenti e
le conseguenze che desideriamo conseguire con il nostro DLO.
E’ uno strumento dell’addestratore che contiene tutto ciò che gli serve.
Esempio di un segnale: Sit significa “metti il sedere a terra e tienilo li finche’ non
arriva un nuovo segnale”.
Ricordatevi che i segnali devono essere definiti chiaramente, non solo per quanto
attiene alla loro forma ma anche per quanto ha tratto col loro significato.
Ciascuno step primario (PRS) e’ una componente di un POA. Esso deve indicare
come minimo un segnale che implica un comportamento.
Esempio di un PRS : “Sit” implica che il cane “metta il sedere a terra”.
Quando indichiamo piu’ di un segnale significa che daremo tutti i segnali
simultaneamente; questo e’ di particolare importanza quando utilizzeremo differenti
forme per lo stesso segnale.
Esempio: Dico “Sit” ed utilizzo il movimento della mano per accompagnare seduto il
mio cane.
Utilizzando più segnali simultaneamente nel POA dovremo riportare per primi
quelli che ci aspettiamo essere i più difficili ed alla fine quelli che riteniamo
più semplici, di norma gli Sγ .
Esempio: “Dico Sit” , “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa”.
In un PRD, dopo uno o più segnali, dovete indicare il comportamento
voluto.
Esempio: “Dico Sit” , “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa” implica “Il cane si siede”.
Ogni PRS deve terminare sia con un rinforzo che con un comportamento
con due eccezioni. In un programma di apprendimento, la prima prova di uno
specifico PRS deve terminare sempre con uno o più rinforzi come nel seguente
esempio 1 :
Esempio 1 : “Dico Sit”, “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa” implica “Il cane si siede”.
Questo a sua volta implica “Dico Dygtig” e “Do al cane un premio”.
Dopo alcune sessioni addestrative con esito positivo, uno specifico PRS potrebbe
terminare con un determinato comportamento a seconda del programma
di rinforzi utilizzato in quella particolare sessione (esempio 2).

38
Esempio 2: “Dico Sit” implica “Il cane si siede”.
Eccezione 1: dopo un SΔ non e’ richiesto alcun rinforzo o
comportamento.
Esempio: “Dico Sit” implica “Il cane si siede” implica “Dico Dygtig”, Aspetto un
momento e “Dico Free”. Free e’ un SΔ poiché indica al cane che il comportamento di
seduto non produrrà più un rinforzo.
Eccezione 2: dopo l’uso di una punizione (normalmente in uno step alternativo
in una catena di comportamenti dove non sono previsti rinforzi alla fine).
Esempio : “Dico Sit” implica “Il cane non siede” implica “Dico Bad” implica “Il cane
siede” (Bad e’ una punizione solo se decrementa la velocità con la quale il cane non
siede dopo aver ricevuto il segnale Sit).
Uno step secondario o alternativo (ALS) e’ un’alternativa al PRS. E’ il nostro
Piano B.
Ogni ALS deve terminare con un comportamento o con un rinforzo.
Esempio di ALS: Il cane non si siede. Ripeto “Sit” implica “il cane siede” implica
“Dico Dygtig” e “Do al cane un premio”.
Possiamo disporre di quanti ALS riteniamo necessari, ma ne dobbiamo utilizzare solo
un massimo di due per ciascun PRS. Un utilizzo di più di due ALS per lo stesso PRS
significa che c’e’ un errore di base (BASIC).
Un errore di base e’ un problema causato da fattori non correlati con il
POA.
Esempio di errore di base: Se, quando chiamo il mio cane, non mi guarda dopo due
ALS, dobbiamo cercare di capire perché questo succede e assumere i necessari
provvedimenti tornando poi, conseguentemente, al nostro POA originale.
L’errore di base e’ spesso una risposta emotiva di paura o aggressività a stimoli
prodotti o in conflitto con altri stimoli più forti ricevuti. Il POA, in se stesso, potrebbe
essere corretto e funzionale ma potrebbe non procedere nella direzione voluta a causa
di queste risposte emotive che devono essere affrontate prima di procedere nella
implementazione del POA. Le risposte emotive spesso sono di origine Pavloviana e
richiedono, per essere cambiate, l’applicazione di procedure di contro-
condizionamento. L’abitudine e la desensibilizzazione possono modificare, e a volte
estinguere, le risposte emotive.

39
Più di due ALS nello stesso PRS possono anche indicare il fallimento del POA sul
quale si sta procedendo impedendo di soddisfare i criteri per il controllo di qualità
richiesto con un ERRORE.
Gli errori sono gli insuccessi nell’ottenere i comportamenti desiderati o attesi
derivanti dall’aver fissato il QC dei precedenti POA a livello troppo basso, o per averli
considerati superati pur non avendo risposto appieno ai requisiti degli stessi.
Per esempio, se il click e’ usato come rinforzo in un POA, dobbiamo assicurarci che il
condizionamento sia avvenuto e che l’animale risponda appieno ed in maniera
affidabile allo stesso. Se l’animale non risponde in maniera appropriata non possiamo
aspettarci che lo stesso rinforzo sia utilizzabile nei sub-seguenti POA. L’unica
soluzione che ci resta e’ quella di tornare al POA nel quale abbiamo insegnato
all’animale a rispondere a questo particolare stimolo ed incrementare il QC. Solo
quando il nuovo QC sarà raggiunto potremo passare al seguente POA.
Questo e’ un errore molto comune nell’addestramento degli animali. Gli addestratori
passano troppo speditamente al passo successivo senza curarsi che l’animale abbia
ben appreso un segnale. Il QC e’ difficile da determinare: non deve essere ne’ troppo
semplice, il che non garantirebbe che l’animale abbia realmente acquisito il
comportamento voluto, ne’ troppo complesso (o virtualmente impossibile) da
raggiungere poiché in questo caso condurrebbe ad una rinuncia sia da parte
dell’animale che dell’addestratore.
Il seguente esempio mostra un POA molto semplice. In esso non sono contenuti steps
alternativi (proprio per la sua semplicità) ma include una sezione dedicata alla
soluzione dei problemi più comuni che sorgono durante una sessione addestrativa ed
a come risolverli.

Esempio di un POA

DLO: Condizionare l’associazione tra il suono del clicker e la ricompensa


(premio).

QC : Un comportamento 1 che mostri chiaramente che l’associazione e’ stata


creata ed e’ stabilmente fissata nell’animale.

1
Per esempio il cane torna alla fonte del suono del clicker anche quando e’ sazio.

40
Toolbox:
 Il suono di un clicker2 (non-stimolo che deve essere condizionato);
 Ricompensa (rinforzo positivo incondizionato)3

POA:

PRS1. (Il cane cammina liberamente). {Quando il cane si avvicina


all’addestratore, cliccare e dare immediatamente la ricompensa (sequenza
veloce come se si pronunciasse un “1-2”)}.

QC : Per 20 volte di seguito, quando sente il click il cane si gira e torna da me


per ricevere la ricompensa.
Registro Diario:
Annotare il risultato di ciascuna sessione

Problemi e Soluzioni
D: il cane non vuole mangiare. Cosa fare?
R: Aspetta finché il cane non sia affamato. Non addestrare mai un cane sazio.
Usa una parte della sua razione di cibo giornaliera per le sessioni addestrative.

D: Il cane non sente il click. Cosa fare?


R: Il cane sente il click e anche molto bene. Il problema sta nel fatto che non
lo associa a nessun particolare evento. Clicca quando il cane ti sta guardando
ed e’ vicino a te e premialo immediatamente. Ripeti questa operazione
fintantoché non osservi che il cane inizia ad associare il click alla ricompensa.

D: Il cane non e’ concentrato. Cosa devo fare?

2
Durante le prove iniziali riscontreremo un non-stimolo del suono del clicker (alcuni autori lo definiscono uno
stimolo neutrale) che non e’ ancora uno stimolo condizionante. Poiché la ricompensa in cibo ha la caratteristica
di stimolo primario ed incondizionato, dopo diverse ripetizioni creeremmo una associazione tra i due stimoli. A
quel punto il suono del clicker diventa uno stimolo condizionato, che può essere utilizzato come rinforzo
condizionato. Questa semplice associazione deve essere mantenuta nello stesso ordine per evitare l’estinzione.
3
La ricompensa in cibo deve avere consistenza e non deve essere molto grande per consentire una facile e
rapida consumazione.

41
R: Due sono le cose: o il cane non e’ affamato (quindi vedi prima domanda e
risposta qui sopra) o non sa che hai delle ricompense. Mostragli le ricompense
e nascondile immediatamente. Poi clicca e premialo.

D: Quando il cane mi guarda, aspetta solo il click ed il premio conseguente.


Non fa nulla. Cosa devo fare?
R: Hai cliccato troppe volte quando il cane era vicino a te piuttosto che
attendere che si allontanasse. Devi diventare parte contestuale
dell’associazione. Non cliccare appena il cane ti guarda, aspetta che il cane si
allontani. Continua ma fai attenzione a cambiare il modello della situazione.

Il POA descritto e’ solo un esempio di come pianificare ed eseguire


l’addestramento ad una risposta. Dovrai approntare un POA per ciascun altra
risposta che vuoi insegnare al cane.

42
Bibliografia ed altre letture suggerite

Abrantes, R. (1997) The Evolution of Canine Social Behavior.


Wakan Tanka Publishers.
Abrantes, R. (1997) Dog Language. Wakan Tanka Publishers.
Budiansky, S. (1997) The Nature of Horses. The Free Press. (April
8, 1997)
Case, L. P. (2003) The Cat: Its Behavior, Nutrition and Health.
Wiley-Blackwell.
Case, L. P. (2005) The Dog: Its Behavior, Nutrition and Health.
Wiley-Blackwell.
Catania, A. C. (1997) Learning. Upper Saddle River, NJ: Prentice-
Hall. 4th ed.
Chance, P. (2008) Learning and Behavior. Wadsworth -- Thomson
Learning, Belmont, CA, 6th, ed.
Copi, I. M. and Cohen, C. (2010) Introduction to Logic. Prentice
Hall. 14th ed.
Darwin, C. (1872) The Expressions of the Emotions in Man and
Animals. John Murray (the original edition).
Darwin, C. (1859) On the origin of species by means of natural
selection, or the preservation of favoured races in the struggle for
life. London: John Murray. 1st ed.
Dawkins, R. (2006) The Selfish Gene. Oxford University Press,
USA.
Dennett, D. C. (1996) Darwin's Dangerous Idea: Evolution and the
Meanings of Life. Simon & Schuster.
Lorenz, K. (1963) Das sogenannte Böse. Zur Naturgeschichte der
Agression. Deutscher Taschenbuch Verlag GmbH & Co. KG,
München. edition 1998.
Lorenz, K. (1966) On Aggression. Mariner Books. edition 1974.
Lorenz, K. (1986) Evolution and Modification of Behavior.
University of Chicago Press, Chicago, IL.
Maynard Smith, John and David Harper (2003) Animal signals.
Oxford University Press, UK.
McFarland, D. (1982) The Oxford Companion to Animal
Behaviour. Oxford University Press, Oxford.
McFarland, D. (1998) Animal Behaviour. Benjamin Cummings. 3rd ed.

43
Mech, L. D. (1981) The wolf: the ecology and behavior of an
endangered species. University of Minnesota Press.
Pavlov, I. P. (2003) Conditioned reflexes. (G. V. Anrep, Ed. and
Trans.) Dover Publications.
Pinker, S. (1997) How the Mind Works. W. W. Norton & Company,
New York. edition 2009.
Rachels, J. (1990) Created From Animals. Oxford University Press,
USA. edition 1999.
Ridley, Mark. (2004) Evolution. Oxford University Press, USA.
Ruse, M. (1986) Taking Darwin Seriously: A Naturalistic Approach
to Philosophy. Prometheus Books. edition 1998.
Scott, J. P. and Fuller, J. L. (1998) Genetics and the Social Behavior
of the Dog. University of Chicago Press.
Skinner, B. F. (1938) The behavior of organisms: An experimental
analysis. Prentice Hall
Tinbergen, N. (2006) Social Behavior in Animals. Agrobios India.
Von Frisch, K. (1993) The Dance Language and Orientation of
Bees. (Translatated by L.E. Chadwick) Harvard University Press,
Cambridge, Massachusetts.
Wilson, E. O. (1975) Sociobiology: The New Synthesis. Belknap
Press of Harvard University Press, Cambridge, Mass (New Edition
2000)
Zimen, Erik (1981) The Wolf: His Place in the Natural World.
Souvenir Press.

44
Links (in Inglese)

You are welcome to visit the following sites for more information about animal behavior and training,
books, videos, articles, and educational programs.
Ethology Institute Cambridge the page of the Ethology Institute Cambridge offering courses and study
resources.
Roger Abrantes blog site the personal page of the author offering blogs, articles and books free for all to
read online.
Roger Abrantes on Facebook the page where you can follow the author and get the latest updates.
Roger Abrantes on Twitter the easiest way to follow the author.

For more books by this author, please visit Dogwise Publishing.

45
L’apprendimento degli animali e’ la scienza che studia come
gli animali imparano i vari comportamenti che mostrano

L’apprendimento degli animali e’ la scienza che studia come gli animali imparano i vari
comportamenti che mostrano. Un buon addestratore disegna dei buoni piani di azione. A
buon piano di azione fornisce all’addestratore un orientamento sicuro ma anche una
sufficiente flessibilità per aggirare ogni problema che, inevitabilmente, affiora. Per fare
questo, avete bisogno di solide fondamenta nella teoria dell’apprendimento animale. Questo
e’ un piccolo libro che vi fornirà i principi di base necessari per trasformare le vostre sessioni
addestrative in esercitazioni di scienza applicata ed arte ispirata, al posto di congetture.

“Le vostre sessioni addestrative saranno sicuramente più gratificanti sia per voi che per il
vostro animale se avrete maggiore coscienza e conoscenza di ciò che state facendo” – Roger
Abrantes

Animal Learning
di Roger Abrantes

Tratto da
Animal Trainers
Handbook
Edito da Roger Abrantes

Wakan Janka Publishers 2014

46

Potrebbero piacerti anche