Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
di Roger Abrantes
2
L’Apprendimento degli Animali
di Roger Abrantes
Tratto da
TUTTI I DIRITTI RISERVATI. Il contenuto di questo libro e’ protetto dalle Leggi e Trattati
Internazionali sul Copyright. E’ proibita qualsiasi ristampa non autorizzata o uso del presente
materiale. E’ vietata la riproduzione anche se parziale di questo libro, cosi come ne e’ vietata la
trasmissione in ogni forma o con qualsiasi mezzo, sia elettronico che meccanico, incluse la
fotocopiatura, la registrazione o anche la conservazione su qualsiasi mezzo di archiviazione e recupero
dati senza espressa autorizzazione scritta dell’autore/editore.
3
INDICE
Prefazione pag.
4
Prefazione
Questo opuscolo e’ tratto da un capitolo del mio libro “Animal Trainers Handbook” e potreste
trovare in esso sporadici riferimenti ad altri Capitoli o Sezioni dello stesso. Alcuni di questi
capitoli e sezioni sono stati anche pubblicati separatamente, come questo opuscolo. Potrete
trovare questi opuscoli nel sito web dell’Istituro Etologico di Cambridge all’indirizzo
www.ethology.eu :
“Evolution – An Introduction” by Roger Abrantes ;
“Animal Welfare” by Anabela Pinto-Poulton ;
“EFR for Animals” by Maria J.Cunha ;
“Think Out Of the Box – A guide to an open and critical mind” by Roger Abrantes;
“Anatomy and Physiology” By Alessandra Bouquet ;
“Animal Learning” by Roger Abrantes ;
“Ethology” by Roger Abrantes ;
“Measuring Behavior” by Roger Abrantes ;
“Animal Training” by Roger Abrantes ;
“Mission SMAF” by Roger Abrantes.
L’apprendimento degli animali e’ la scienza che studia come gli animali imparano i vari
comportamenti che mostrano. Un buon addestratore traccia dei buoni piani di azione. Un
buon piano di azione fornisce all’addestratore un orientamento sicuro ma anche una
sufficiente flessibilità per aggirare ogni problema che, inevitabilmente, affiora. Per fare
questo, avete bisogno di solide fondamenta nella teoria dell’apprendimento animale. Questo
piccolo libro vi fornirà i principi di base necessari per trasformare le vostre sessioni
addestrative in esercitazioni di scienza applicata ed arte ispirata, al posto di congetture.
Le vostre sessioni addestrative saranno sicuramente più gratificanti sia per voi che per il
vostro animale se avrete maggiore coscienza e conoscenza di ciò che state facendo.
5
CAPITOLO 1 : L’APPRENDIMENTO
L’apprendimento e’ un
comporta un cambio del comportamento indotto dalle
cambiamento del
comportamento.
conseguenze dello stesso.
Dobbiamo distinguere tra cambi nel normale corso dei
Nel condizionamento
classico, l’associazione tra due comportamenti che derivano da fattori motivazionali e
diversi stimoli, uno condizionato
ed uno incondizionato, elicita lo quelli che derivano dall’apprendimento. Ad esempio,
stesso comportamento che
diventa condizionato. se un predatore lascia passare una preda senza
Nel condizionamento assalirla, potrebbe dipendere dal fatto che, in quel
operante, uno stimolo
incrementa la frequenza di un momento, non e’ affamato. Differentemente, potrebbe
comportamento quando
rinforzato e la diminuisce quando ignorare la preda a causa di una recente esperienza di
punito.
insuccesso nella caccia a quel tipo di preda, ed in
questo caso si parla di apprendimento.
L’apprendimento sembra essere la capacità di mettere in connessione almeno due
esperienze pregresse come causa ed effetto o, in altre parole, comportamento e
conseguenze. Cosi come nel condizionamento classico, stimolo e risposta sono
connessi, nel condizionamento operante ad essere connessi sono stimoli e
rinforzi o punizioni. Sequenze comportamentali complesse richiedono grandissima
motivazione ed abilità per essere associate. Possiamo insegnare ad un cane a sdraiarsi
per riflesso (condizionamento classico) oppure rinforzando l’azione
(condizionamento operante) ma, per insegnargli il riporto abbiamo la necessità di
una lunga serie di rinforzi che ci conducano, attraverso diverse fasi, al nostro
obiettivo finale (modellamento del comportamento o, in inglese, shaping).
L’associazione, come ad esempio la capacità di mettere in connessione due
differenti esperienze (come causa ed effetto), la memoria e la motivazione sono
condizioni necessarie per l’apprendimento in tutte le forme di vita complesse.
E’ attraverso il primo contatto con il mondo esterno che il neonato acquisisce
conoscenze di vita che, più tardi, faranno la differenza tra la vita e la morte. Imparare
che l’acqua e’ bagnata, il fuoco scotta, che il contatto con oggetti duri provoca dolore,
che qualcosa ha un gusto delizioso e qualcosa altro non lo ha, sono un insieme di
informazioni che vengono acquisite attraverso il contatto con il mondo esterno.
6
Gli animali giovani si impegnano in varie attività ed esplorano situazioni sconosciute
poiché gli stessi non ne conoscono il probabile esito : non hanno esperienza sulle
conseguenze del loro comportamento. La loro
curiosità li guida all’esplorazione, nonostante la Cos’e il comportamento?
titubanza legata alla loro innata paura, mentre la L’apprendimento puo’ cambiare un
comportamento, ma non tutti i
pronta reazione a tutto ciò che può ucciderli o cambiamenti sono conseguenti
all’apprendimento. I cambiamenti del
ferirli frena il loro atteggiamento di curiosità. comportamento dovuti all’età’
(maturazione), traumi, droghe o
Una relazione ben bilanciata tra questi due fattori malattie non sono classificate tra quelli
conseguenti all’apprendimento.
pone nella giusta dimensione l’apprendimento
Il comportamento e’ tutto ciò che un
avanzato. E’ la prima cosa che i cuccioli animale mostra. Ciò nonostante, dal
punto di vista scientifico, necessitiamo
apprendono se vogliono sperare di sopravvivere. di una definizione operativa del
comportamento. Da questo ne deriva
La curiosità nei giovani animali rappresenta la che il comportamento e’ qualsiasi
cosa che l’individuo mostra che e’
motivazione. possibile per noi misurare.
7
Gli animali mostrano differenti livelli di apprendimento e la selezione naturale ha
favorito differenti strategie. Alcune specie mostrano un comportamento, o una serie
di comportamenti, immediatamente dopo essere nati
Aspetti evolutivi o alla schiusura delle uova, ma anche una limitata
dell’apprendimento.
appropriatezza nel cambiare il loro comportamento in
Quando un animale impara, il
suo repertorio comportamentale funzione dei cambiamenti dell’ambiente. Altri si
cambia per sempre. Nonostante
un animale possa estiguere o comportano esattamente al contrario: non mostrano
dimenticare un
comportamento che ha appreso, quasi nulla alla nascita ma mostrano grande capacità
l’animale non tornerà mai al suo
stato precedente. nel rispondere in modo differente al variare
Apparentemente disimparare e’
un inibizione ad imparare ciò dell’ambiente circostante. I primi sono adatti ad un
che si e’ precedentemente
appreso.
ambiente che presenta piccoli cambiamenti periodici
L’apprendimento cambia la
dell’ambiente, mentre i secondi si adattano meglio a
formazione dell’animale ed e’, di
fatto, un cambiamento alla
cambiamenti più veloci e radicali dello stesso. Mentre
propria idoneità (fitness). E’
possibile che le conseguenze
i primi sono maggiormente istintivi i secondi hanno
dell’apprendimento siano
adattative all’incremento della
maggiori capacità di apprendimento.
propria idoneità.
Un comportamento muta solo come risposta ad un
L’idea che l’apprendimento sia di preciso stimolo (comportamento convenzionale)
tipo adattivo e’ stato riconosciuto
sia da diversi psicologi o come risultato delle sue conseguenze
(Thorndike 1911, Seligman 1970)
che etologisti (Lorenz 1965). (comportamento operante).
Un comportamento operante e’ disciplinato dagli
eventi posteriori al suo presentarsi. Il comportamento operante non causa l’evento
posteriore ma precede molto spesso gli stessi.
Il condizionamento classico e’ il procedimento di apprendimento nel quale uno
stimolo incondizionato (e non appreso) si presenta simultaneamente ad uno stimolo
condizionato (appreso) per elicitare una stessa risposta che, per tale motivo, diventa
una risposta condizionata (appresa). Nel condizionamento classico, cosi come Pavlov
lo descrive, accomuniamo la visione del cibo al suono della campanella che elicita la
salivazione; dopo diverse ripetizioni, il suono della campanella, da solo, elicita la
salivazione. Il condizionamento classico e’ anche chiamato condizionamento
Pavloviano oppure condizionamento convenzionale.
Il condizionamento classico si basa sui riflessi. Un riflesso e’ incondizionato quando
uno stimolo, anch’esso incondizionato, elicita una risposta incondizionata. I
riflessi incondizionati non sono appresi; essi sono innati, come ad esempio chiudere
8
gli occhi quando qualcosa si avvicina velocemente agli stessi. Molti riflessi
incondizionati hanno funzioni di salvavita.
Un riflesso condizionato comprende uno stimolo
condizionato che elicita una risposta
Burrhus Frederic Skinner
condizionata. Questa si definisce appresa.
Burrhus Frederic Skinner
(USA, 20 marzo 1904-18 Il condizionamento avviene secondo con le seguenti
Agosto 1990) era uno
Psicologo americano, autore, regole:
inventore, sostenitore di
riforme sociali e poeta. Dal
1. Lo stimolo che si vuole condizionare deve essere
1958, fino al pensionamento
nel 1974, fu professore di
neutro prima di essere condizionato; ad esempio non
Psicologia all’Universita’ di
Harvard. Fu l’inventore della
deve essere associato a nessuna specifica risposta
gabbia di condizionamento
operante (la gabbia di
(tecnicamente, un non-stimolo) ;
Skinner) e sviluppo’ la sua
2. Lo stimolo condizionato deve essere
personale filosofia di scienza
chiamata Behaviourismo contemporaneo a quello incondizionato, o al massimo
Radicale.
appena precedente, ma mai successivo ;
3. Gli stimoli condizionati ed incondizionati devono essere ripetuti più volte
contemporaneamente ;
4. Dopo un periodo nel quale gli stimoli incondizionati e condizionati non
vengono presentati insieme, si rende nuovamente necessario il
condizionamento.
Dobbiamo distinguere tra stimolo e oggetto dello stimolo. Nell’esempio di
Pavlov, lo stimolo e’ il suono e l’oggetto dello stimolo e’ la campanella.
Alcuni addetti ai lavori si riferiscono a stimoli condizionati ed incondizionati e a
risposte o riflessi condizionali o incondizionali. Tale terminologia e’ l’esatta
traduzione dall’originale scritto da Pavlov.
Skinner (1937) introduce una distinzione tra comportamento operante e
comportamento convenzionale. Il comportamento operante e’ un’azione
spontanea che avviene senza uno stimolo evidente, mentre il comportamento
convenzionale include tutti i comportamenti assunti in risposta ad uno stimolo
ben identificabile.
Skinner ritiene che tutti i comportamenti operanti siano stati modificati ed
efficacemente controllati attraverso rinforzi contingenti prevalenti. La filosofia
comportamentale descritta da Skinner provoca una rivoluzione nelle tecniche
sperimentali che hanno una prevalenza anche al giorno d’oggi.
9
Skinner determinò le procedure operanti libere nelle quali consentire agli
animali di indulgere liberamente in varie attività, mentre gli sperimentatori
tentavano di manipolarne le conseguenze.
Il condizionamento operante e’ la forma di
10
CAPITOLO 2 : I SEGNALI
11
comportamento quando questo mostra quel determinato comportamento dopo aver
ricevuto il segnale appropriato.
La forma di un segnale e’ ciò che il ricevente apprende da colui che lo invia. E’ la
forma fisica del segnale. Se e’ vero che non possiamo
12
Gli stimoli discriminativi (SD) hanno caratteristiche differenti e in un processo di
apprendimento e’ utile che sappiamo distinguere tra di essi.
Un SD e’ un segnale (stimolo) che comunica al ricevente che un rinforzo (premio)
potrebbe essere disponibile qualora lui mostri uno
L’utilizzo, spesso errato, del specifico comportamento.
SΔ (S-delta)
Esempio: Ogni qualvolta io dico “seduto” al cane,
Un SΔ (S-delta) e’ un segnale
(stimolo) che comunica al
indico che un rinforzo (premio) potrebbe essere
ricevente che nessun rinforzo sarà
disponibile.
disponibile se e quando lui siederà.
E’ un segnale importante, cosi
come tutti i segnali SD troppo
Un SD non e’ una garanzia che il premio sarà
spesso ignorati, purtroppo, dagli
addestratori di animali.
disponibile. Come mostreremo nel capitolo 4,
Molti, se non tutti gli addestratori
differenti programmi di rinforzo produrranno rinforzi
Inglesi, utilizzano la parola “off”,
“finish”, “end” come SΔ e spesso lo a diverse velocità. Ciò che un SD comunica e’ che un
fanno in maniera randomica senza
insegnarne il significato rinforzo potrebbe essere disponibile. Al primo stadio
all’animale.
L’SΔ dovrebbe essere sempre un di apprendimento i rinforzi saranno disponibili in
distinto e particolare segnale che
l’animale non può confondere. misura maggiore rispetto a quando non saranno
All’Istituto Etologico di
Cambridge, cosi come nel testo di disponibili, anche ogni volta che l’animale produce il
questo libro, noi utilizziamo
Free,sound (la parola inglese Free) comportamento voluto.
e Free,body (voltare le spalle
all’animale) e definiamo questi Un SΔ (S-delta) e’ un segnale (stimolo) che comunica
stimoli con la stessa precisione
con la quale definiamo gli altri al ricevente che nessun rinforzo (ricompensa) sarà
segnali.
In sintesi: siate precisi nell’utilizzo disponibile per nessun particolare comportamento.
di qualsiasi SΔ cosi come per gli
SD.
13
Un Sγ (S-gamma) e’ un segnale (guida) che induce chi lo riceve a mostrare un certo
comportamento. Un Sγ e’ intrinsecamente un SD , specialmente nel caso in cui un SD
e’ facilmente riconducibile dall’animale ad uno specifico comportamento.
Esempio: Quando io tengo in mano una ricompensa e con un movimento all’insù
della mano effettuato di fronte al naso del cane induco il cane a sedersi, sto
presentandogli un rinforzo. Altri esempi sono gli usi diffusi di ricompense attraenti
per il cane, giochi e l’applicazione di compressioni di bassa intensità.
Il termine Sγ e’ utile per indicare il fatto che stiamo usando un SD con una
caratteristica speciale, come ad esempio un aspetto caratteristico particolare
dell’elemento guida di un segnale.
Un segnale (o stimolo) Sπ (S-pi) trasmette al ricevente l’imminenza dell’arrivo di una
punizione (punizione condizionata). In etologia, un Sπ e’ un avvertimento, una
minaccia.
Esempio: Quando dico “Hum” (con un tono di voce basso) al cane, indico allo stesso
che e’ imminente l’arrivo di un inibitore a meno che il cane non mostri (o cessi di
mostrare) uno specifico comportamento.
Un Sπ e’ una punizione condizionata (parleremo delle punizione nel seguente
capitolo 3) ed alcuni potrebbero trovarlo ridondante. Nonostante ciò, il termine e’ di
certo utile quando ci troveremo a pianificare una sessione addestrativa in alcuni
particolari contesti come vedremo più avanti.
Un SD richiede un addestramento preventivo. Ad eccezione del Sγ, che potrebbe
produrre nell’animale il comportamento voluto alla prima volta che viene presentato
all’animale (e questo proprio perché e’ un Sγ), tutti gli altri stimoli richiedono un
certo numero di sessioni addestrative prima che l’animali li associ ad un determinato
comportamento.
14
CAPITOLO 3 : DISCRIMINAZIONE, GENERALIZZAZIONE E
CONTROLLO DELLO STIMOLO
15
comportamento, ed un suono diverso “bop” (SΔ) indica che nessun comportamento
particolare produrrà un rinforzo.
L’addestramento operante discriminante complesso, prevede la presentazione
contemporanea di due stimoli SD all’animale, uno dei quali indica che un dato
comportamento verrà rinforzato ed un altro che lo stesso comportamento verrà
punito. Una variazione dello stesso tipo di addestramento prevede che un SD indichi
che un certo comportamento potrebbe produrre un rinforzo corposo ed altamente
desiderabile mentre un altro SD indica che sarà disponibile un rinforzo povero e poco
desiderabile. Ci sono molti modi di combinare diversi SD per insegnare all’animale a
mostrare differenti comportamenti. La bravura e la conoscenza della materia da parte
di un buon addestratore può condurre a risultati incredibili.
L’addestramento discriminante senza errori, e’ una procedura che riduce
enormemente il numero di errori che l’animale compie durante l’addestramento
discriminante. Imparare a discriminare tra vari stimoli richiede tempo ed
inevitabilmente produce degli errori. E’ un procedimento per tentativi (prove) ed
errori. A volte non e’ auspicabile consentire all’animale di commettere molti errori
poiché gli stessi conducono ad elicitare risposte emotive di errore (scarso successo)
punendo cosi l’atto dello sforzo che l’animale fa per raggiungere l’obiettivo.
Nell’addestramento discriminante senza errori presentiamo lo stesso stimolo in due
modi differenti: un SD nella sua forma e durata normali ed un SΔ in forma debole (es.
poco visibile o di scarsa durata). L’animale avrà un comportamento corretto in
presenza del SD che conseguentemente produrrà un rinforzo, mentre non presenterà
alcun comportamento in presenza dello stimolo SΔ. Gradualmente incrementeremo
la forma e la durata dello stimolo SΔ finché non apparirà nella sua forma più normale
ma l’animale non mostrerà ancora il giusto comportamento.
Nella maggior parte dei casi, nell’addestramento discriminante i rinforzi sono gli
stessi quando l’animale mostra differenti comportamenti stimolati da differenti SD.
Per esempio, un ratto deve premere una leva quando vede una luce rossa ed un altro
quando vede una luce verde. Il comportamento corretto produce lo stesso rinforzo,
nel caso un pellet di cibo, a prescindere da quale delle due leve abbia premuto
correttamente. Gli esperimenti indicano che si può aumentare la velocità di
apprendimento e ridurre il numero di errori concedendo differenti rinforzi per
differenti comportamenti. Tale tecnica prende il nome di effetto in uscita
differenziale (DOE).
16
Esempio: premendo la leva uno quando vede la luce rossa, il ratto riceverà un
rinforzo in cibo, mentre premendo la leva giusta quando vedrà la luce verde riceverà
dell’acqua come rinforzo.
La generalizzazione e’ l’inverso della discriminazione e si manifesta quando
diversi stimoli producono lo stesso comportamento. Più saranno uguali gli stimoli,
più sarà facile che gli animali facciano una generalizzazione degli stimoli.
La generalizzazione dello stimolo e’ un fatto naturale ed indispensabile nella
lotta alla sopravvivenza. Fatta eccezione per un numero limitato di stimoli, la maggior
parte di quelli prodotti in un laboratorio sperimentale non sono mai uguali. Le nuvole
non sono mai uguali a quelle del giorno prima, per questo predatori e prede
sembrano leggermente diversi quando appartengono alla stessa specie. Non di meno,
tutti gli animali devono essere in possesso di una buona abilità nel generalizzare gli
stimoli. Il difficile nella generalizzazione degli stimoli consiste nel presentare stimoli
che producono un certo tipo di rinforzi (o punizioni) in presenza di uno specifico
comportamento in una categoria differente dalle altre. Il fallimento in questa
operazione può avere conseguenze disastrose. Mettere il cibo nutriente e quello
velenoso nella stessa categoria non e’ di certo una buona idea (ad esempio i funghi
sono un buon esempio in tal senso).
La selezione naturale ha aiutato i vari organismi viventi ad implementare la
capacità di discernere tra quello che e’ un buon cibo e quello che non va mangiato. Se
gli effetti della selezione naturale non sono cosi presenti le esperienze prendono il
sopravvento. Mentre la capacità di generalizzare e’ innata, gli animali imparano a
generalizzare stimoli particolari attraverso prove ed errori (esperienze). Nelle
situazioni di addestramento osserviamo generalizzazioni continue specialmente se le
prove non sono fatte sotto il controllo stretto e diretto di un ambiente di laboratorio.
Ad esempio, gli addestratori di cani fanno affidamento sulla capacità di
generalizzazione del proprio cane per far seguire ad uno stimolo corretto il corretto
comportamento.
Abbiamo detto che un comportamento e’ controllato dallo stimolo quando
l’animale mostra questo consistentemente, in presenza di un determinato stimolo,
ma non in assenza dello stesso stimolo o in presenza di uno stimolo diverso.
Il controllo degli stimoli e’ un fatto naturale, non e’ il risultato di esperimenti di
laboratorio o addestramento particolare. Possiamo vedere il controllo degli stimoli in
tre modi diversi:
17
1. Lo stimolo esercita il controllo sugli animali. Questo e’ vero in quanto in
questo modo gli animali posso mostrare uno specifico comportamento con
relativa alta frequenza in presenza dello stimolo in questione attribuendo
pieno significato a questo ed al perché l’animale per prima cosa impara a
discriminare. Controllarlo non significa pensare che l’animale e’ costretto (nel
rispondente significato del condizionamento) a mostrare il comportamento
una volta che lo stimolo compare. L’animale ha sempre una scelta: esso mostra
più spesso il comportamento poiché spesso tale comportamento e’ rinforzato.
Questo spiega perché l’animale cerca un riparo quando piove, va a caccia
quando e’ affamato, fugge quando e’ spaventato da una minaccia.
2. L’animale controlla l’ambiente circostante. Questo e’ vero poiché l’animale sa
cosa fare per arrivare a conseguire certi risultati e non spreca energia e tempo
tentando varie ed erronee alternative.
3. L’animale cambia l’ambiente circostante. Questa possibilità alternativa
appartiene solo alla razza umana. Quando conosciamo le conseguenze che uno
stimolo e’ in grado di produrre possiamo cambiare l’ambiente circostante cosi
che quel tale comportamento abbia meno possibilità di manifestarsi. Se per
esempio dedico di dimagrire, sicuramente evito di contornarmi di cibo e di
andare in giro per ristoranti. Il fumatore che desidera diminuire la quantità di
sigarette fumate o smettere di fumare, eviterà i bar ed i posti dove vari stimoli
lo possono indurre a fumare.
18
CAPITOLO 4 : AUMENTO O DECREMENTO DI UN COMPORTAMENTO
I rinforzi incondizionati
frequenza e/o l’intesita’ di un comportamento:
dipendono dal livello di
privazione.
un’incrementatore (rinforzi) ed un
19
dimenticare che una cosa desiderabile potrebbe essere avversiva allo stesso tempo e
viceversa.
Rinforzi e punizioni sono molto particolari. Un certo stimolo e’ un rinforzo o una
punizione per uno specifico comportamento in un
Un avvertimento in merito contesto specifico, in un determinato momento e per
alle punizioni
un certo individuo. Un rinforzo in un certo momento
Le Punizioni sono divenute
oggetto di dispute nell’ambito può essere una punizione ed in un altro un rinforzo
della comunità degli animali da
compagnia negli ultimi 10 anni.
cosi come potrebbe essere vero l’opposto.
Ciò e’ accaduto a causa di
molteplici fattori. Primo su tutti, la
Tutti gli organismi viventi sono soggetti
parola punizioni in se stessa elicita
spiacevoli reazioni nella maggior
costantemente a rinforzi e punizioni provenienti da
parte delle persone, non
comprensibili dal momento che
ogni possibile fonte, da ogni altro organismo,
per punizioni si intende un
dall’ambiente naturale o dal proprio sistema
avversivo, quindi uno stimolo che
comunque si vorrebbe evitare di endogeno. Tutti gli organismi viventi adattano il loro
infliggere. Secondo fattore e’ la
tendenza a romanzare il rapporto comportamento al fine di ottenere il massimo dei
esistente con i nostri animali ed il
termine punizioni non compare rinforzi ed il minimo delle punizioni. Due proprietà
in questa relazione. Terzo fattore
e’ la grossa errata confusione sul del processo di rinforzo e di punizione inficiano la
significato della parola punizioni
nell’alveo della teoria loro efficacia considerevolmente: la contingenza e
dell’apprendimento. Punire o
punizioni non hanno niente a la contiguità.
che vedere con la violenza, con il
ferimento, col dolore o la La contingenza e’ il grado di correlazione tra il
mutilazione sebbene molte di
queste riguardino la maggior parte comportamento e le sue conseguenze. Ad esempio, se
degli organismi. Una punizione
e’ semplicemente uno stimolo che un cane riceve del cibo per mostrare un certo
decrementa uno specifico
comportamento in un determinato comportamento, gli abbiamo insegnato questo, ma
individuo, in un determinato
momento, in determinate se riceve del cibo senza mostrare il comportamento
circostanze. E’ semplicemente un
avversivo in quella particolare che vogliamo l’apprendimento sarà più lungo.
occasione. Potrebbe essere un
avversivo anche in altre situazioni Molti piccoli rinforzi, ma altamente centellinati,
ma potrebbe anche essere un
rinforzo. Il cibo e’ un rinforzo nella ottengono spesso più risultati che pochi e copiosi
maggior parte delle situazioni ma,
se somministrato ad un animale rinforzi scarsamente contingentati. Lo stesso vale per
nauseabondo, funzionerebbe come
punizione. le punizioni: più alto sarà il contingentamento delle
stesse tra comportamento e punizione, più veloce
sarà la soppressione del comportamento indesiderato.
La contiguità, in riferimento al gap tra il comportamento e le sue conseguenze,
potrebbe essere un rinforzo o una punizione. La contiguità, anche definita
sincronizzazione temporale, e’ un fattore molto importante che influenza la
frequenza nel comportamento operante e la velocità dell’apprendimento. Studi
20
condotti mostrano che più veloci sono le conseguenze di un comportamento mostrato
dall’animale e più velocemente esso apprenderà. Tale risultato si applica anche per le
punizioni e per la soppressione dei comportamenti. Nonostante ciò, rinforzi e
punizioni devono essere idealmente applicate simultaneamente o
immediatamente dopo che l’animale ha mostrato il comportamento
voluto.
Rinforzi e punizioni devono avere la giusta intensità per essere efficaci. Non
pensate mai che la contingenza sia più importante della misura del rinforzo; un
grande rinforzo e’ meglio di uno piccolo. Lo stesso vale per le punizioni: una lieve
punizione con bassa intensità potrebbe non modificare il comportamento
indesiderato (ed in questo caso non sarebbe una punizione) o inficiarlo solo
minimamente.
Classifichiamo i rinforzi e le punizioni come condizionati o incondizionati.
Rinforzi incondizionati e punizioni sono anche chiamati rinforzi e
punizioni primarie poiché non dipendono dalla loro associazione con altri stimoli.
La maggior parte di essi agiscono su bisogni primari, basati quindi su necessità come
ad esempio il cibo e l’acqua che sono, appunto, rinforzi primari. L’efficacia dei
rinforzi primari, cibo, acqua, la cordialità, il contatto, variano considerevolmente con
il livello di privazione. I rinforzi incondizionati subiscono l’effetto della sazietà
dell’animale. L’efficacia del cibo come rinforzo decrementa man mano che l’animale
ne riceve e cesserà di essere un rinforzo allorché l’animale sarà sazio; a quel punto,
sottrarre il cibo non avrà neanche la funzione di punizione.
Rinforzi condizionati e punizioni non sono innati e devono essere appresi
attraverso l’associazione con rinforzi primari o punizioni. Sono definiti anche
rinforzi secondari o punizioni. Dopo alcune ripetizioni, l’animale impara che c’e’
un’associazione tra uno stimolo neutro (un non stimolo) ed un rinforzo
incondizionato o una punizione. In tal modo lo stimolo neutro diventa un rinforzo
condizionato o una punizione. Il suono del clicker e’ un rinforzo condizionato poiché
dobbiamo associarlo molte volte al cibo, cosi che il ratto associ il suono del clicker al
cibo. Questa associazione e’ definita rispondente o associazione Pavloviana.
I rinforzi condizionati e le punizioni sono deboli quanto quelli
incondizionati, ma hanno diversi vantaggi: non perdono di efficacia a causa della
sazietà o della privazione, possono essere somministrate con maggior senso di
immediatezza, sono meno invasive,sono efficaci in differenti situazioni. Detto questo,
21
dobbiamo ricordarci che dobbiamo bilanciarle con i rinforzi incondizionati e
punizioni al fine di non fargli perdere il loro valore (sottoporsi quindi ad estinzione).
Gli addestratori devono usare rinforzi e punizioni dopo averci ben pensato. Esistono
strumenti efficaci nella modificazione del comportamento. Un utilizzo inappropriato
di entrambi può avere effetti collaterali indesiderati che debbono essere evitati ad
ogni costo.
Un rinforzo (uno stimolo desiderato) e’ qualsiasi cosa che incrementa la frequenza,
la durata e/o l’intensità di un certo comportamento quando questo sia concesso o
negato simultaneamente o immediatamente dopo che il comportamento voluto abbia
avuto luogo.
Esempio: Se io do una ricompensa al mio cane, e
Rinforzi e punizioni: ciò incrementa la velocità con la quale il cane si
somministrateli con cura !!
siede, la ricompensa assume valore di rinforzo per
Rinforzi e punizioni sono strumenti
potenti nella modifica comportamentale. il comportamento di “seduto” eseguito dal mio
Quando utilizzati correttamente, sono
veloci ed efficaci. Nonostante ciò, entrambi cane in quello specifico momento.
possono crearci dei problemi qualora
siano distribuiti in maniera erronea e
Ci sono due tipi di rinforzi: quelli positivi e quelli
possono condurre ad effetti collaterali
indesiderati.
negativi.
Rinforzi troppo frequenti per tutte le specie
di comportamento ed il livello di difficoltà’
Un rinforzo positivo e’ qualsiasi cosa che
che richiediamo all’animale possono
portare un soggetto a non lavorare sotto
incrementa la frequenza, la durata e/o l’intensità
pressione o ad arrendersi quando il
di un certo comportamento quando questo sia
successo non arriva immediatamente.
Questo tipo di animali e’ difficile da concesso o negato simultaneamente o
addestrare. Per esempio, quando modelli il
comportamento di un animale dovrai immediatamente dopo che il comportamento
premiare ogni comportamento che questo
assume per giungere, per approssimazione, voluto abbia avuto luogo.
al risultato finale. Un animale che si
arrende non ci da nessuna possibilità di Esempio: se io do una carota al mio cavallo e ciò
addestrarlo.
L’utilizzo di troppe punizioni possono incrementa la velocità con la quale questi si
sfociare in comportamenti di lotta,
aggressività’, apatia, annullamento o anche avvicina a me, la carota assume valore di rinforzo
impotenza.
Sia i rinforzi che le punizioni sono soggette per quel dato comportamento in quella precisa
a generalizzazione (vedi capitolo 3) che
può ostacolare tutte le future sessioni di circostanza.
addestramento dell’animale.
Un rinforzo negativo e’ qualsiasi cosa che
incrementa la frequenza, la durata e/o l’intensità
di un certo comportamento quando questo sia rimosso simultaneamente o
immediatamente dopo che il comportamento voluto abbia avuto luogo.
Esempio: Se l’allentamento del guinzaglio (e di conseguenza del collare) del mio cane
avviene nel momento stesso in cui lui cessa di tirare, si può dire che l’allentamento
22
della pressione che prima esercitavo e’ un rinforzo negativo al comportamento di
non-tirare del mio cane in quella determinata circostanza.
Una Punizione e’ qualsiasi cosa che decrementa la frequenza, la durata e/o
l’intensità di un certo comportamento quando questo sia presentato o rimosso
simultaneamente o immediatamente dopo che il comportamento abbia avuto luogo.
(Possiamo anche dire che la punizione consiste nel sottrarre un rinforzo positivo o nel
presentare un rinforzo negativo)
Ci sono due tipi di punizioni: quelle positive e quelle negative.
Una punizione positiva e’ qualsiasi cosa che decrementa la frequenza, la durata
e/o l’intensità di un certo comportamento quando presentata simultaneamente o
immediatamente dopo che il comportamento abbia avuto luogo.(La punizione
positiva e’ la presentazione di un rinforzo negativo)
Esempio: Quando tiro il guinzaglio del mio cane perché non vuole mostrare un certo
comportamento, io sto (positivamente) punendo lo stesso. Il risultato che voglio
ottenere e’ che diminuisca la frequenza con la quale il cane tira il guinzaglio.
Una punizione negativa e’ qualsiasi cosa che decrementa la frequenza, la durata
e/o l’intensità di un certo comportamento quando rimosso simultaneamente o
immediatamente dopo che il comportamento voluto abbia avuto luogo. (La punizione
negativa consiste nel ritiro di un rinforzo positivo).
Esempio: Se io non concedo al mio cane un premio quando gli dico “seduto” e lui non
siede, inibisco il comportamento del mio cane nel non sedersi in simili circostanze;
ne consegue che il non premiarlo e’ un inibitore negativo per avversare il suo sedersi
in particolari circostanze.
L’incitamento (inglese: tease) e’ una variazione di un’inibizione negativa che
prevede che il rinforzo positivo (di norma incondizionato, ma non necessariamente)
sia nascosto anziché rimosso. L’incitamento incoraggia il ricevente a mostrare il
comportamento recentemente rinforzato, quindi accrescendo la partecipazione attiva
nel processo di apprendimento.
Esempio: Mostro temporaneamente, salvo poi nasconderlo, il rinforzo positivo (ad
esempio un premio in cibo) al fine di incoraggiare la performance di uno specifico
comportamento che, di norma, e’ quello già rinforzato più recentemente.
Le quattro procedure operanti, rinforzo positivo, rinforzo negativo, punizione
positiva e punizione negativa sono complementari l’una a l’altra. L’utilizzo di una
di esse non esclude la necessità di utilizzarne un’altra. In alcune situazioni di
23
apprendimento potremmo riuscire a raggiungere l’obiettivo desiderato utilizzando
una sola o due delle procedure indicate. Nonostante ciò , a lungo andare, i buoni
addestratori si troveranno ad utilizzare tutte e quattro le procedure ovviamente per
obiettivi diversi. Nel corso degli studi condotti, abbiamo scoperto che e’ virtualmente
impossibile addestrare un animale (umani inclusi) senza l’utilizzo combinato di
rinforzi e punizioni sia condizionati che incondizionati; la chiave del successo risiede
nella perfetta sincronizzazione dei tempi, nell’intensità’ e nell’appropriatezza dello
strumento che utilizziamo per ogni specifica situazione.
La sotto riportata tabella sintetizza l’uso dei quattro principali strumenti utilizzati nel
comportamento operante come incrementatori o decrementatori del comportamento
stesso.
24
CAPITOLO 5 : IL PROGRAMMA DEI RINFORZI
25
rinforzamento. Dopo essere stato rinforzato, il ratto avrà infatti la tendenza a
prendersi una pausa. (esempio: il lavoro a cottimo).
Un rapporto variabile (RV) rinforza un comportamento solo alcune volte,
normalmente dopo un certo numero di risposte
L’importanza del positive, ma mai a numero fisso. La pianificazione VR
programma di rinforzi
conduce a brevi pause post-rinforzamento rispetto a
Quando cerchiamo nelle mine in
un campo minato in situazioni quelle del FR e, perciò, produce normalmente più
operative reali, l’addestratore non
sa dove sono allocati gli ordigni ne’ comportamenti diversi nello stesso periodo.
se essi siano presenti nel campo
ispezionato. Per tali ragioni, (esempio: il comportamento predatorio).
l’addestratore non può rinforzare
le indicazioni provenienti da un Un intervallo fisso (IF) rinforza un
cane o da un ratto poiché queste
potrebbero rivelarsi false. Ciò non comportamento mostrato dopo che uno specifico
comporta alcun problema poiché
sia il cane che il ratto sono intervallo di tempo e’ trascorso. L’FI fornisce curve di
addestrati ad operare secondo il
programma di rinforzi diagramma diversamente altalenanti mentre l’FR
intermittente (IRF). Quest’ultima
condizione (addestrato ad operare produce una linea costante.
con rinforzi intermittenti) e’ molto
importante poiché diversamente Un intervallo variabile (IV) rinforza un
se non ricevesse alcun rinforzo pur
indicando l’odore del TNT questo comportamento mostrato dopo un periodo di tempo
porterebbe all’estinzione del
comportamento con conseguenze medio, ma mai ad intervalli fissi. Il VI produce livelli
altamente indesiderabili.
Lo stesso esempio e’ applicabile
di esecuzione altamente costanti, più alti di quelli
per i cani addestrati a scovare
esplosivi e narcotici all’interno
ottenuti con l’FI.
di veicoli o aeroporti.
Nell’incertezza che il cane trovi
Nella durata fissa (DF) il comportamento e’
qualcosa, andrà rinforzato solo il
comportamento di cercare.
rinforzato dopo una performance continua eseguita
per un tempo fissato.
Nella durata variabile (DV) il comportamento e’
rinforzato dopo una performance continua eseguita per un tempo variabile.
La pianificazione DF e DV dimostrano che l’aumento della performance e’ essa stessa
un rinforzo.
Possiamo combinare gli elementi della pianificazione in modo diverso allo scopo di
raggiungere una programmazione multipla di rinforzo (MULT) oppure una
pianificazione di rinforzo mista (MIX).
Il rinforzo differenziale (DR) e’ una procedura del condizionamento operante nel
quale alcuni tipi di comportamenti sono sistematicamente rinforzati ed altri non lo
sono. Il DR e’ normalmente utilizzato per trattare problemi comportamentali ma non
solo questi. Ad esempio, possiamo usare il DR in combinazione con una procedura di
estinzione per ridurre a zero la frequenza del comportamento indesiderato.
26
Tipi di rinforzo differenziato:
DRL (basso) – rinforza comportamenti che si presentano con frequenza non più alta
di un certo numero di volte in un periodo ben definito.
DRH (alto) – rinforza i comportamenti che si
Rinforzi e ricompense presentano almeno un certo numero di volte in un
Rinforzi e Ricompense non periodo ben definito.
sono la stessa cosa, sebbene gli
addestratori tendano ad utilizzare DRO (zero) – rinforza la completa assenza di uno
questi due termini in maniera
intercambiabile. specifico comportamento in un certo periodo
Rinforzo e’ il termine tecnico per determinato.
qualsiasi stimolo che produca
l’incremento del comportamento DRA (alternativo) – rinforza un comportamento che
che esso controlla.
e’ differente da un altro comportamento non
La Ricompensa e’ qualcosa
concessa in riconoscimento di un desiderato.
buon servizio reso, un premio, un
dono. DRI (incompatibile) – rinforza un comportamento
Nonostante i due termini abbiano che e’ incompatibile con un altro comportamento non
significati molto vicini, non
esprimono lo stesso significato. desiderato.
Nell’Apprendimento Operante Il rinforzo non contingente (NCR) e’ la
usiamo rinforzi e non
ricompense. procedura con la quale si forniscono rinforzi
indipendentemente dal comportamento. L’NCR può
creare impotenza e comportamenti casuali.
L’impotenza, o comportamento impotente, e’ lo stato con cui si definisce il
comportamento di un animale che non associa le conseguenze di quest’ultimo
presumendo che le stesse siano randomiche.
Il comportamento casuale e’ quel comportamento che e’ erroneamente associato
dall’animale senza essere elicitato da alcuno stimolo.
Abbiamo parlato di programma di rinforzi, ma abbiamo anche inserito le punizioni in
differenti programmi. Ad ogni modo, finché l’obiettivo delle punizioni resta quello di
decrementare la frequenza di un particolare comportamento, auspicabilmente
riducendolo a zero, le punizioni dovranno essere inserite nella programmazione di
rinforzi continua.
27
CAPITOLO 6 : PROCEDURE OPERANTI AVANZATE
28
esempio, un analisi dell’obiettivo che ci proponiamo di raggiungere. Potremo quindi
iniziare, esercitando particolari criteri o rinforzando le performance ottenute nei link
eseguiti nel giusto ordine. Ci sono due modi per mettere insieme tutti i criteri in
catena: il concatenamento in avanti ed il concatenamento retrogrado.
Il Concatenamento in avanti e’ la procedura addestrativa nella quale
l’addestramento inizia con il primo anello della catena e prosegue aggiungendo, man
mano, altri seguenti anelli della catena addestrativa nell’ordine prescelto (da
anteriore a posteriore). Questa e’ la procedura maggiormente seguita
nell’addestramento degli animali probabilmente perché implica un ordine
sequenziale di comportamenti più aderente alla percezione della mente umana.
Esempio: Quando insegno ad un cane il riporto, inizio: (1) con il cane seduto alla mia
sinistra, (2) a correre a prendere il dummy dopo aver ricevuto il segnale (3) a
raccogliere il dummy dal terreno e tenerlo in bocca (4) a tornare da noi con il dummy
e sedersi in posizione di “piede” mantenendo in
bocca il dummy e (5) a lasciare il dummy dopo aver Il rinforzo del
concatenamento
ricevuto un segnale appropriato.
Un comportamento a catena
Il Concatenamento retrogrado e’ la procedura consiste di diversi comportamenti
o collegamenti (anelli di una
addestrativa nella quale l’addestramento inizia con catena) che normalmente devono
essere eseguiti in un determinato
l’ultimo anello della catena e prosegue aggiungendo, ordine e non in maniera
randomica. Ciascun anello
man mano, gli anelli precedenti della catena conduce a quello successivo della
catena. Il completamento con
nell’ordine prescelto (da posteriore ad anteriore). Il successo di un anello apre la
possibilità di cimentarsi nel
concatenamento retrogrado ha alcuni vantaggi in successivo. Ciò significa il
completamento con successo di un
quanto il primo criterio in ogni sessione e’ sempre il anello e’ rinforzato dalla
possibilità di cimentarsi nel
più difficile. I criteri sub seguenti nella catena sono successivo arrivando sempre più
vicino al completamento finale. E’
stati esercitati ripetutamente in precedenza e in questo modo che gli animali si
cimentano in catene di
l’animale li esegue con soddisfacente grado di abilità. comportamento complesso come
ad esempio la caccia. In situazioni
I criteri sub seguenti svolgono in tal senso funzione di di addestramento artificialmente
create da noi, il fine ultimo (lo
rinforzo a quelli seguenti. scopo terminale della catena) non
e’ particolarmente appagante (e
Esempio: Quando insegno al cane il riporto procedo rinforzante) per l’animale. Per tale
ragione il concatenamento
quindi cosi: (5) tengo il cane al piede con in bocca il retrogrado funziona cosi bene. Un
nuovo comportamento conduce a
riportello che dovrà rilasciare non appena riceverà quello successivo che funziona da
rinforzo poiché e’ stato già provato
l’ordine appropriato, (4) lo faccio tornare da noi con ed e’ conosciuto dall’animale.
il dummy e assumere la posizione di “piede”
mantenendo in bocca il dummy, (3) dovrà
29
raccogliere il dummy dal terreno e tenerlo in bocca, (2) dovrà correre a prendere il
dummy dopo aver ricevuto il segnale, (1) dovrà stare seduto alla mia sinistra nella
posizione di piede in attesa del segnale porta.
Il concatenamento retrogrado non richiede che il cane esegua la sequenza in ordine
inverso, aggiunge solo un anello alla catena di comportamenti richiesti nell’ordine
inverso pur se l’animale eseguirà la catena di comportamenti nel giusto ordine.
L’estinzione ha due differenti significati che possono essere confusi.
L’estinzione nel condizionamento Pavloviano e’ la procedura con la quale
presentiamo ripetutamente un CS (stimolo condizionato) senza US (stimoli
incondizionati).
Esempio 1 : Facciamo suonare la campanella ripetutamente (CS) senza far vedere il
cibo (US) allo stesso tempo: questo potrebbe estinguere la salivazione (CR – riflesso
condizionato) ed il suono della campanella (CS). Il suono della campanella inizia ad
essere uno stimolo neutro oppure un non-stimolo.
Esempio 2: Dopo aver stabilito l’associazione tra il suono del clicker (CS) ed il cibo
(US), se clicchiamo ripetutamente senza associare ad esso del cibo dopo un certo
tempo il click cesserà la sua funzione di rinforzo condizionato.
L’estinzione nel condizionamento operante e’ la procedura con la quale
sottraiamo i rinforzi che mantengono un certo comportamento.
Esempio : Se io non rinforzo il comportamento di un cane nell’indicare la cocaina per
un lungo periodo, questo comportamento andrà in estinzione (il cane smetterà di
indicare la cocaina).
I comportamenti appresi (che si identificano con quelli precedentemente rinforzati),
sono a volte difficili da estinguere. Potremmo osservare un incremento in un
comportamento in estinzione, una esplosione dell’estinzione. A volte il processo
di estinzione potrebbe causare scoppi d’ira emozionali e specialmente comportamenti
aggressivi. Un ratto che normalmente premendo la leva otteneva del cibo, potrebbe
mordere la leva stessa, un altro ratto o perfino l’addestratore. Un altro problema
dell’estinzione e’ che il comportamento decrementa lentamente.
Un ulteriore problema legato all’estinzione si verifica quando non tutti i rinforzi che
mantengono il comportamento sono sotto il controllo dell’addestratore.
L’estinzione e’ di norma sicura ed efficace ed e’ un’ottima alternativa alle
punizioni quando funziona. Un’altra alternativa per estinguere un comportamento e’
la combinazione tra una rigorosa procedura di estinzione con rinforzi differenziati.
30
Anche il dimenticare (rimuovere) implica che l’animale cessi di mostrare un
comportamento, ma per ragioni differenti di quelle che hanno suggerito l’estinzione.
Il dimenticare (rimuovere) e’ il deterioramento
dei comportamenti appresi quando questi non sono
Le variabili del dimenticare
messi in pratica per un lungo periodo. Il
C’e’ una stretta correlazione tra la
“dimenticare” avviene quando un cane non ha lunghezza dell’intervallo di
tempo nel quale non viene
l’opportunità di mostrare un determinato richiamato il comportamento ed il
dimenticare (rimuovere). Il tempo
comportamento per un lungo periodo di tempo. però e’ una variabile, non un evento;
cosi il tempo, da solo, non fa nulla.
Esempio: Se non do ad un cane la possibilità di Ciò che può causare la rimozione
sono gli eventi che intercorrono tra
scoprire ed identificare della cocaina per un certo l’apprendimento ed il momento in cui
desideriamo richiamare il
periodo, il cane cesserà di indicare la presenza della comportamento insegnato.
Le caratteristiche individuali cosi
stessa. come i fattori genetici possono
giocare un ruolo nella capacità di
La quantità di sessioni addestrative utilizzate per mantenere un’abilita’. La rilevanza
del contesto e’ certamente un fattore
insegnare un comportamento può influire sulla importante nella rimozione.
L’apprendimento avviene sempre in
rimozione, il sovrapprendimento riduce questo un contesto caratterizzato da stimoli
che hanno funzione di indici.
rischio. Potremmo aspettarci che l’animale
ricordi comportamenti che hanno
Il dimenticare (rimuovere) incrementa con la tratto sulle funzioni vitali piuttosto
che comportamenti meno rilevanti.
lunghezza del tempo nel quale non viene richiamato
La quantità di sessioni
il comportamento, ma il tempo non e’ da solo la addestrative utilizzate per
insegnare un comportamento può
causa della rimozione comportamentale. Quanto sia influire sulla rimozione, il
sovrapprendimento riduce questo
lungo questo tempo senza mostrare il rischio.
Il mantenimento del comportamento
comportamento finché non interviene la rimozione e’ anche influenzato dal conflitto
tra gli insegnamenti appresi
dipende da molti fattori: dall’individuo, precedentemente e quelli
successivi.
dall’importanza che riveste il comportamento stesso
per l’animale (in un contesto di naturalezza del
comportamento legato alla specie), dal grado di consolidamento del comportamento
(numero delle sessioni addestrative cui e’ stato sottoposto nell’apprendimento),
competizione con altri comportamenti correlati (appresi cioè prima o dopo),
cambiamenti contestuali.
C’e’ una terza via per far cessare ad un animale un determinato comportamento. La
prevenzione della risposta consiste nell’alterazione dell’ambiente finalizzato a
prevenire l’occasione di mostrare un determinato comportamento.
Esempio: Prevenire l’accesso del cane in posti dove potrebbe trovare scarpe da
mordere o, in alternativa, rimuovere le scarpe da ogni luogo dove il cane ha accesso.
31
CAPITOLO 7 : IL PIANO DI AZIONE (POA)
2. Risorse Umane
Devi identificare quali persone ti sono necessarie per raggiungere lo scopo
prefissato dal progetto in questione, scegliendolo sulla base della esperienza e
delle conoscenze di cui dispongono. Se dai il via al progetto con persone che
dispongono solo parzialmente delle necessarie caratteristiche, otterrai un
risultato parziale. Se tu stesso non hai le necessarie conoscenze per portare a
compimento il progetto con successo, dovrai cercare di acquisire le necessarie
informazioni, conoscenze ed esperienze prima di iniziare.
33
3. Risorse materiali e budget (9)
Il POA (Piano di Azione) per l’addestramento degli animali non deve tener
conto necessariamente di tutti i punti in argomento (materiali, risorse e
budget). La pianificazione del budget potrebbe essere superflua se
l’addestramento in questione fosse parte di un progetto più ampio per il quale
siano state già stanziate delle risorse economiche. Nonostante ciò non
sottovalutate mai l’importanza del budget quando vi imbarcate in progetti più
ambiziosi o che richiedano un addestramento speciale. Per esempio, il
progetto “Camrat” (addestramento di ratti per missioni di ricerca e recupero)
richiese un proprio budget per l’acquisizione delle necessarie risorse (scenario
addestramento, pacchetti di recupero, videocamere, GPS, etc.) poiché le stesse
erano molto costose.
Un equipaggiamento scarso conduce a risultati scarsi, come detto già per la
pianificazione. Non iniziare un progetto prevedendo uno standard minimo di
equipaggiamenti con la speranza che la minima richiesta fatta possa aiutarti a
riceverne di migliori man mano che il progetto si sviluppa. Potresti
danneggiare il tuo equipaggiamento in maniera irreparabile o perdere parte di
esso per lungo tempo. Per esempio, se pianifichi di addestrare gli animali in
una gabbia automatizzata, condizionando il loro comportamento con un suono
come rinforzo, non partire prima che il suono prodotto corrisponda
esattamente a quello che volevi. Se parti con qualcosa che potrebbe essere
variato in seguito (seppure in senso migliorativo), potresti dover ripartire con l’
addestramento da zero (e probabilmente dover prima estinguere i
comportamenti acquisiti oppure contro-condizionare gli stessi).
34
dell’obiettivo finale che vi siete posti (DLO). Tuttavia, dovrete suddividere il
task in differenti steps ed avere ben chiaro e definito il DLO ed i POA per
ciascuno step.
Nota bene: Senza steps di azione realistici non riuscirete a
raggiungere completamente il vostro DLO.
35
cane e non basarsi su impressioni soggettive. “Penso che il cane reagisca
abbastanza bene al suono del clicker” e’ l’argomentare dell’addestratore scarso
ed una ricetta sicura per il fallimento.
Nota bene: non desumere nulla, accertati di tutto.
9. Budget.
Vedi quanto detto al punto 3.
36
preoccupato per qualcosa d’altro o se sei nervoso (arrabbiato) non riuscirai a
raggiungere l’obiettivo che ti eri prefissato e stresserai, inutilmente, sia te
stesso che l’animale. Quando addestri conti solo tu e l’animale che stai
addestrando, libera la tua mente da qualsiasi altro pensiero. Se ti accorgi di
non essere nella condizione descritta, fermati, prenditi una pausa e riprendi
successivamente.
Nota bene: Devi essere nel posto giusto nel momento giusto.
Dygtig
All’inizio, non c’e’ problema con il suono che utilizzate come rinforzo condizionato. Tuttavia, proprio perché si
tratta di un rinforzo condizionato, necessita per accezione di essere condizionato.
Studi condotti hanno dimostrato che alcuni suoni sono migliori per alcuni scopi rispetto ad altri.
Per un evento più fortunato che compreso e voluto, e per il quale non erano stati condotti studi all’epoca, due suoni
hanno dimostrato di essere idonei come rinforzi: il suono del clicker ed il suono della parola dygtig.
Dygtig e’ una parola Danese che significa bravo (venne introdotta nell’addestramento degli animali dall’autore di
questo libro alla fine degli anni ’70). Il suo significato non e’ cosi importante in questo contesto; il fatto rilevante e’ che
il suono prodotto da questa parola ha le caratteristiche per essere recepito come un buon rinforzo dall’animale.
Dygtig, al pari del suono del clicker, deve essere condizionato ma si differenzia da quel suono poiché e’ emesso da un
essere umano. Nell’addestramento di animali sociali, come ad esempio cani e cavalli, Dygtig e’ più un rinforzo semi-
condizionato piuttosto che totalmente condizionato. L’accettazione, la sensazione di sicurezza sono rinforzi primari
per gli animali sociali e dygtig e’ immediatamente associato ad uno di essi.
Il suono del clicker non ha le stesse caratteristiche essendo un suono puramente meccanico; ciò nonostante e’ più
accurato e migliore per alcuni scopi.
37
Una Toolbox e’ una lista nella quale sono elencati tutti i segnali, i comportamenti e
le conseguenze che desideriamo conseguire con il nostro DLO.
E’ uno strumento dell’addestratore che contiene tutto ciò che gli serve.
Esempio di un segnale: Sit significa “metti il sedere a terra e tienilo li finche’ non
arriva un nuovo segnale”.
Ricordatevi che i segnali devono essere definiti chiaramente, non solo per quanto
attiene alla loro forma ma anche per quanto ha tratto col loro significato.
Ciascuno step primario (PRS) e’ una componente di un POA. Esso deve indicare
come minimo un segnale che implica un comportamento.
Esempio di un PRS : “Sit” implica che il cane “metta il sedere a terra”.
Quando indichiamo piu’ di un segnale significa che daremo tutti i segnali
simultaneamente; questo e’ di particolare importanza quando utilizzeremo differenti
forme per lo stesso segnale.
Esempio: Dico “Sit” ed utilizzo il movimento della mano per accompagnare seduto il
mio cane.
Utilizzando più segnali simultaneamente nel POA dovremo riportare per primi
quelli che ci aspettiamo essere i più difficili ed alla fine quelli che riteniamo
più semplici, di norma gli Sγ .
Esempio: “Dico Sit” , “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa”.
In un PRD, dopo uno o più segnali, dovete indicare il comportamento
voluto.
Esempio: “Dico Sit” , “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa” implica “Il cane si siede”.
Ogni PRS deve terminare sia con un rinforzo che con un comportamento
con due eccezioni. In un programma di apprendimento, la prima prova di uno
specifico PRS deve terminare sempre con uno o più rinforzi come nel seguente
esempio 1 :
Esempio 1 : “Dico Sit”, “Uso il movimento della mano per il Sit”, “Tengo un premio
nella mano facendo il movimento di Sit con la stessa” implica “Il cane si siede”.
Questo a sua volta implica “Dico Dygtig” e “Do al cane un premio”.
Dopo alcune sessioni addestrative con esito positivo, uno specifico PRS potrebbe
terminare con un determinato comportamento a seconda del programma
di rinforzi utilizzato in quella particolare sessione (esempio 2).
38
Esempio 2: “Dico Sit” implica “Il cane si siede”.
Eccezione 1: dopo un SΔ non e’ richiesto alcun rinforzo o
comportamento.
Esempio: “Dico Sit” implica “Il cane si siede” implica “Dico Dygtig”, Aspetto un
momento e “Dico Free”. Free e’ un SΔ poiché indica al cane che il comportamento di
seduto non produrrà più un rinforzo.
Eccezione 2: dopo l’uso di una punizione (normalmente in uno step alternativo
in una catena di comportamenti dove non sono previsti rinforzi alla fine).
Esempio : “Dico Sit” implica “Il cane non siede” implica “Dico Bad” implica “Il cane
siede” (Bad e’ una punizione solo se decrementa la velocità con la quale il cane non
siede dopo aver ricevuto il segnale Sit).
Uno step secondario o alternativo (ALS) e’ un’alternativa al PRS. E’ il nostro
Piano B.
Ogni ALS deve terminare con un comportamento o con un rinforzo.
Esempio di ALS: Il cane non si siede. Ripeto “Sit” implica “il cane siede” implica
“Dico Dygtig” e “Do al cane un premio”.
Possiamo disporre di quanti ALS riteniamo necessari, ma ne dobbiamo utilizzare solo
un massimo di due per ciascun PRS. Un utilizzo di più di due ALS per lo stesso PRS
significa che c’e’ un errore di base (BASIC).
Un errore di base e’ un problema causato da fattori non correlati con il
POA.
Esempio di errore di base: Se, quando chiamo il mio cane, non mi guarda dopo due
ALS, dobbiamo cercare di capire perché questo succede e assumere i necessari
provvedimenti tornando poi, conseguentemente, al nostro POA originale.
L’errore di base e’ spesso una risposta emotiva di paura o aggressività a stimoli
prodotti o in conflitto con altri stimoli più forti ricevuti. Il POA, in se stesso, potrebbe
essere corretto e funzionale ma potrebbe non procedere nella direzione voluta a causa
di queste risposte emotive che devono essere affrontate prima di procedere nella
implementazione del POA. Le risposte emotive spesso sono di origine Pavloviana e
richiedono, per essere cambiate, l’applicazione di procedure di contro-
condizionamento. L’abitudine e la desensibilizzazione possono modificare, e a volte
estinguere, le risposte emotive.
39
Più di due ALS nello stesso PRS possono anche indicare il fallimento del POA sul
quale si sta procedendo impedendo di soddisfare i criteri per il controllo di qualità
richiesto con un ERRORE.
Gli errori sono gli insuccessi nell’ottenere i comportamenti desiderati o attesi
derivanti dall’aver fissato il QC dei precedenti POA a livello troppo basso, o per averli
considerati superati pur non avendo risposto appieno ai requisiti degli stessi.
Per esempio, se il click e’ usato come rinforzo in un POA, dobbiamo assicurarci che il
condizionamento sia avvenuto e che l’animale risponda appieno ed in maniera
affidabile allo stesso. Se l’animale non risponde in maniera appropriata non possiamo
aspettarci che lo stesso rinforzo sia utilizzabile nei sub-seguenti POA. L’unica
soluzione che ci resta e’ quella di tornare al POA nel quale abbiamo insegnato
all’animale a rispondere a questo particolare stimolo ed incrementare il QC. Solo
quando il nuovo QC sarà raggiunto potremo passare al seguente POA.
Questo e’ un errore molto comune nell’addestramento degli animali. Gli addestratori
passano troppo speditamente al passo successivo senza curarsi che l’animale abbia
ben appreso un segnale. Il QC e’ difficile da determinare: non deve essere ne’ troppo
semplice, il che non garantirebbe che l’animale abbia realmente acquisito il
comportamento voluto, ne’ troppo complesso (o virtualmente impossibile) da
raggiungere poiché in questo caso condurrebbe ad una rinuncia sia da parte
dell’animale che dell’addestratore.
Il seguente esempio mostra un POA molto semplice. In esso non sono contenuti steps
alternativi (proprio per la sua semplicità) ma include una sezione dedicata alla
soluzione dei problemi più comuni che sorgono durante una sessione addestrativa ed
a come risolverli.
Esempio di un POA
1
Per esempio il cane torna alla fonte del suono del clicker anche quando e’ sazio.
40
Toolbox:
Il suono di un clicker2 (non-stimolo che deve essere condizionato);
Ricompensa (rinforzo positivo incondizionato)3
POA:
Problemi e Soluzioni
D: il cane non vuole mangiare. Cosa fare?
R: Aspetta finché il cane non sia affamato. Non addestrare mai un cane sazio.
Usa una parte della sua razione di cibo giornaliera per le sessioni addestrative.
2
Durante le prove iniziali riscontreremo un non-stimolo del suono del clicker (alcuni autori lo definiscono uno
stimolo neutrale) che non e’ ancora uno stimolo condizionante. Poiché la ricompensa in cibo ha la caratteristica
di stimolo primario ed incondizionato, dopo diverse ripetizioni creeremmo una associazione tra i due stimoli. A
quel punto il suono del clicker diventa uno stimolo condizionato, che può essere utilizzato come rinforzo
condizionato. Questa semplice associazione deve essere mantenuta nello stesso ordine per evitare l’estinzione.
3
La ricompensa in cibo deve avere consistenza e non deve essere molto grande per consentire una facile e
rapida consumazione.
41
R: Due sono le cose: o il cane non e’ affamato (quindi vedi prima domanda e
risposta qui sopra) o non sa che hai delle ricompense. Mostragli le ricompense
e nascondile immediatamente. Poi clicca e premialo.
42
Bibliografia ed altre letture suggerite
43
Mech, L. D. (1981) The wolf: the ecology and behavior of an
endangered species. University of Minnesota Press.
Pavlov, I. P. (2003) Conditioned reflexes. (G. V. Anrep, Ed. and
Trans.) Dover Publications.
Pinker, S. (1997) How the Mind Works. W. W. Norton & Company,
New York. edition 2009.
Rachels, J. (1990) Created From Animals. Oxford University Press,
USA. edition 1999.
Ridley, Mark. (2004) Evolution. Oxford University Press, USA.
Ruse, M. (1986) Taking Darwin Seriously: A Naturalistic Approach
to Philosophy. Prometheus Books. edition 1998.
Scott, J. P. and Fuller, J. L. (1998) Genetics and the Social Behavior
of the Dog. University of Chicago Press.
Skinner, B. F. (1938) The behavior of organisms: An experimental
analysis. Prentice Hall
Tinbergen, N. (2006) Social Behavior in Animals. Agrobios India.
Von Frisch, K. (1993) The Dance Language and Orientation of
Bees. (Translatated by L.E. Chadwick) Harvard University Press,
Cambridge, Massachusetts.
Wilson, E. O. (1975) Sociobiology: The New Synthesis. Belknap
Press of Harvard University Press, Cambridge, Mass (New Edition
2000)
Zimen, Erik (1981) The Wolf: His Place in the Natural World.
Souvenir Press.
44
Links (in Inglese)
You are welcome to visit the following sites for more information about animal behavior and training,
books, videos, articles, and educational programs.
Ethology Institute Cambridge the page of the Ethology Institute Cambridge offering courses and study
resources.
Roger Abrantes blog site the personal page of the author offering blogs, articles and books free for all to
read online.
Roger Abrantes on Facebook the page where you can follow the author and get the latest updates.
Roger Abrantes on Twitter the easiest way to follow the author.
45
L’apprendimento degli animali e’ la scienza che studia come
gli animali imparano i vari comportamenti che mostrano
L’apprendimento degli animali e’ la scienza che studia come gli animali imparano i vari
comportamenti che mostrano. Un buon addestratore disegna dei buoni piani di azione. A
buon piano di azione fornisce all’addestratore un orientamento sicuro ma anche una
sufficiente flessibilità per aggirare ogni problema che, inevitabilmente, affiora. Per fare
questo, avete bisogno di solide fondamenta nella teoria dell’apprendimento animale. Questo
e’ un piccolo libro che vi fornirà i principi di base necessari per trasformare le vostre sessioni
addestrative in esercitazioni di scienza applicata ed arte ispirata, al posto di congetture.
“Le vostre sessioni addestrative saranno sicuramente più gratificanti sia per voi che per il
vostro animale se avrete maggiore coscienza e conoscenza di ciò che state facendo” – Roger
Abrantes
Animal Learning
di Roger Abrantes
Tratto da
Animal Trainers
Handbook
Edito da Roger Abrantes
46