Sei sulla pagina 1di 62

TEMA 3.2. CONDICIONAM.

OPERANTE (I):
TRMINOS, PARADIGMAS Y PROGRAMAS

DOMJAM cap. 5 - 6 - 7

1.NOCIONES INTRODUCTORIAS Y TERMINOS BASICOS

1.1.El aprendizaje por las consecuencias

El reforzador tiene un efecto importante sobre nuestras acciones. El reforzador


es cualquier acontecimiento que incremente la probabilidad de la conducta
La contingencia es la relacin entre la conducta y el reforzamiento

1.2.Antecedentes. El condicionamiento instrumental


La ley del efecto de Thorndike
1.3. Tipos de reforzadores
Positivos y negativos
Primarios y secundarios

1.4.El moldeamiento

Reforzamiento por aproximaciones sucesivas

2. PARADIGMAS O PROCEDIMIENTOS DE CONDICIONAMIENTO OPERANTE


El reforzamiento positivo
El reforzamiento negativo

El castigo

La omisin

3. PROGRAMAS DE REFUERZO

3.1.Segn criterios de frecuencia de respuesta: programas de reforzamiento


de RAZON
El reforzamiento se administra en base al nmero de respuestas omitidas
De Razn Fijo
De Razn Variable
3.2.Segn criterios temporales: programas de reforzamiento de INTERVALO
El reforzamiento se administra en base al tiempo
De Intervalo Fijo
De Intervalo Variable

1
Antecedentes. El condicionamiento instrumental Thorndike (Ley del
Efecto):

A partir de esta clase de estudios, Thorndike formula en 1911 la Ley del Efecto: Los
animales aprendern a emitir una respuesta con mayor frecuencia que otras si a esa
respuesta le sigue el efecto deseado. Si una respuesta en una situacin estimular dada es
seguida por un suceso satisfactorio o placentero, la relacin entre la situacin y la
respuesta se fortalece, de forma que el organismo tendr ms a dar esa respuesta en esa
situacin. Si por el contrario va seguida de un suceso nocivo o desagradable, la respuesta
tender a no darse.

Es decir, de varias respuestas dadas a una misma situacin, aquellas que van
acompaadas o estrechamente seguidas de algo, sern las que quedarn ms
firmemente conectadas con esa situacin, y las que emitir con ms frecuencia cada vez
que se repita la misma

A partir de los descubrimientos de Thorndike, el psiclogo conductista SKINNER se


interes por este tipo de aprendiz.: el aprendizaje por refuerzo, al que llam
condicionamiento Operante. SINNER fue el psiclogo que ms lejos llev los principios

2
del conductismo con el C.OPERANTE O INSTRUMENTAL que se refiere al
comportamiento voluntario.

DESTAC LA INFLUENCIA DEL REFORZAMIENTO EN LA CONDUCTA: EL REFUERZO


TIENE UN EFECTO IMPORTANTE EN NUESTRAS ACCIONES. UN MISMO
ACONTECIMIENTO O ESTMULO PUEDE SER REFORZANTE PARA UNA PERSONA Y NO
PARA OTRA: HAY QUE IGNORAR IDEAS PRECONCEBIDAS SOBRE LO QUE PUEDE SER
UN REFORZADOR EFICAZ Y SELECCIONAR AQUEL QUE FUNCIONE REALMENTE CON
LA PERSONA A LA QUE SE LO VAMOS A APLICAR

1.NOCIONES INTRODUCTORIAS Y TERMINOS BASICOS


Segn Skinner, la conducta est en funcin de sus consecuencias, siendo estas
consecuencias lo que conocemos por el nombre de refuerzos y castigos. Es decir: es el
aprendizaje en que una respuesta se refuerza o debilita, segn las consecuencias que
sigan a la misma sean positivas o negatives (si es reforzada, la probabilidad de que
utilicemos dichas respuesta en una situacin similar se incrementar y lo contrario ocurrir
si es castigada). Por ejemplo, imaginad que hablis de ftbol con un nuevo amigo, este
puede entrar inmediatamente en la conversacin, compartiendo vuestros intereses, por
tanto, cada vez que veamos a esa persona sabremos que el ftbol puede ser un buen
tema de conversacin. Por el contrario, si no le gusta el ftbol y cuando sacamos el tema
no muestra inters, puede que en el futuro la probabilidad de hablar de ftbol con esa
persona disminuya. En definitiva, podemos estar ante una conducta modificada por sus
consecuencias.

El individuo opera en el ambiente y da respuestas voluntarias (o no) para producir un


resultado (para beneficiarse de una serie de consecuencias). De ah, el trmino
condicionament OPERANTE. Este aprendizaje permite que el sujeto asocie la realizacin
de una conducta con la obtencin de resultados positivos o negativos. Por ejemplo en la
Caja de Skinner, cuando el animal presionaba casualmente la palanca/botn (respuesta)
reciba comida (estmulo-refuerzo). As, la relacin respuesta refuerzo, en un principio
casual, tenda a reproducirse (pasando de ser una R accidental a una R deliberada.

Adems, esta conducta es contingente o dependiente de las consecuencias de dicha


conducta. El concepto de contingencia es central en la teora de Skinner. La contingencia
es la relacin entre la conducta y el reforzamiento. Segn Skinner el ambiente determina
las contingencias y las personas deben realizar la conducta apropiada para obtener el

3
reforzador. Un mismo acontecimiento puede ser reforzante para una persona y no para
otra, por tanto debemos ignorar ideas preconcebidas sobre lo que podra ser un
reforzador eficaz y seleccionar aquel reforzador que funcione realmente con la persona a
la que se lo vamos a aplicar.

En resumen, en el C. O. lo que importa es lo que sucede despus de que un organismo


ha realizado una accin, las CONSECUENCIAS que se derivan de esa realizacin,
porque son las que determinarn si vuelve o no a emitirse una conducta Luego,
dependiendo de esas consecuencias, la frecuencia de emisin de una conducta variar:
La frecuencia de ocurrencia de una unidad de conducta ser MAYOR si a esa conducta le
siguen consecuencias AGRADABLES, y ser MENOR si a esa conducta le siguen
consecuencias DESAGRADABLES

La distincin entre condicionamiento instrumental y operante. Cuando se estudia el


aprendizaje en situaciones en las que las posibilidades de respuesta estn restringidas
as como las de obtener recompensas hablamos de C. Instrumental. El ambiente limita las
posibilidades de recompensa. Y el animal o persona estudiados tienen una oportunidad
limitada de comportarse. Por ej, (cajas problema., laberintos) supongamos que
reforzamos a un animal a recorrer un laberinto sencillo en el que el animal tiene una

4
oportunidad limitada de obtener la recompensa. Si el
investigador no repite el experimento la rata no tiene
oportunidad de obtener la recompensa, luego no tiene control
alguno sobre la frecuencia de la recompensa: slo se da una
respuesta instrumental en cada ensayo (este es un ejemplo
de Ensayo discreto). Otro ejemplo: Un nio es recompensado
cada noche despus de terminar sus deberes. El nio puede
obtener la recompensa haciendo los deberes, pero tiene una nica oportunidad de
conseguirla cada noche (instrumental). El ambiente limita las posibilidades de
recompensa. Y el animal o persona estudiados tienen una oportunidad limitada de
comportarse.

El CO implica situaciones en las que no hay limitacin alguna en la cantidad de


reforzamiento que puede obtenerse. El animal puede controlar la frecuencia de respuesta
y por consiguiente determinar la cantidad de reforzamiento obtenido. La ausencia de
restricciones permite que se repita la conducta. En el C. Operante hablamos de Ensayos
operantes y la tasa de respuesta o tasa de
ocurrencia es la medida que suele usarse. Medimos la
tasa de ocurrencia de la respuesta operante. Ej:
Cuntas pulsaciones de la palanca por minuto? Un
total de 8 pulsaciones de la palanca por minuto.
Cuanto ms probable es la conducta, mayor tasa de
respuesta.

5
Primera teora: la asociacin estmulo-respuesta (E-R)

Cuyo ejemplo ms representativo es la ley del efecto de Thorndike.

El condicionamiento instrumental implica el establecimiento de


una relacin E-R: entre la respuesta instrumental (R) y los
estmulos contextuales (E) que estn presentes cuando la
respuesta es reforzada

(R) Respuesta instrumental: presionar un pedal que abre el


mecanismo

(E) Estmulos contextuales: caja

En estas teoras, la funcin del reforzador es fortalecer la asociacin E-R. El reforzador


en s mismo no es codificado como parte de la estructura asociativa, sino que es una
especie de fortalecedor que facilita la formacin de dicha asociacin E-R. (ER:
Reforzador: Comida)

Segunda Teora: la asociacin entre el estmulo y el reforzador (E-C)

Cuando se refuerza una respuesta en presencia de un estmulo, el estmulo tambin se


aparea explcitamente con el reforzador, permitiendo el establecimiento de una
asociacin entre ambos.

6
Desde esta teora, los hbitos surgen cuando
la gente utiliza de manera repetida una
conducta en un contexto particular, para
conseguir una meta.

Los hbitos son cosas que hacemos de


manera automtica, de la misma forma cada vez, y sin pensar. Constituyen el 45% del
comportamiento humano.

La visin anterior, est siendo utilizada para explicar comportamientos como el uso de
drogas: Consumir una droga se considera una
conducta instrumental que en principio es
reforzada por los aspectos positivos de la
experiencia. Sin embargo, con el uso repetido,
el consumo se vuelve un hbito en el sentido
de que llega a ser una reaccin automtica a
las seales del contexto que provocan la
conducta de bsqueda de droga sin considerar
sus consecuencias (Tambin se ha usado para
explicar conductas como la infidelidad, la alimentacin y las apuestas compulsivas).

Tercera teora: la asociacin entre la respuesta (R) y la consecuencia (C).

La intuicin sugiere que la conducta instrumental implica asociaciones R-C: nos peinamos
esperando que eso mejore nuestra apariencia, vamos al cine porque esperamos que la
pelcula resulte entretenida; abrimos la nevera anticipando que eso nos permite obtener
algo de comer..

La suposicin de que existen asociaciones R-C se ha apoyado en los trabajos que


muestran que los cambios en el reforzador afectan a la respuesta instrumental incluso
cuando estos cambios se realizan despus de que la respuesta haya sido aprendida.

La tcnica conocida como devaluacin de la consecuencia est basada en la idea de


que, si en el condicionamiento instrumental se establece una asociacin R-C, cualquier
cambio en el valor de la consecuencia tras el aprendizaje debera llevar a un cambio en la
respuesta. As, cuando la consecuencia fuera devaluada tras el condicionamiento, debera
encontrarse una reduccin en la respuesta que produce la consecuencia devaluada.

Se realiz un experimento en 3 fases:

7
En la primera se reforz a las ratas por empujar una
varita vertical a la derecha o a la izquierda
Las respuestas en una direccin eran reforzadas con
bolitas de comida y las respuestas en la direccin
contraria eran reforzadas con un sorbo de una
solucin dulce.

Skiner pensaba que la conducta operante no es producida por ningn estmulo concreto.
Crea que el animal la emite voluntariamente para recibir el refuerzo. Sin embargo, los
estmulos ambientales s que afectan a la conducta operante, sealan la ocasin para la
respuesta, es decir, nos informan sobre cundo estar disponible el refuerzo y por tanto
actan motivando la conducta operante, tienen una funcin sealizadora.

8
Tipos de reforzadores

R. Positivo: evento R. Primario: Estmulo o


(agradable, apetitivo) evento que posee
aadido al ambiente, que propiedades reforzantes
incrementa la frecuencia de innatas (p.e. la comida,
la respuesta que lo bebida, satisfaccin)
produce: TANGIBLES
(JUGUETES, LIBROS,
OBJETOS), DE R. Secundario o
ACTIVIDAD (IR AL CINE, condicionado: aquel
VER LA TV, PASEAR), Y estmulo o evento que
SOCIALES (ATENCIN, adquiere las propiedades
ELOGIO, INTERS, reforzantes a travs de su
AFECTO) asociacin con los
reforzadores primarios (p.e
dinero, notas, elogios)
Magnitud del refuerzo primario
R. Negativo: evento Nmero de veces que se
(desagradable, aversivo) emparejan el ref. secundario y el
que eliminado del ambiente, primario
incrementa la frecuencia de Demora o intervalo
la respuesta que lo produce interestmulos

9
Un apunte sobre el Refuerzo Secundario: el proceso a travs del cual se aprende la asociacin
entre el secundario y el primario es el Condicionamiento clsico. Por ello, los mismos factores que
afectan a la fuerza de la asociacin entre el EC y el EI afectan a la intensidad del refuerzo
secundario. P.Ej. Dinero
Para los nios Las recompensas tangibles como los juguetes, tebeos, libros, pinturas cromos,
puntos, estrellas, etc
Las actividades como ver la tv, or cuentos, acostarse ms tarde
Las diversas formas de atencin: elogio, inters, afecto, aprobacin ayuda, enhorabuena, son
importantsimas y muy eficaces.
Hay que tener en cuenta dos consideraciones a la hora de recompensar la conducta de un nio:
a) Una determinada recompensa puede no satisfacer a todos los nios y puede incluso no
satisfacer al mismo nio todas las veces
b) la mera atencin de los adultos por ser una recompensa muy fuerte, influir siempre en la
conducta y por consiguiente se le debiera dar preferencia respecto a otras recompensas o
en combinacin con ellas.
LAS VARIABLES QUE DETERMINAN LA INTENSIDAD DE UN REFORZADOR SECUNDARIO
(aquel que adquiere las propiedades reforzantes a travs de su asociacin con los
reforzadores primarios).
El proceso a travs del cual se aprende la asociacin entre el secundario y el primario es el
Condicionamiento clsico. Por ello, los mismos factores que afectan a la fuerza de la asociacin
entre el EC y el EI afectan a la intensidad del refuerzo secundario.
Magnitud del refuerzo primario: cuanto ms intenso es el refuerzo primario con el que se
asocia el secundario mas reforzante ser el secundario.
Nmero de emparejamientos, de veces que se emparejan. Cuantas ms veces se
emparejen ms poder reforzante tendr el secundario.
El intervalo entre estmulos (demora temporal). Cuanto ms tiempo transcurra entre la
presentacin del secundario y el primario ms dbil es el poder reforzante del secundario.
Cuanto menos tiempo, ms fuerte o intenso es el reforzador secundario.

Tipos de refuerzos
Reforzadores inmediatos:
REFORZADORES estmulo reforzador presentado a
continuacin de la conducta.
Intrnseco. Un reforzador se Reforzadores retardados:
considera intrnseco cuando la estmulo reforzador presentado
conducta a fortalecer es reforzante tras un perodo de tiempo
por s misma despus de una conducta.

EST EL REFORZADOR SIEMPRE


Extrnseco. Un reforzador PRESENTE TRAS LA CONDUCTA?:
extrnseco aporta el premio o la Reforzamiento continuo: la
gratificacin que no est presente respuesta deseada se refuerza
en la conducta a reforzar. cada vez que se produce.
Reforzamiento intermitente
(parcial): la respuesta deseada se
refuerza solo algunas veces.

10
El Moldeamiento
Procedimiento de reforzamiento por aproximaciones sucesivas para incrementar la
tasa de respuesta de una conducta

Cuando la conducta a incrementar no es frecuente


Se selecciona una primera conducta con una lnea base ms alta que la conducta
deseada (la que realmente queremos que incremente su frecuencia)
Se refuerza esa primera conducta aumenta su frecuencia

Cambiamos la contingencia a una segunda conducta (ms parecida a la conducta final


deseada) y se refuerza aumenta su frecuencia

Cambiamos de nuevo la contingencia a la ejecucin de la conducta deseada y se


refuerza aumenta su frecuencia
Vamos cambiando la contingencia (respuesta-refuerzo) lentamente, hasta que el
nico medio para obtener el refuerzo es la EJECUCION DE LA CONDUCTA
APROPIADA: REFUERZO DE APROXIMACIONES SUCESIVAS

Como se ve en la imagen, los refuerzos positivos


condicionan al ratn para que encuentre el final del
laberinto. El ratn es recompensado con un alimento cuando
llega a la primera etapa (A). Una vez que este tipo de
conducta se ha arraigado, el ratn no recibe ms
recompensas, hasta que alcanza la segunda etapa (B).
Despus de varios intentos, el ratn debe encontrar el final
del laberinto para recibir su recompensa (C).
Conclusin: las recompensas ms simples pueden condicionar
formas complejas de comportamiento.

11
RATA SE ACERCA AL DISPENSADOR DE
COMIDA
OBJETIVO:

RATA EN EL DISPENSADOR DE COMIDA, SE


GIRA HACIA LA PALANCA

RATA SE DIRIGE HACIA LA PALANCA

RATA PULSA LA PALANCA RATA EST CERCA DE LA PALANCA


CON LA PATA

RATA TOCA LA PALANCA CON EL


HOCICO
www.videos-clip.net/conductual/

Permite establecer conductas nuevas a partir del refuerzo selectivo de otras


conductas existentes en el repertorio del sujeto, para ir aproximndolas de modo
gradual a la meta propuesta. Vamos Rellenando huecos

2. PARADIGMAS O PROCEDIMIENTOS DE CONDICIONAMIENTO


OPERANTE
Los paradigmas o procedimientos de CO se pueden clasificar atendiendo a dos criterios
(1) En funcin de la naturaleza del estmulo que se controla con la conducta
Si el E es agradable hablamos de procedimiento apetitivo
Si el E es aversivo hablaramos de procedimiento aversivo
(2)En funcin de la Relacin o contingencia entre la R y el E
Si la R produce el E, contingencia positiva
Si la R elimina el E, contingencia negativa

12
REFORZAMIENTO POSITIVO
Contingencia positiva entre la R instrumental y un E apetitivo: si el sujeto ejecuta la R,
recibe el E reforzador. la R da lugar al E agradable o apetitivo
REFORZAMIENTO NEGATIVO
Contingencia negativa entre la R instrumental y un E aversivo: si el sujeto ejecuta la
R, se interrumpe o impide la presentacin de un E Estmulo aversivo (la R elimina el E
aversivo)

Supone el incremento en la frecuencia de una R por medio de la eliminacin de un


evento aversivo inmediatamente despus de que se ejecuta la R
Tipos de reforzamiento negativo (en ambos casos lo reforzante es que con la conducta
-sea de escape o de evitacin-desaparece el estmulo aversivo):
-Escape: el E aversivo se presenta, pero se puede interrumpir con la presentacin
de la R instrumental
-Evitacin: el E aversivo se programa para ser presentado en algn momento en el
futuro. La R instrumental impide la presentacin del E aversivo

13
CASTIGO (CASTIGO POSITIVO)
Contingencia positiva entre la R y un E aversivo: si el sujeto realiza la R, recibe el E
aversivo la R da lugar a una consecuencia desagradable)
Es la presentacin de un evento aversivo lo que disminuye la frecuencia de esa R

OMISION (CASTIGO NEGATIVO)


Contingencia negativa entre la R y un E apetitivo: si el sujeto realiza la R, no se
presenta o se elimina el E reforzador. la R elimina / impide/ desaparece estmulo
agradable)

Tipos de Entrenamiento en Omisin:


-Tiempo fuera
-Coste de Respuesta

14
3. PROGRAMAS DE
REFORZAMIENTO
Ya hemos dicho antes que no podemos saber a priori qu refuerzos son los ms efectivos
para todos los organismos, ya que cada persona por ejemplo puede tener unas
preferencias determinadas, unos gustos o cosas deseadas diferentes a los dems. Por
ello, para que un programa basado en los principios del CO sea realmente efectivo
debemos saber qu refuerzos o castigos van a ser efectivos para el grupo de personas o
la persona a la que vayamos a aplicar el programa. Y siempre deberemos administrar
esos refuerzos positivos y negativos de forma CONTINGENTE a la R que queremos
aumentar o disminuir, es decir, los refuerzos deben ser administrados inmediatamente
despus de que la R ocurra.
Esto es sumamente importante a la hora de elaborar cualquier programa, por ejemplo
para eliminar conductas violentas o agresivas, para conseguir comportamientos
adecuados, fomentar la atencin escolar
Tan importante como la aplicacin de un determinado tipo de refuerzo y de una
determinada cantidad de refuerzo es el modo concreto de aplicacin.
Skinner especific que el reforzamiento puede programarse siguiendo dos criterios
bsicos: (1) en base al nmero de Rs emitidas (al que llam programa de reforzamiento
de razn) y (2) en base al tiempo (al que llam programa de reforzamiento de intervalo).
Lo cierto es que en la vida real, no siempre que damos una respuesta aparecer el
reforzador.
El programa de reforzamiento determina cundo la ocurrencia de la respuesta va a ir
seguida de un reforzador.
Los programas de reforzamiento se refieren, pues, a la forma de administrar el refuerzo
o pautas a seguir en su aplicacin. Segn Skinner, estos programas son las
Contingencias que especifican con qu frecuencia y cundo debemos actuar para recibir
el reforzamiento.

15
3.1. SEGN CRITERIOS DE FRECUENCIA DE RESPUESTA

Programas de Razn Fija (RF)


Es necesario emitir la conducta un nmero fijo o constante de veces para poder
obtener el refuerzo
P.ej.: RF-10 (el refuerzo se obtiene cada 10 respuestas)
Caracterstica distintiva: pausa posreforzamiento (la respuesta se interrumpe
temporalmente despus del reforzamiento, despus de la pausa se reanuda la
respuesta)
Cuanto ms elevada es la razn del programa (ms
respuestas se requieren para obtener el refuerzo
Cuanto mayor es el esfuerzo necesario para obtener el refuerzo
La duracin de la pausa tambin vara, siendo ms grande cuanto
ms elevada es la razn del programa.

16
El refuerzo siempre depende de que el sujeto realice la conducta un nmero fijo de
veces. La tasa de R aumenta con los programas de RF ms altos. Ejemplos, recibimos
un cheque por cada cinco encuestas realizadas, recibimos un regalo por cada cinco
cupones, trabajo por nmero de piezas montadas, etc.

RF-10 RF-20

Respuestas Paus as
emitidas
acumuladas

Tiempo -->
Registro acumulativo tpico de una rata sometida a entrenamiento de recompensa mediante un
programa RF-10 (izda.) y un programa RF-20 (dcha). Los trazos gruesos y cortos indican los puntos en
que se administr recompensa

Programas de Razn Variable (RV)


El nmero de veces que hay que realizar la conducta para poder obtener el refuerzo
es variable, vara alrededor de una media de respuestas
P. ej.: RV-10 (el sujeto tiene que realizar por trmino medio 10 veces la conducta, pero
puede obtener el primer refuerzo tras emitir la conducta 5 veces y responder a
continuacin 15 veces para obtener el siguiente reforzador)
La pausa posreforzamiento slo ocurre ocasionalmente
En cualquier momento puede haber refuerzo si se emite la conducta (es
variable). No se puede anticipar o preveer exactamente cundo va a
volver a reforzarse la conducta, y esa ausencia de pausas

17
postreforzamiento hace que la tasa de respuesta sea ms elevada en los
programas de RV que en los de RF
Las conductas que se aprenden con este programa son ms resistentes a la
extincin (Esto puede explicar la persistencia caracterstica de la conducta de juego. Por
ejemplo las mquinas tragaperras que estn programadas para dar premio tras un
nmero variable de jugadas)

R V -10 R V -20

Respuestas
emitidas
acumuladas

T iem po -->
Registro acumulativo tpico de una rata sometida a entrenamiento de recompensa mediante un
programa RV-10 (izda.) y un programa RV-20 (dcha). Los trazos gruesos y cortos indican los puntos en
que se administr recompensa

3.2. SEGN CRITERIOS TEMPORALES

Programas de Intervalo Fijo (IF)


El tiempo que ha de transcurrir como mnimo para poder administrar el refuerzo es
siempre el mismo (constante)
P.ej: IF-5 (cada cinco minutos reforzamos la conducta):
-Debe pasar cinco minutos desde que se administr el refuerzo la ltima vez
-Si durante esos 5 minutos (hasta que se vuelva a reforzar) se produce la conducta,
sta no se refuerza
-Cada intervalo de 5 comienza a partir de la ltima vez que se administr el refuerzo
-Se refuerza la primera respuesta emitida despus que haya transcurrido dicho
intervalo, pero tiene que haber R, si no la hay, aunque hayan trascurrido 5 minutos
no se refuerza (por ejemplo, cuando una rata ha presionado la palanca, y se le ha reforzado,
aunque siga presionndola no la reforzarn hasta que transcurran 5 minutos)
Ejemplo el correo se reparte todos los das a la misma hora. La conducta de mirar si ha llegado se
incrementar conforme se acerca la hora del reparto
En este tipo de programas, la aparicin del reforzador depende del paso del tiempo y de la ejecucin
de la R.

18
Suele ocurrir lo siguiente: Se deja de responder despus de recibir el reforzamiento
-La respuesta desciende inmediatamente despus del refuerzo, ya que se ha
aprendido que el refuerzo no volver a estar disponible hasta el final del intervalo
-Luego aumenta lentamente la respuesta conforme se aproxima el momento en el que
est disponible nuevamente el reforzamiento.
Por tanto, se deja de responder despus de recibir el reforzamiento, ya que las Rs
que se realizan despus de la entrega del reforzamiento no son reforzadas. De este
modo los animales aprenden a esperar a dar la respuesta hasta el momento en que
se aproxima el final del intervalo fijo, cuando se acerca el momento de estar
disponible de nuevo el reforzador.
Skiner llam a este patrn de respuestas caracterstico Efecto de festoneado (pausa
ms larga cuanto mayor es el intervalo)

IF -3 0 s g .

Respuestas
emitidas Pocas Rs en el
acumuladas principio del
intervalo

Muchas Rs al
final del
intervalo

Tiempo

Registro acumulativo tpico de una rata sometida a IF-30sg.

Dos variables parecen influir en la duracin de la pausa en los programas de IF.


-En primer lugar la capacidad para contener la R hasta el final del intervalo aumenta
con la experiencia
-En segundo lugar, la pausa es ms larga con programas de IF ms grandes.

19
No existen muchas situaciones de la vida real en que las conductas se refuercen en base
a este tipo de programas. Ejemplo exmenes: no se estudia nada al comienzo del
cuatrimestre y la tasa de estudio aumenta rpidamente conforme se acerca el da del
examen. Se producira una tasa ms alta de estudio si los exmenes se realizaran con
frecuencia y por sorpresa.
Programas de Intervalo Variable (IV)
El tiempo que ha de transcurrir para poder administrar el refuerzo vara alrededor de
una media. Intervalos entre refuerzos variables
P.ej: IV-5 (el intervalo medio para administrar el refuerzo son 5 minutos, pero unas
veces podr transcurrir 8 minutos para ser reforzado desde la ltima vez que emiti la
conducta, y otras slo 2 minutos)
No se produce el efecto de festoneado , la respuesta es constante y lenta. Por ejemplo
la pesca: a veces pican enseguida y otras hay que esperar un buen rato.

IV-30sg.
R espuestas
emitidas
acumuladas

T iem po

R egis tro ac um ulativ o tpic o de una rata s om etida a IV -30s g.


.

Programas compuestos
Se combinan dos o ms programas simples
Por ejemplo una rata tiene que presionar una palanca 10 veces (RF10) y esperar un
minuto (IF1) despus de la ltima R para que la presin de la palanca de lugar al
refuerzo.

REPASO :

20
21
22
Adems de las respuestas independientes, tambin podemos reforzar la tasa de
respuesta (la velocidad a la que se dan las respuestas). A esto se le llama Reforzamiento
de los TER (tiempo entre respuestas)
Ejemplo: quiero que un animal d, como mnimo, 12 respuestas por minuto. Entonces, le
doy reforzador slo si produce una respuesta en los 5 segundos siguientes a la anterior
respuesta. Si responde cada 5 segundos o menos, tiene una tasa de 12 respuestas por
minuto, lo que yo quera. Si tarda ms de 5 segundos en responder, no es reforzado
aunque responda. Eso har que se vuelva ms rpido en el futuro

Por otra parte, los experimentos en los que solo se mide una respuesta, ignoran la
riqueza y complejidad de la conducta.
Constantemente la gente debe elegir entre dos o ms programas simples de
reforzamiento que estn disponibles al mismo tiempo. Por ejemplo, en la vida cotidiana,
una persona podra tener que elegir entre salir o quedarse en casa. Si decide salir,

23
puede optar por comer, ir al cine, ir a un parque, visitar a un amigo, etc. Si se queda en
casa, puede optar por baarse, ver TV, cocinar, dormir, etc.

Y finalmente, relacionado tambin con las elecciones que hacemos e puede hablar del
AUTOCONTROL
En la vida, las elecciones importantes
implican un beneficio pequeo a corto
plazo contra un beneficio mayor pero
ms demorado.
Se dice que la gente carece de
autocontrol si elige recompensas
pequeas a corto plazo en lugar de
esperar por un beneficio mayor

24
TEMA 3.2. CONDICIONAM. OPERANTE (II):
CONDICIONAMIENTO DE RECOMPENSA
CAP. 5, 7 y 9
1. FACTORES QUE INFLUYEN EN LA ADQUISICION DE LA CONDUCTA

1.1. La demora de la recompensa. La importancia de la contigidad


Cuanto ms prximos en el tiempo estn la respuesta y la recompensa, mayor es el
condicionamiento de la respuesta instrumental

1.2. La magnitud de la recompensa


Cuanto ms grande es la magnitud de la recompensa, mayor es el nivel de la
respuesta instrumental

1.3. Otros factores (diferencias inter- e intraindividuales)

1. EL PRINCIPIO DE PREMACK Y LA NATURALEZA DEL REFORZAMIENTO

La teora de la probabilidad diferencial


Aborda las condiciones bajo las que un acontecimiento ambiental es reforzante
Segn esta teora, todos los reforzadores comparten una caracterstica: un reforzador es
cualquier actividad cuya probabilidad de ocurrencia es mayor que la de la conducta reforzada.
2. LA EXTINCION DE LA CONDUCTA Y LOS FACTORES QUE CONTRIBUYEN A LA
RESISTENCIA A LA EXTINCION

Si dejamos de presentar un reforzador tras una respuesta, sta puede extinguirse. Los
factores que contribuyen a que una respuesta sea resistente a la extincin son los siguientes:

2.1. La magnitud de la recompensa durante la adquisicin


Depende de la cantidad de entrenamiento durante la adquisicin: si ste es mnimo hay
mayor resistencia a la extincin, con un entrenamiento prolongado hay menor resistencia
2.2. La demora de la recompensa durante la adquisicin
Depende de las veces que se haya demorado la recompensa durante la adquisicin: si se
ha demorado algunas veces la resistencia aumenta, en cambio si siempre se ha
demorado no hay efecto en la resistencia a la extincin
2.3. La consistencia del reforzamiento durante la adquisicin
Una respuesta que no ha sido siempre reforzada (reforzamiento variable) persiste ms
tiempo que una que ha sido siempre reforzada (reforzamiento fijo)
3. APLICACIONES: MANEJO DE CONTINGENCIAS
Se refiere a la aplicacin del proceso de condicionamiento operante para modificar la
conducta humana (individual y grupal)
Fases: Evaluacin, contrato y ejecucin del programa

25
1. FACTORES QUE INFLUYEN EN LA ADQUISICION DE LA
CONDUCTA
Cunto tiempo tarda en aprenderse una respuesta instrumental?

Fundamentalmente hay dos factores que juegan un papel muy importante en la magnitud
del condicionamiento, en la fuerza de la respuesta resultante o en la frecuencia o tasa de
la respuesta:

1.1.La demora de la recompensa (la importancia de la contigidad temporal


entre conducta y refuerzo)

Inmediatez o rapidez de presentacin del refuerzo

1.2.La magnitud o intensidad de la recompensa (o refuerzo)

Importancia de la experiencia pasada con la recompensa

1.1. La demora de la recompensa (la importancia de la contigidad entre


conducta y refuerzo)
Cuanto ms prximos en el tiempo estn la respuesta y la
recompensa, mayor es el condicionamiento de la respuesta
instrumental

Por el contrario, cuanto ms grande es la demora entre la respuesta y la


recompensa, menor es el condicionamiento que se produce

La recompensa influye en la adquisicin de una conducta si sigue inmediatamente a su


ejecucin (si no hay excesiva demora entre refuerzo y conducta). Por eso, el
reforzamiento inmediato es ms efectivo que el demorado. Una de las explicaciones
es que en el intervalo que existe entre la respuesta (R1) y el reforzador, estn ocurriendo
otras conductas (R2, R3, R4etc). As, se hace difcil que el animal establezca la relacin
entre R1 y el reforzador, cuando el reforzador se entreg en R6.

El efecto de demora puede reducirse si introducimos un segundo refuerzo en el


intervalo de demora entre la conducta y su refuerzo primario (como en el sistema
de Economa de fichas). Es como si ese segundo refuerzo actuase como puente
temporal que fortalece la conexin entre la conducta y su refuerzo primario. Se
trata de usar un reforzador condicionado secundario: por ejemplo, con una rata, se
usa el reforzador secundario (un click) en cuanto el animal realiza la conducta
operante, aunque posteriormente se entregue el reforzador primario (comida). Otro
ejemplo: reforzar provisionalmente (mediante reforzamiento secundario, por
ejemplo puntos) a un nio por determinadas conductas (como ordenar la
habitacin) y cada cierto tiempo cambiar los puntos por refuerzo primarios (ver la
televisin). Aunque la demora entre las conductas deseables y el refuerzo primario
(ver la TV) es larga, el hecho de que exista una clave reforzante secundaria en ese

26
intervalo de demora (los puntos) aumenta la fuerza de la conexin entre la
conducta y el refuerzo primario, por la asociacin del refuerzo secundario con el
primario (CC)

Tambin, con el Procedimiento de marcado: se hace distinguible la conducta


operante correcta de otras incorrectas. Por ejemplo, retirar al animal del ambiente
experimental y ubicarlo en un espacio distinto, mientras transcurre la espera del
reforzador
1.2. La magnitud de la recompensa (o refuerzo)
Cuanto ms grande es la magnitud de la recompensa, mayor es el nivel de
la respuesta
La magnitud de la recompensa que se proporciona tras una conducta, influye en su tasa
de adquisicin, su intensidad y probabilidad de ejecucin

La experiencia pasada con una recompensa influye en la adquisicin de una conducta, si


esa recompensa cambia de magnitud en ocasiones posteriores

(de un valor alto pasa a un valor bajo) (de un valor bajo pasa a uno alto)

Efecto de depresin (frustracin) Efecto de elacin

Efecto de depresin o contraste negativo:

-Un cambio en la magnitud de una


recompensa alta a una baja, produce un
nivel de conducta inferior al que sera de
esperar en el caso de que la recompensa
siempre hubiera sido baja
La experienc. pasada con una recomp.
grande EXAGERA el efecto que produce
una DISMINUCION en la magnitud de
dicha recompensa. La recompensa
pequea es MENOS EFECTIVA de lo que
sera normalmente, si antes se ha tenido
una recompensa mayor.

Efecto de elacin o contraste positivo:

-Un cambio en la magnitud de una


recompensa baja a una alta produce un
nivel de ejecucin superior al que sera
de esperar en el caso de que la
recompensa siempre hubiera sido alta
La experienc. pasada con una recomp.
pequea EXAGERA el efecto que
produce
Otros un AUMENTO
factores en la cantidad
que influyen en la de
adquisicin:
dicha recompensa. La recompensa
grande es MAS EFECTIVA de lo que
sera normalmente, si antes se ha tenido
27
una recompensa pequea
1.3.Otros factores que influyen en la adquisicin:

El ajuste persona-refuerzo (diferencias interindividuales)

Utilizar un refuerzo que realmente sea eficaz para la persona a la que se


le aplicar tras su conducta

El estado de la persona (diferencias intraindividuales)

Hay que tener en cuenta que un mismo refuerzo puede funcionar en un


momento dado y en otro ser ineficaz

Nivel de desarrollo evolutivo, estado fsico, estado psicolgico, necesidades, intereses

2. EL PRINCIPIO DE PREMACK Y LA NATURALEZA DEL


REFORZAMIENTO
La teora de la probabilidad diferencial
Aborda las condiciones bajo las que un acontecimiento ambiental es reforzante

Una actividad tambin puede ser un refuerzo: ver la TV, ir al cine

Segn esta teora, todos los reforzadores comparten una caracterstica: un


reforzador es cualquier actividad cuya probabilidad de ocurrencia es mayor
que la de la conducta reforzada. (Si la probabilidad de ir al cine es mayor que la de
estudiar, podemos utilizar ir al cine como reforzador para el estudio)

Aplicacin: uso de reforzadores de actividad (Utilizar actividades como reforzadores


para instaurar modelos deseados de conducta: Ers una tcnica muy usada y muy
eficaz.

Por ejemplo quiero instaurar la actividad de lectura que es de baja frecuencia y s que
la actividad de pintar es de alta frecuencia. Pues bien, puedo incrementar la
actividad de lectura si hago que esta actividad sea necesaria para poder pintar

Este principio parte de dos supuestos.

1. Si a un sujeto se le da acceso libre a dos actividades dedicar un tiempo


determinado a cada una de ellas y ese porcentaje de tiempo reflejar el grado de
preferencia de esa actividad (principio de probabilidad diferencial)

2. La actividad preferida (A) se volver el reforzador de la actividad menos


preferida (B), as slo podr tener acceso a la actividad (A) si previamente realiza
la actividad menos preferida (B).

28
3. LA EXTINCION DE LA CONDUCTA Y
LOS FACTORES QUE CONTRIBUYEN A LA
RESISTENCIA A LA EXTINCION
Si dejamos de presentar un reforzador tras una respuesta
previamente reforzada, sta puede extinguirse
Dejamos de dar refuerzo

Es posible que acabe


extinguindose la conducta

29
El fallo continuado de la Respuesta para producir el reforzamiento hace que la fuerza
de esa respuesta disminuya hasta que finalmente deje de ejecutarse. (ej rata/palanca-
nio/rabietas)
Al principio cuando se interrumpe el refuerzo la tasa de respuesta es alta pero el fracaso
posterior de la respuesta para producir el reforzamiento, hace que la tasa de respuesta
disminuya hasta que la conducta deja de ejecutarse.
Recordad que en la extincin hay una declinacin en la frecuencia, intensidad o tasa de
respuesta como consecuencia de que se retira el refuerzo, pero no supone el olvido de
la respuesta

C. CLASICO C. INSTRUMENTAL

Reduccin de una R cuando el EC ya no Reduccin de una R instrumental cuando ya


va seguido del EI no va seguida por el reforzador.
Cuando una R deja de ser eficaz para conseguir un
refuerzo, sta va disminuyendo su frecuencia hasta
no ejecutarla

30
Tres factores influyen en la rapidez de la extincin de la R:

En la extincin, La disminucin de la respuesta se debe a los efectos frustrantes de la


ausencia de reforzamiento.

Magnitud de la recompensa recibida durante la adquisicin de una R y la


duracin del entrenamiento (o nmero de emparejamientos conducta-
refuerzo)
La demora de la recompensa durante la adquisicin:
Demora constante= no afecta a la extincin
Demora variable = incrementa la resistencia a la extincin
La consistencia del reforzamiento durante la adquisicin: Efecto del
Reforzamiento Parcial en la extincin (ERPE) (un reforzamiento continuo
hace ms fcil la extincin que uno parcial)
R reforzada siempre = menos resistencia a la extincin
R no reforzada siempre = ms resistencia a la extincin

31
3.2.La demora de la recompensa durante la adquisicin
Depende de las veces que se haya demorado la recompensa durante la adquisicin:

32
Si se ha demorado algunas veces (variable) durante la
adquisicin (es decir, si el tiempo entre la emisin de la
respuesta hasta la obtencin del refuerzo ha sido variable a lo
largo de distintos ensayos), la resistencia a la extincin es
MAYOR (se extingue ms lentamente)
Si siempre se ha demorado el mismo tiempo durante la adquisicin
(ha sido una demora constante), NO hay efecto en la resistencia a la
extincin

3.3.La consistencia del reforzamiento durante la adquisicin


Depende del tipo de reforzamiento (variable o fijo) administrado durante la
adquisicin

Una respuesta que no ha sido siempre reforzada


(reforzamiento variable o intermitente) persiste ms tiempo
durante la extincin (la resistencia a la extincin es MAYOR)

Efecto del reforzamiento parcial en la extincin


(ERPE): El sujeto no sabe prever si aparecer o no
el refuerzo, por ello seguir durante un tiempo
emitiendo la conducta

Una respuesta que ha sido siempre reforzada (reforzamiento fijo o


continuo) persiste menos tiempo (la resistencia a la extincin es
MENOR)

33
El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia de
reforzador.

Otras explicaciones:
. Teora de la Frustracin (Amsel). El reforzamiento intermitente incluye ensayos
reforzados y no reforzados. Los ensayos reforzados animan al sujeto a responder,
mientras que los No recompensados, desalientan la respuesta. Por lo que existen
tendencias de respuesta opuesta. Sin embargo, a medida que el entrenamiento
contina, el conflicto se resuelve a favor de responder.
. Teora Secuencial (Capaldi). Es similar a la anterior, pero no basada en la reaccin
emocional, sino en la memoria. Los sujetos pueden recordar si fueron reforzados o no
por realizar la conducta instrumental en el pasado reciente. Se asocia la memoria de No
haber sido recompensado con la expectativa de recibir la recompensa, por eso responde
en un programa de reforzamiento intermitente.

4. APLICACIONES DEL CONDICIONAMIENTO OPERANTE PARA EL


DESARROLLO DE CONDUCTAS

SKINNER en 1953 sugiri que algunos problemas de


conducta surgan de un manejo inadecuado de las
contingencias de reforzamiento.

La importancia del reforzamiento y no reforzamiento


en la conducta muchos psiclog@s han
diseado procedimientos de condicionamiento
Como de lapara
ausencia
CONTROLAR y CAMBIAR la conducta humana.
de la misma

Tanto de la presentacin de
una recompensa
Reestructuracin de contingencias o MANEJO de
CONTINGENCIAS (recompensas para INSTAURAR
patrones de conducta
Nuestro modo demsactuar
eficaces y ausencia de
reforzamiento para ELIMINAR pautas de conducta
depende:
inapropiadas).

SISTEMAS DE ORGANIZACIN O MANEJO DE CONTINGENCIAS:


Busca modificar la conducta humana (y es un medio eficaz para modificarla, de hecho
el fracaso del tratamiento para la modificacin de una conducta se debe, a veces, a
que el programa no se ha elaborado bien o no se ha aplicado correctamente, siendo
necesarios algunos cambios en el tratamiento para garantizar el cambio conductual)

34
Estos sistemas utilizan contingencias de reforzamiento y no reforzamiento para
incrementar las conductas apropiadas y eliminar o reducir las inadecuadas
Fases:
Evaluacin de las conductas
Contrato de contingencias
Ejecucin y evaluacin de los cambios

1. Fase inicial de evaluacin de las conductas


Definir y medir la frecuencia de las conductas apropiadas e inapropiadas

Determinar las condiciones bajo las que se producen estas conductas

Identificar el reforzamiento que mantiene la conducta inapropiada registrando los


acontecimientos que siguen a la conducta problema, y cundo y dnde se produce-
(entrevistas, observacin directa). Independientemente de quien observe la
conducta es fundamental un entrenamiento para realizar una observacin fiable y
asegurar un registro correcto de los datos.

Identificar los potenciales reforzadores para las conductas apropiadas. Hay que
instruir a los padres, profesdores, para elaborar el registro en el que debera
aparecer el da, el nmero de la conducta-problema, la duracin de las misma, las
reacciones ante las misma de los padres o dems personas, etc. Ya que nos pueden
decir qu refuerzos estn actuando manteniendo la conducta problema.

2. Fase del contrato de contingencias


Especificar la respuesta deseada y la relacin entre esa respuesta y el reforzamiento
(pauta)

Establecer el mtodo para la administracin de la contingencia de reforzamiento


sobre la conducta apropiada (programa de reforzamiento)

Establecer las contingencias de no reforzamiento o de castigo sobre la conducta


inapropiada que se quiere reducir o eliminar

Entrenar a las personas que van a administran el reforzamiento (Pueden ser


personas prximas, personal de un centro, pero tambin autorefuerzo para
(conductas impulsivas/ hbitos de estudio inadecuados)

35
3. Fase de aplicacin de la tcnica
Se aplica el tratamiento: presentacin del reforzamiento/castigo contingente a la R
apropiada/inapropiada o sobre la ausencia de la conducta apropiada/inapropiada (o
ambas cosas). Presentacin de castigos contingentes a las conductas inadecuadas.

4. Fase inicial de evaluacin de los cambios conductuales


Se evalan los cambios producidos en la respuesta durante y despus del
tratamiento (asegura que los cambios se deben a la terapia y que se mantienen una
vez ha concluido el tratamiento formal)

El manejo de contingencias se ha utilizado para


modificar muchas conductas diferentes

-hbitos de cuidado personal inadecuados,


-bajo rendimiento acadmico,
-fobias y ansiedad
-respuestas antisociales...

Tcnicas destinadas a promover o desarrollar


conductas deseadas:

Sistema de Economa de fichas


(Ayllon y Azrin en Illinois con pacientes
psicticas)

Contratos conductuales

Sistema de Economa de fichas


Programa de refuerzo sistemtico que premia con fichas a las personas que muestran
conductas deseadas. Posteriormente se pueden cambiar
las fichas por otros reforzadores ms deseables para el
sujeto.

Fases en su aplicacin teraputica

1. Fase de muestreo o establecimiento de la ficha como


reforzador generalizado: establecer el valor de la ficha
como objeto de intercambio

2. Fase de establecimiento del programa: aplicacin contingente de las fichas por las
conductas deseadas. Esto requiere:
- definir claramente cules son las conductas deseadas
- la entrega de fichas cada vez que se dan estas conductas

36
- especificar los objetos o actividades por los que se pueden canjear las fichas,
cuntas fichas necesitan para lograrlos y qu conductas han de realizar
Subfases:
Descripcin de la conducta en trminos claros y comprensibles
Cantidad de fichas que se obtendrn por realizar la conducta
Bsqueda de reforzadores adecuados y definicin
Establecimiento del sistema de fichas (momentos, frecuencia de entrega,
quin se encarga y dnde se lleva a cabo)
Establecimiento de un sistema de cambio de las fichas por los reforzadores
Establecimiento de un sistema de registro (conocer la tasa de emisin de las
conductas deseadas, la cantidad de fichas ganadas)
3. Fase de desvanecimiento o finalizacin del control de las conductas por fichas:
una vez consolidada la conducta, se retiran las fichas por reforzadores sociales del
ambiente (aprobacin, acercamiento)

Es conveniente comenzar con abundante entrega de fichas (refuerzo continuo) para


motivar al sujeto a participar, aunque haya una escasa emisin de conductas

Pero poco a poco hay que ir elevando el nivel de exigencia para conseguir las fichas
(que la conducta se realice ms veces o en un periodo de tiempo mayor), y ms fichas
para lograr el mismo refuerzo

Despus se pasar a un reforzamiento variable

Es necesario establecer un programa para conseguir que las conductas se generalicen


a otros ambientes y se sigan emitiendo una vez concluido el programa. Por ello hay
que sustituir el reforzamiento de fichas por reforzamiento social (que adquiera
conciencia de lo beneficioso que resulta para l realizar la conducta)

Contratos Conductuales
OBJETIVO: Controlar las consecuencias de las conductas a fin de que no se
produzcan refuerzos inadecuados para conductas incorrectas o falta de refuerzo para
las deseadas

Es un documento escrito y firmado que especifica las acciones que el sujeto est de
acuerdo en realizar y establece las consecuencias del cumplimiento y del no
cumplimiento de tal acuerdo

El contrato inicial se establece por un perodo de tiempo determinado y se puede ir


modificando

Debe especificarse:

37
La conducta o conductas que se espera que emita cada una de las
personas implicadas

Las consecuencias que se obtendrn si se realizan esas conductas

Las consecuencias que se obtendrn si no realizan esas conductas

Es conveniente recompensar rpidamente al principio- a la emisin o no emisin de


las conductas (por pequeas que sean) para motivar a los sujetos a mantenerse en lo
estipulado en el contrato e intensificar sus exigencias

Pero poco a poco hay que ir demorando las contingencias

Tanto las conductas objetivo de intervencin como las contingencias positivas y


negativas deben establecerse por ACUERDO entre las partes implicadas

Un contrato es pues un acuerdo de intercambio que especifica quin ha de hacer


que cosa, para quin y bajo qu circunstancias

As, las expectativas estn claras y las partes implicadas conocen los costes y
beneficios de hacer algo

Aplicacin: reducir el consumo de sustancias, establecer hbitos de estudio


adecuados, de higiene y orden, problemas interpersonales (familiares y de pareja)

Consta de:

Fechas relevantes (comienzo, finalizacin,


revisin)

Conductas objetivo del cambio (lo que los


implicados harn para cumplir el acuerdo).
Evitar la ambigedad: qu conductas sern
cambiadas, por quin, dnde, cundo, con qu
frecuencia

Recompensas (lo acordado por cambiar las


conductas objetivo)

Sanciones (lo acordado por falta de progreso


o fracaso en el cumplimiento)

Registro (para ver si se alcanza el objetivo


de cambio, ver el progreso)

Debe ser escrito, firmado y revisado


regularmente

38
PASOS A TENER EN CUENTA PARA PROMOVER EL CAMBIO EN LA
CONDUCTA

1. Identificar la conducta o R que queremos modificar


(incrementar o disminuir)
2. Determinar la tasa de lnea base de esa R frecuencia
de la R en un momento determinado.
3. Determinar qu refuerzo o castigo va a aplicarse para
conseguir un cambio conductual
-Especfico a la persona o grupo
-Llevar a cabo un anlisis minucioso del comportam. para AISLAR
los refuerzos que mantienen la conducta que queremos cambiar
4. Aplicar el refuerzo o castigo inmediatamente despus que
se d la conducta.
-La persona debera saber qu es lo que se espera de ella, y qu
conductas sern recompensadas
-Comenzar con REF. CONTINUO para lograr efectos rpidos, y
luego pasar a REF. INTERMITENTE para consolidar
-No reforzar nicamente el resultado final, es muy importante
reforzar cualquier progreso por pequeo que sea
5. Despus de un tiempo, eliminar el refuerzo para ver si la
tasa de conducta vuelve a la anterior lnea base o por el
contrario se mantiene (programa de seguimiento)

ALGUNAS RECOMENDACIONES

CMO DEBEN SER LOS PREMIOS:

Los premios deben estar relacionados con la conducta.

Deben ser algo deseado.

Premiar el proceso es ms til que premiar el resultado final en


conductas difciles.

Un premio ganado por una conducta no puede utilizarse como castigo


para otra conducta.

Premiamos el esfuerzo por alcanzar una conducta, no la conducta en


s.

Cada vez exigiremos un esfuerzo mayor al nio para conseguir el


mismo premio.

Debemos tratar de sustituir los refuerzos externos por internos.

39
LOS CASTIGOS QUE NUNCA DEBEMOS UTILIZAR:

Ridiculizar al nio en privado o en pblico. Despreciar al nio.


Gritarle de forma prolongada o regaarle en pblico.
Exhibir sus errores.
Quitarle de las nicas actividades en las que muestra inters. Sus
nicas fuentes de satisfaccin y de sentimiento de vala personal.
Agredir fsicamente.
Demostrar cualquier modo de descontrol ante la conducta del nio.
Decirle que no le quieres por su mal comportamiento y que nadie le
va a querer si no cambia.
Castigos muy prolongados.
Castigarle por todo.
Sentarlo en el rincn de los torpes.
Decirle que no vale nada.
Tratar de que se ponga en el lugar de otro compaero, humillndole
o aplicndole lo que l mismo le hizo.

ALGUNAS ORIENTACIONES

Para fortalecer una conducta nueva: proporcionar recompensa


inmediatamente despus de cada desempeo correcto.

Para desarrollar una conducta nueva: utilizar el moldeamiento o


aproximaciones sucesivas a la conducta meta.

Para mantener una conducta nueva: disminuir en forma gradual o


intermitente la frecuencia con que se recompensa la conducta
correcta.

Para poner fin a una conducta inadecuada: Utilizar la


EXTINCIN: hay que evitar cualquier recompensa despus de la
accin inadecuada o usar una ALTERNATIVA INCOMPATIBLE o
CONTRACONDICIONAMIENTO: se puede recompensar una
accin alternativa que es incompatible con la accin indeseable y
que no puede realizarse al mismo tiempo de sta.

40
TEMA 3.2. CONDICIONAM. OPERANTE (III):
CONDICIONAMIENTO AVERSIVO: ESCAPE Y
EVITACION
CAP. 10

1. CONDICIONAMIENTO DE ESCAPE (O HUDA): ADQUISICION Y EXTINCION


Aprendizaje por el cual aumenta la frecuencia de una conducta para escapar o huir de
un estmulo aversivo
a. Factores que influyen en el aprendizaje y eficacia de la conducta de escape
La intensidad de la estimulacin aversiva. Cuanto ms grande es la intensidad
de un estmulo aversivo, ms rpidamente se produce el condicionamiento de escape
La cantidad de reforzamiento negativo (el grado de reduccin de la
estimulacin aversiva). Cuanto mayor es la reduccin de la estimulacin aversiva, ms
rpidamente se produce el condicionamiento de escape
La demora del refuerzo negativo o recompensa. Cuanto ms grande es la
demora en la terminacin del estmulo aversivo, ms lenta es la adquisicin de la
respuesta de escape
b. Extincin de la respuesta de escape
Por la supresin del reforzamiento negativo . La respuesta de escape se
extingue si no se interrumpe el estmulo aversivo tras la respuesta
Por la ausencia o desaparicin del estmulo aversivo. La respuesta de escape se
extingue si deja de presentarse el estmulo aversivo tras la respuesta
2. CONDICIONAMIENTO DE EVITACION: CARACTERISTICAS Y FACTORES QUE
AFECTAN
Aprendizaje por el cual aumenta la frecuencia de una conducta para evitar o impedir
que aparezca un estmulo aversivo
a. Tipos de conducta de evitacin: Activa y Pasiva
Conducta de evitacin Activa: se responde para evitar la situacin aversiva
Conducta de evitacin Pasiva: no se responde para impedir la exposicin a una situacin
aversiva
b. Factores que influyen en la adquisicin de una conducta de evitacin
La intensidad de la estimulacin aversiva
Depende del tipo de tarea de evitacin (fcil o difcil)
La duracin del intervalo interestmulos (el estmulo que provoca el miedo y el
acontecimiento aversivo)
Cuanto ms grande es el intervalo EC-EI, aumenta el tiempo necesario para la
adquisicin de una respuesta de evitacin
Aplicacin: prevencin de la respuesta o inundacin

41
CONDICIONAMIENTO AVERSIVO

El condicionamiento, sea clsico o instrumental, se realiza muchas veces con estmulos


aversivos. Un estmulo aversivo es lo que en lenguaje cotidiano llamamos estmulo
"molesto", "incmodo", "doloroso", "desagradable", "nocivo", etc., es decir, su aplicacin al
sujeto tiene para l consecuencias negativas. La aversividad es pues cualquier evento
que produzca una percepcin de malestar o desagrado.
Los paradigmas o tareas experimentales en los que se ha usado estimulacin aversiva, al
menos en el condicionamiento instrumental, son esencialmente cuatro: escape, evitacin,
castigo e indefensin aprendida. En los dos primeros se ha utilizado estimulacin aversiva
en su acepcin de refuerzo negativo; en el tercero se trata de estimulacin punitiva; en el
cuarto la estimulacin punitiva no es contingente a la respuesta.

Condicionamiento aversivo: proceso de aprendizaje relacionado con acontecimientos


aversivos

Refuerzo negativo: AUSENCIA de un Estmulo aversivo que INCREMENTA la


frecuencia de una conducta

CONDICIONAMIENTO DE ESCAPE (O HUDA)

CONDICIONAMIENTO DE EVITACION

Castigo: PRESENCIA de un Estmulo aversivo que DISMINUYE la frecuencia de


una conducta

Condicionamiento aversivo: REFORZAMIENTO


NEGATIVO

Podemos escapar de Podemos evitar algunos de


algunos de ellos ellos (podemos prever las
(ponerles fin) circunstancias adversas)

Procesos
responsables:

ESCAPE EVITACIN

42
Refuerzo negativo: AUSENCIA de
un Estmulo aversivo que
INCREMENTA la frecuencia de
una conducta

TIPOS

ESCAPE (O HUDA): el E
aversivo est presente, pero se
puede interrumpir con la En ambos casos lo
presentacin de la R reforzante es que con mi
conducta (sea de escape o
de evitacin) desaparece el
EVITACION: el E aversivo se estmulo aversivo
programa para ser presentado en
algn momento en el
futuro. La R impide la
presentacin del E aversivo

1. CONDICIONAMIENTO DE ESCAPE (O HUDA): ADQUISICION Y


EXTINCION
Algunos acontecimientos no los podemos evitar, no podemos prever las circunstancias
adversas, PERO S ESTAR PREPARADOS PARA PONERLES FIN.
Las personas podemos aprender a escapar de un estmulo aversivo
RESPUESTA de escape: conducta producida por un acontecimiento aversivo
que es reforzada (aumenta la frecuencia) por la terminacin de ese
acontecimiento (se escapa o se huye)
El Estmulo aversivo EST PRESENTE en el ambiente
Ante la aparicin de estimulacin aversiva, el organismo emite una
respuesta que logra el cese de dicha estimulacin
Es el cese del estmulo aversivo (gracias a la respuesta), el evento crucial
que se convierte en un reforzador negativo

APRENDIZAJE POR EL CUAL AUMENTA LA FRECUENCIA DE UNA CONDUCTA


PARA ESCAPAR DE UNA ESTIMULACIN AVERSIVA QUE EST PRESENTE EN EL
AMBIENTE

43
1.1. FACTORES QUE INFLUYEN EN EL APRENDIZAJE Y EFICACIA DE
LA CONDUCTA DE ESCAPE

Intensidad de la estimulacin aversiva


Cuanto ms grande es la intensidad de un estmulo aversivo, MS
RPIDAMENTE se adquiere la conducta de escape. Y esto lo podemos aplicar a
dos situaciones: la conducta de ayuda y el miedo al fracaso
Si valoramos como muy aversiva o grave una situacin de emergencia,
mayor es la motivacin para escapar de esa situacin
Cuanto ms tememos fracasar en una tarea, mayor es la motivacin para
escapar y menor la constancia

Cantidad de reforzamiento negativo (el grado de reduccin de la


estimulacin aversiva)

Cuanto mayor es la reduccin de la intensidad del acontecimiento aversivo, MS


RPIDAMENTE se produce el condicionamiento de escape (o lo que es igual: Si
con la conducta de escape logro reducir una gran parte -o todo- el E aversivo,
ms eficaz es esa conducta de Escape, y antes la adquirir)

Demora del refuerzo negativo o recompensa (Retraso en la


eliminacin del estmulo aversivo)
Cuanto ms grande es la demora en la terminacin del estmulo aversivo, MS
LENTA es la adquisicin de la respuesta de escape (o lo que es igual: cuanto ms
tarda en desaparecer el E aversivo tras emitir una conducta de escape, menos me
sirve, y por tanto la adquirir ms lentamente). Luego la demora en la aparicin
del refuerzo negativo produce una disminucin en el rendimiento de los sujetos en
la conducta de escape.

44
1.2. Extincin de la respuesta de escape

No se interrumpe o no Deja de presentarse el E


cesa el E aversivo tras la aversivo tras la R:
ejecucin de la R:
Ausencia del E aversivo.
Supresin del
reforzamiento negativo.

Si con esa R no Si ya no hay E


logro escapar del E aversivo, por qu
aversivo, para qu voy a escapar? de
seguir realizndola, qu voy a escapar?
de qu me sirve?

2. CONDICIONAMIENTO DE EVITACION: CARACTERISTICAS Y


FACTORES QUE AFECTAN
Condicionamiento de evitacin: Aprendizaje por el cual aumenta la frecuencia de una
conducta para evitar o impedir que aparezca un estmulo aversivo
Respuesta de evitacin: conducta que se ve reforzada porque con su emisin
se evita la aparicin de un acontecimiento aversivo
El Estmulo aversivo NO ESTA PRESENTE en el ambiente:
Nos anticipamos (R anticipatoria) al E aversivo para que ste no aparezca
(previene la aparicin del E aversivo)

Normalmente, la anticipacin de un E aversivo es posible porque existen Es del


ambiente que NOS AVISAN (Estmulos discriminativos), nos sealan que es posible
que ocurra ese E aversivo si no hacemos algo para evitarlo

Debe haber alguna seal del ambiente o estmulo que seale o informe de la
INMINENTE aparicin del estmulo aversivo si no hacemos algo para evitarlo

45
Ante la aparicin de esa seal o Est DISCRIMINATIVO el sujeto realiza la conducta
de evitacin. Y si con esa conducta logra EVITAR el E aversivo (previene su aparicin), la
conducta se ver REFORZADA

(El sujeto no reacciona ante la posible presencia de la estimulacin aversiva en s, sino ante unas
seales del entorno (estmulos discriminativos) que sealizan la posterior presencia de la
estimulacin aversiva. Esas seales en s mismas son aversivas (por un aprendizaje previo de CC)-
Por tanto, la evitacin es una conducta motivada por el miedo

Es un ejemplo de interaccin de los procesos del C. Clsico y el Operante

Entonces veo la
cara de mi padre
Cuando llegue
que parece saber
a casa voy a
mis intenciones
portarme mal
porque estoy
enfadado

Voy a
Ese gesto me resulta portarme
muy familiar y me bien, porque
recuerda otras si no.
ocasiones en las que
Eso me me anunci (avis)
provoca un claro castigo
temor y
recapacito.
Bien!!! Me he
anticipado y ya
no habr castigo

EC EI RI

EC DISCRIMINATIVO
(aviso) RC

R evitacin
RC

reforzador

46
El establecimiento de la conducta de evitacin necesita dos fases:

1) Una fase previa, en la que un determinado estmulo (EC) adquiere un significado


aversivo de algo que antes no tena.

2)La fase propiamente de evitacin, en la que el evento (estmulo o respuesta) con


significado aversivo, por s solo y sin necesidad de que aparezca la estimulacin
aversiva, produce la respuesta de evitacin.

2.1. TIPOS DE CONDUCTA DE EVITACIN: ACTIVA Y PASIVA


Conducta de evitacin Activa: se responde para evitar la situacin aversiva
(aprendemos lo que hay que hacer para no recibir algo desagradable).
Ejemplo: las ratas pueden evitar una descarga (EI) saltando por encima de una
barrera que separa dos compartimentos cuando est presente un sonido clave o
EC- que haba sido previamente emparejado con la descarga // Estudiar para
evitar un suspenso
Conducta de evitacin Pasiva: no se responde para impedir la exposicin a una
situacin aversiva
Ejemplo: las ratas aprenden rpidamente a evitar una descarga no entrando en un
compartimento en el que han recibido descargas el da anterior // No presentarse
a un examen mal preparado

2.2. FACTORES QUE INFLUYEN EN LA ADQUISICIN DE UNA


CONDUCTA DE EVITACIN

Cunto tiempo tarda en aprenderse una conducta de evitacin?


La intensidad de la estimulacin aversiva

En general, un acontecimiento aversivo se evitar con mayor probabilidad


cuanto ms elevada sea su intensidad

Depende del tipo de tarea de evitacin (fcil o difcil):


En tareas simples o de un sentido: Cuanto ms intenso es un E
aversivo ms rpida se adquiere la conducta de evitacin.
En tareas difciles o de doble sentido: Cuanto ms intenso es un
E aversivo ms lenta se adquiere la conducta de evitacin
En las tareas fciles, se sita al animal en el compartimento A. El animal evita la
descarga pasando al compartimento B. En este caso, cuanto ms intensa es la
descarga, ms rpida es la respuesta de evitacin.
En las difciles, se sita al animal en el compartimento A y se le presenta el E
discriminativo (luz) que avisa de la administracin de la descarga. El animal evita la

47
descarga pasando al compartimento B. En ensayos posteriores se coloca al animal
en el compartimento B y se le presenta el E discriminativo (luz) que avisa de la
administracin de la descarga. El animal evita la descarga pasando al
compartimento A. En este caso, el animal debe ignorar las claves situacionales (el
tipo de compartimento en el que se encuentra) y atender exclusivamente a la clave o
E discriminativo (Luz). En esta situacin, cuanto ms intensa es la descarga, ms
lenta es la respuesta de evitacin.
Por qu? Porque el animal experimenta un conflicto entre alejarse del lugar que le
provoca miedo y dirigirse al lugar donde la ltima vez le administraron una descarga.
Cuanto mayor es la intensidad del E aversivo, menos querr ir de nuevo a ese lugar.

La duracin del intervalo interestmulos (intervalo entre la aparicin del estmulo


que provoca el miedo y el acontecimiento aversivo)

Al incrementar el intervalo EC-EI (estmulo que provoca el miedo-


acontecimiento aversivo), aumenta el tiempo necesario para la adquisicin de
una R de evitacin (se adquiere ms lentamente)
Ms tiempo tardar en ASOCIAR esa seal con el Estmulo
aversivo, por lo que la adquisicin de la R evitacin ser ms
lenta

2.3. Aplicacin: prevencin de la respuesta o


inundacin

Si lo evitamos
no podremos
EC asociar que el
RC R de evitacin EC no va
ante el EC que seguido de nada
provoca el miedo peligroso

La inundacin obliga a la persona a experimentar el E causante del


miedo varias veces y a asociar el EC con la ausencia del EI =>
desaparece la conducta de evitacin (se extingue).
No se puede escapar del E que provoca el miedo
El sujeto es expuesto al EC de miedo sin
ninguna consecuencia aversiva

48
. Se aprende a evitar los estmulos que producen miedo. En base a esto podramos
suponer que la simple presentacin del estmulo que produce miedo sin que ocurra
nada aversivo despus (El EC sin el EI) terminara por extinguir la respuesta
condicionada de miedo. Pero cuando uno tiene miedo resulta difcil que se exponga
al EC el tiempo suficiente para que se produzca la extincin.

Para superar este problema se han empleado distintos procedimientos que aceleran la
extincin de la conducta de evitacin. Uno ya lo vimos, la desensibilizacin sistemtica
(condicionamiento de una respuesta de relajacin incompatible con la respuesta de
miedo), otro es la TCNICA DE INUNDACIN .

Esta tcnica consiste en impedir la respuesta de evitacin al presentar repetidas


veces el EC temido en ausencia del EI. De esta forma, la RC de temor se emite varias
veces con toda su fuerza y se extingue. La inundacin obliga a la persona a experimentar
el E causante del miedo y a asociar el EC con la ausencia del EI. No se puede escapar
del E que provoca el miedo por lo que el sujeto es expuesto al EC de miedo sin ninguna
consecuencia aversiva.

El mecanismo responsable de la efectividad de la inundacin sigue sin saberse. Lo cierto


es que este procedimiento produce una rpida extincin, aunque no est exento de
efectos secundarios (alteraciones somticas por la intensidad de la emocin vivida, etc.).

2.4. NATURALEZA DEL APRENDIZAJE DE EVITACIN: QU


PROCESOS PERMITEN EVITAR SITUACIONES AVERSIVAS?
Son varias las teoras que se han propuesto para explicar la evitacin
(Fernndez Castro, 1979). En general se caracterizan porque hacen
referencia a procesos mediacionales (tales como el miedo), y admiten la
intervencin de dos procesos de aprendizaje: condicionamiento clsico
e instrumental. De ah que muchas de ellas se llamen teoras
bifactoriales o biproceso. Entre ellas destacamos la Teora bifactorial
de Mowrer

TEORIA BIFACTORIAL DEL APRENDIZAJE DE EVITACION (O.H.


MOWRER)
La conducta de evitacin NO ESTA motivada para PREVENIR un acontecimiento
aversivo (aunque as lo parezca), SINO para ESCAPAR de un Estmulo que
provoca miedo (ED) (y eso es lo reforzante)

R evitacin = R escape ante un E que provoca miedo

Procesos que intervienen:

1. Condicionamiento clsico de miedo a un EC (emparejado previamente con un EI


aversivo)

49
2. Reforzamiento instrumental de la R de evitacin a travs de la reduccin del miedo
(La R se refuerza con un hecho tangible -la reduccin del miedo- y NO por la mera
ausencia de algo -la estimulacin aversiva-)

Dos procesos:
1) Proceso de condicionamiento 2) Reforzamiento instrumental
clsico de miedo a un EC de la R de evitacin a travs de
(emparejado previamente con un EI la reduccin del miedo
aversivo)

RI
La RC de miedo se ha producido por un
a) Son interdependientes
EC CC donde un EN se ha asociado a un EI
(interaccin constante
DISCRIMINATIVO aversivo que produca una R de miedo
entre los procesos de (as el EC tambin producir miedo)
condicionamiento clsico e
instrumental)
El escapar del E que provoca miedo
b) Explicacin de la (condicionado) es lo que proporciona el
conducta de evitacin reforzamiento a la conducta de evitacin
en trminos de escape RC
del miedo condicionado
La R se refuerza, se aprende, porque
interrumpe o reduce el EC que provoca miedo.
Como el miedo es un estado emocional intenso,
cualquier reduccin del mismo, ser reforzante

Segn Mowrer (1947) lo que activa la respuesta de evitacin es el miedo. El sujeto


reacciona no ante la presencia de la estimulacin aversiva en s (ante el castigo), sino
ante los estmulos discriminativos que sealizan la posterior presencia de estimulacin
aversiva (EI), y por tanto el miedo (RC) provocado por esos estmulos sealizadores es la
emocin que motiva la conducta de evitacin. Al emitir esa conducta, el miedo se
reducir, lo cual supone un refuerzo negativo para esa conducta de evitacin. Hay que
notar que el miedo tiene un doble valor aqu: es una respuesta del sujeto condicionada a
una determinada situacin estimular, pero tambin es en s un estmulo aversivo del que
el sujeto hace por escapar (con lo cual evita el estmulo posterior que el miedo anticipa).

El miedo acta como un impulso (drive) que proporciona energa a la respuesta de


evitacin y refuerzo negativo al cesar con ella mediante su reduccin. Pero el miedo al ED
en este caso no es un impulso primario sino adquirido por condicionamiento clsico. El
miedo es por tanto una RC al ED (que acta como EC) que se adquiere por el
apareamiento previo de ED con el EI aversivo.

Ha sido una teora muy estudiada y con gran soporte y evidencia experimental. Incluso ha
sido mejorada con los aos. Por ejemplo, hoy da se considera que el comportamiento de
evitacin es reforzado no slo por la reduccin del miedo al cesar ED, sino tambin por la

50
aparicin, tras la respuesta, de seales de seguridad, que son estmulos presentes
tras la respuesta de evitacin, por ejemplo en animales en la caja de saltos, el feedback
cinestsico o propioceptivo tras el salto, la llegada al otro lado, etc. Son reforzadores
secundarios pues aparecen siempre conjuntamente con el refuerzo negativo (cese de la
seal condicionada aversiva).

Esta teora ha sido aplicada en el contexto clnico a la explicacin de ciertas fobias. As,
no hay ms que entender la respuesta instrumental de evitacin como la conducta que se
mantiene porque con ella cesa el miedo o la ansiedad que se ha condicionado
fuertemente al ED.

51
TEMA 3.2. CONDICIONAM. OPERANTE (IV):
CONDICIONAMIENTO AVERSIVO: CASTIGO

CAP. 10
1. EL CASTIGO Y SUS TIPOS
Presentacin de un E aversivo contingentemente a la ejecucin de una conducta
inapropiada
Tipos de castigo
Castigo positivo. Presentacin de un E aversivo tras la conducta inapropiada
Castigo negativo u omisin. Retirada de un E placentero tras la conducta
inapropiada
Categoras del castigo negativo:
-Coste de respuesta (la respuesta inapropiada hace que se retire el reforzamiento)
-Tiempo fuera (periodo durante el cual no est disponible el reforzamiento)
2.FACTORES QUE AFECTAN LA EFICACIA DEL CASTIGO
a. Intensidad del castigo. Cuanto ms intenso es el castigo, mayor es la
supresin de la conducta inapropiada
b. Consistencia en la administracin del castigo. Cuanto mayor es la
consistencia, mayor es la supresin de la conducta inapropiada
c. Demora del castigo. Cuanto mayor es la demora, menor es la supresin
de la conducta inapropiada
d. Otros factores: la eficacia de reforzar una respuesta alternativa y el
ajuste persona-castigo
e. La utilizacin del castigo como medio eficaz para reducir conductas
inadecuadas

Requisitos para un programa de castigo que quiera ser eficaz

El coste de Respuesta
El tiempo fuera
3.CONSECUENCIAS NEGATIVAS DEL CASTIGO
Agresin inducida por el dolor
Modelado de la agresin
Propiedades aversivas del que administra el castigo
Otros efectos: indefensin aprendida, sustitucin de la respuesta y
supresin generalizada

52
EL CASTIGO Y SUS TIPOS
Castigo: presentacin de un E aversivo contingentemente a la ejecucin de una
conducta inapropiada
Objetivo: suprimir una conducta no deseada, inadecuada (para el sujeto y su
entorno) => si el castigo es eficaz disminuir tanto la frecuencia como la intensidad de la
conducta castigada.

Tipos de castigo:
-Castigo Positivo: presentacin de un evento desagradable (fsico o psicolgico)
ante la realizacin de una conducta inapropiada
-Castigo Negativo: el reforzamiento se pierde o no est disponible como
consecuencia de la realizacin de una conducta inapropiada

Coste de Respuesta: la R no deseada hace que se retire o que no se


pueda obtener el reforzamiento

Supone una penalizacin, multa o retirada de ciertas cantidades de


reforzadores ya adquiridos de manera contingente a la aparicin de
una conducta inadecuada

Tiempo fuera: consiste en un perodo de tiempo durante el cual el


reforzamiento no est disponible

Supone un perodo de tiempo (al que se llama TF) durante el cual el


reforzamiento no est disponible y se aplica de manera contingente a la
aparicin de una conducta inadecuada (retirada temporal de fuentes de
reforzamiento): echarlo de clase, mandarlo a su habitacin...

COSTE DE RESPUESTA
Tcnica eficaz para suprimir la conducta inadecuada
Principal Ventaja: produce una supresin de la R rpida y eficaz, y a menudo
permanente (MUY TIL EN SISTEMA ECONOMIA DE FICHAS Y CONTRATOS
CONDUCTUALES)
Cmo seleccionar el coste apropiado?
1. Que el coste implique una importante retirada de reforzamiento desde
el primer momento (nunca hacerlo de modo gradual)

53
2. Comunicar las reglas: qu conductas supondrn ciertas prdidas y qu
logros conducirn a ganancias
3. Combinar con el reforzamiento positivo de conductas alternativas
deseables
4. Comprobar que los E que se van a retirar son eficaces como
reforzadores
5. Que el sujeto no pierda todos los reforzadores de golpe
(disminuye la MOTIVACION y no tendra nada que perder por
hacer de nuevo una conducta inadecuada)
Ejemplos: retirada o imposibilidad de conseguir reforzadores materiales (dinero) o
reforzadores sociales (aprobacin); perder privilegios, etc.

TIEMPO FUERA
Tcnica eficaz para suprimir la conducta inadecuada
Importante: asegurarse que la zona de TF no sea reforzante. O bien el sujeto sale del
ambiente reforzante o bien se le quita el propio refuerzo temporalmente. Pero durante
el TF no puede obtener ningn refuerzo
Uso efectivo:
1.Eliminar los reforzadores que mantienen la conducta
2. Evitar el TF como modo de escapar de una situacin aversiva (como no
quiere estar en clase se porta mal para que lo expulsen)
3.Uso inicial del TF con toda la consistencia posible
4.Mantener la duracin del TF relativamente breve
5.Comunicacin clara de las condiciones del TF
6.Proporcionar conductas alternativas deseables
Principal desventaja: se impide la oportunidad de aprender y practicar conductas
adecuadas
Diferencia con la EXTINCION:
-En la EXTINCION los E reforzantes no se suministran ms
-En el TF, los E reforzantes no se suministran durante un tiempo (se demoran)

2. FACTORES QUE AFECTAN LA EFICACIA DEL CASTIGO

El castigo a veces es muy eficaz para reducir incluso suprimir- conductas no


deseadas, mientras que otras veces no lo es o no tiene efecto alguno sobre la
conducta o slo la suprime temporalmente-
Por qu?

54
Intensidad del castigo
Consistencia en la administracin del castigo
Demora del castigo
La eficacia de reforzar una R alternativa
El ajuste persona-castigo

2.1. INTENSIDAD O SEVERIDAD DEL CASTIGO Y SU DURACIN


Cuanto ms intenso es el castigo (nivel moderado), mayor es la supresin de la
conducta inapropiada. La eficacia del castigo aumenta con su intensidad
(debe ser proporcional a la conducta a extinguir)

El efecto de la intensidad del castigo depende de la experiencia previa del sujeto


Es mejor presentar el castigo de forma moderadamente intensa la
primera vez y que posteriormente sea ms moderado (esto
sensibiliza), que hacer una escalada gradual en severidad (lo que
habita o inmuniza)

La exposicin a un castigo intenso La exposicin a castigos leves


SENSIBILIZA a los sujetos ante una (a modo de advertencia) HABITUA a
estimulacin aversiva moderada los sujetos ante castigos severos
posterior posteriores (es menos eficaz)

Cuanto mayor duracin tenga el castigo (sin ser excesivamente largo y duro), ms
efectivo ser para suprimir la conducta inadecuada

2.2. CONSISTENCIA O CONSTANCIA EN LA ADMINISTRACIN DEL


CASTIGO
Cuanto mayor es la consistencia en la presentacin del castigo, mayor es la
supresin de la conducta inapropiada:
-Castigo continuo (consecuencia segura) es mejor que el castigo
intermitente (consecuencia probable)
-Nunca se debe castigar en ocasiones una conducta y reforzarla en otras (no
se aprende a discriminar lo que est bien/mal)
Consecuencia: Pueden presentar conflictos y problemas de adaptacin,
como problemas de conducta en la edad escolar y posteriormente conductas
antisociales (agresivas y delictivas)

55
2.3. DEMORA DEL CASTIGO
Cuanto mayor es la demora entre la conducta y el castigo, menor es la supresin
de la conducta inapropiada:
-El castigo inmediato es ms eficaz que el demorado
-NO usar el demorado.El tiempo a menudo funciona en contra de la
efectividad del castigo

2.4. OTROS FACTORES:


La eficacia de reforzar una R alternativa
El castigo de una conducta debe ir acompaado del reforzamiento de otra conducta
alternativa e incompatible con la conducta castigada (y en caso de no tener esa
conducta alternativa, hay que ensearla)
El sujeto debe saber no slo lo que no debe hacer, sino tambin lo que
puede hacer en su lugar

El ajuste persona-castigo
El castigo de una conducta debe elegirse en funcin de la persona a la que se le va
a aplicar
Debemos asegurarnos que es un castigo y no un refuerzo (en este caso
aumentara la conducta en lugar de disminuir)

Si el castigo resulta reforzante, mantendr la conducta inadecuada


Si con el castigo el sujeto evita un estmulo aversivo mayor (conducta de
evitacin), mantendr la conducta inadecuada (ej.: Qu es peor: que me
castiguen o enfrentarme al E aversivo que tanto temo, aborrezco.? (SI
PIENSA QUE EL CASTIGO ES PREFERIBLE A ENFRENTARSE AL Est.
AVERSIVO, OPTAR POR LO 1)

2.5. LA UTILIZACIN DEL CASTIGO COMO MEDIO EFICAZ PARA


REDUCIR RESPUESTAS INADECUADAS
El uso del castigo para controlar la conducta humana est muy difundido (la mayora
de los padres lo utilizan para controlar las acciones de sus hijos, la polica, el sistema
penitenciario,)
El uso del castigo puede ser completamente eficaz para suprimir ciertas conductas
humanas

REQUISITOS PARA LA EFICACIA DE UN PROGRAMA DE CASTIGO


Castigo contingente a la respuesta no deseada

56
Castigo administrado inmediatamente despus de la R no deseada
Programa de castigo continuo (nunca intermitente)
Intensidad del castigo proporcional y suficiente para evitar la R no deseada
Evitar todo reforzador positivo de la R no deseada
Reforzar positivamente respuestas alternativas a la no-deseada
Combinar el castigo con la extincin (al mismo tiempo que presentamos el E aversivo,
RETIRAMOS los reforzadores que mantienen la conducta inadecuada)

Que el sujeto conozca el propsito del castigo, explicndole con claridad las
condiciones bajo las cuales se suministrar el castigo.
Convertir ciertos estmulos (advertencias, tonos) en E Discriminativos que anuncien
el castigo si no se modifica el comportamiento

Puede ocurrir: Se aprende cundo, dnde y ante quin puede o no puede


ejecutar la conducta, y se acta en consecuencia (APRENDIZAJE
DISCRIMINATIVO)
Resultado negativo: SUPRESIN DISCRIMINADA DE LA CONDUCTA (la
conducta se suprime en presencia del E discrim. que seala la aparicin del
castigo, pero contina dndose cuando ese E no est presente o en
presencia de Estmulos discriminativos que sealan la no aparicin del
castigo).
Resultado positivo: Evita la SUPRESIN GENERALIZADA O
GENERALIZACIN INDISCRIMINADA porque aprende cundo, dnde y
exactamente qu conductas estn bien y en qu circunstancias, y cules no.

Los castigos que no se deben utilizar: Ridiculizar al nio. Despreciarle. Gritarle


de forma prolongada. Exhibir sus errores. Quitarle de las nicas actividades en las que
muestra inters. Agredirle. Decirle que no se le quiere por su mal comportamiento y que
nadie le va a querer si no cambia. Castigos muy prolongados. Castigarle por todo.
Sentarlo en el rincn de los torpes.Decirle que no vale nada.

3. CONSECUENCIAS NEGATIVAS DEL CASTIGO


Agresin inducida por el dolor
El castigo fsico y psicolgico dolor fsico y/o emocional
(puede producir reacciones emocionales negativas de ira y furia)
Es ms probable que aparezca la agresin:
-si el castigo es desproporcionado a la conducta que lo ha provocado
-si es pblico
-si es muy demorado

57
-si el sujeto no sabe por qu se le est castigando (no asocia la conducta
con el castigo, por lo que se vive dicho acontecimiento como independiente
de su conducta)
El nivel de ira producido por el dolor depende del individuo
Adems de la ira, el castigo puede producir otros estados emocionales perturbadores:
frustracin que pueden producir reacciones de agresividad
miedo y desesperacin

Modelado de la agresin
El sujeto, a travs del modelado, puede aprender que el
castigo es una manera aceptable y viable de resolver los
problemas y conflictos
El abuso del castigo por parte de los padres
incrementa la probabilidad de que sus hijos
muestren conductas agresivas

Propiedades aversivas del que administra el castigo


Las personas que castigan a un sujeto pueden condicionarse (por C. Clsico), de
manera que se convierten en un EC o discriminativo seal- que avisa del
acontecimiento aversivo

Evocan o provocan miedo, lo que puede producir una conducta de escape


Se puede evitar utilizando en otras ocasiones el reforzamiento apetitivo

Otros efectos
Indefensin aprendida:
Si un sujeto se siente absolutamente incapaz de controlar los acontecimientos
aversivos que le rodean (ni puede escapar ni evitarlos), se sentir absolutamente
indefenso

-Demora entre la conducta y el castigo es muy larga y el sujeto no aprende la


asociacin entre ambos (no sabe por qu se le castiga)
-Si a veces se le castiga y otras se le refuerza por la misma conducta
-Si acte como acte siempre es castigado
La INDEFENSION se debe a la expectativa de que los acontecimientos son
independientes de la conducta (el sujeto cree que no puede influir sobre la aparicin
de acontecimientos aversivos). Es una expectativa de falta de control

58
Sustitucin de la respuesta:
Cuando la conducta castigada es sustituida por otra conducta igualmente no
deseada (p.e. de pegar a un hermano despreciarlo)

59
De ah la necesidad de ofrecer alternativas de conductas deseables que
sustituyan a las inadecuadas

Supresin generalizada:
La supresin de una conducta se GENERALIZA a la supresin de otras
conductas PARECIDAS a la castigada pero que son conductas DESEABLES
(por ej.: reir por contestar a un mayor---no contesta cuando se le pregunta/
reir por jugar bruscamente---no jugar)
Lo podemos evitar: castigando la conducta en las situaciones requeridas y
reforzndola en las situaciones donde la conducta es adecuada
Otros:
El sujeto castigado aprende a OCULTAR la conducta y no DEJAR DE EMITIRLA.
El sujeto puede asociar el castigo con FACTORES PERSONALES.
El castigado progresivamente AUMENTA LA TOLERANCIA AL CASTIGO y eso
aumenta la intensidad de ste
El castigado se convierte en CASTIGADOR (nio maltratador-padre maltratador)

Cundo es probable que se produzcan las consecuencias negativas y los efectos


secundarios indeseables del castigo?

Cuando las condiciones de la eficacia del castigo se incumplan

60
4. LA NATURALEZA DEL CASTIGO

Teora bifactorial de Mowrer:

El efecto de supresin de la R inadecuada que produce el


castigo, se establece en dos fases:

1- Durante el castigo, se produce un R de miedo


que se condiciona a las claves presentes en la
situacin del castigo
2- Cuando se est expuesto a estas claves (que
preceden al castigo), se produce una R de miedo
condicionada

Esta R motiva la conducta de escape ante las


claves (que es reforzante porque reduce el
miedo)

Impide la realizacin de la R castigada

Teora de la R competidora de Guthrie:

Se suprimir la conducta castigada si la R producida por el E aversivo es


incompatible con la R castigada

Para que sea efectivo, el castigo debe provocar una R incompatible con la R
castigada.

61
Teora motivacional del castigo de Estes:

El castigo reduce el nivel de motivacin la falta de


motivacin suprime la R no deseada.

-Cuando una conducta es reforzada se asocia el sistema


motivacional presente antes del reforzamiento con la R. La
R se produce cuando el sistema motivacional es activado de
nuevo Ejemplo: rata hambrienta presin palanca //conducta
alborotadora aprobacin compaeros.

- El castigo no suprime directamente la R a eliminar (presin


palanca // conducta alborotadora), lo que hace el castigo es
REDUCIR el nivel de motivacin (hambre o necesidad de
aprobacin) que anteriormente acompaaba a la realizacin de
la R
ya no hay motivacin no se producir la R
castigada (presin palanca o conducta alborotadora).

62