Sei sulla pagina 1di 6

CONTROL AVERSIVO: EVITACIÓN Y CASTIGO.

Puede controlarse la conducta por medio de la estimulación aversiva. Dos tipos de


condicionamiento instrumental: la evitación y el castigo. El condicionamiento por evitación
incrementa el desempeño de una conducta objetivo, mientras que el castigo la disminuye, pero en
ambos casos los individuos aprenden a minimizar su exposición a la estimulación aversiva.

En un procedimiento de evitación el individuo realiza una respuesta específica para impedir la


presentación de un estímulo aversivo. Incluye una contingencia negativa entre una respuesta
instrumental y el estímulo aversivo: si se realiza la respuesta se omite el estímulo aversivo. El
castigo involucra una contingencia positiva: la respuesta objetivo produce el resultado aversivo. Los
procedimientos de evitación incrementan la ocurrencia de la conducta instrumental, mientras que
los procedimientos de castigo suprimen la respuesta instrumental. Ambos procedimientos implican
periodos crecientes de seguridad. En un caso eso se logra haciendo algo, por lo cual es común
referirse al condicionamiento de evitación como evitación activa. En el caso del castigo la mayor
seguridad se consigue dejando de hacer algo, por esta razón, en ocasiones, se le denomina
evitación pasiva.

Orígenes del estudio de la conducta de evitación


Se originaron con los estudios del condicionamiento clásico. Los primeros experimentos de
evitación fueron realizados por el psicólogo ruso Vladimir Bechterev: en un estudio, se indicó a los
participantes que colocaran un dedo sobre una bandeja de metal; a continuación se presentaba un
estímulo de advertencia (el EC) que era seguido de una breve descarga (el EI) a través de la
bandeja de metal. Como se puede suponer, al recibir la descarga los participantes levantaban
rápidamente el dedo, aunque después de unos cuantos ensayos también aprendieron a levantar el
dedo en respuesta al estímulo de advertencia.

Los investigadores se han interesado en la importancia de la señal de advertencia en los


procedimientos de evitación y en la relación de dichas señales de advertencia con el EI y con
la respuesta instrumental. Este método se conoce como evitación discriminada o señalada, la
cual utiliza ensayos discretos. Cada ensayo es iniciado por el estímulo de advertencia o EC. Los
eventos que ocurran posteriormente, dependen de lo que haga el participante. Si el sujeto emite la
respuesta objetivo antes que se aplique la descarga, el EC termina y el EI se omite en ese ensayo.
Esto constituye un ensayo de evitación exitoso. Si el sujeto no emite la respuesta requerida
durante el intervalo EC-EI, la descarga programada se presenta y se mantiene hasta que ocurra la
respuesta, momento en el cual terminan el EC y el EI. En este caso la respuesta instrumental
resulta en el escape de la descarga; por consiguiente, a este tipo de ensayo se le conoce como
ensayo de escape. En las primeras etapas del entrenamiento, la mayor parte de los ensayos son
de escape, pero a medida que avanza el entrenamiento llegan a predominar los ensayos de
evitación. Suelen llevarse a cabo en una caja de vaivén.

Al inicio de un ensayo se presenta el EC (digamos, una luz o un tono). Si el sujeto cruza al otro
lado antes que se presente la descarga, ésta no se presenta y el EC termina. Al final del intervalo
entre ensayos, el siguiente ensayo puede empezar con el animal localizado en el segundo
compartimento. Con este procedimiento, el animal va y viene entre ambos lados de la caja en los
ensayos sucesivos. Esa es la razón por la que se conoce a la respuesta como evitación de
vaivén.

Dos tipos de procedimiento de evitación de vaivén: Evitación de vaivén en dos sentidos: el


animal se desplaza de izquierda a derecha en el primer ensayo y en el segundo lo hace de la
manera inversa. Evitación en un sentido: el animal empieza cada ensayo en el mismo lado del
aparato y siempre se mueve en la misma dirección, hacia el otro lado.

Teoría de los dos procesos de la evitación


Los procedimientos de evitación implican una contingencia negativa entre una respuesta y un
estímulo aversivo. Si uno emite las respuestas de evitación adecuadas, no se cae, no se moja ni se
sale de la carretera; lo único que uno logra es no salir lastimado.
Se ha dedicado mucho esfuerzo intelectual a investigar lo “obtienen” los sujetos en los
procedimientos de condicionamiento de evitación que pudiera proporcionar reforzamiento para la
respuesta de evitación, la más influyente solución del problema es la teoría de los dos procesos de
la evitación, propuesta por Mowrer, la cual supone que en el aprendizaje de evitación participan
dos mecanismos. El primero es un proceso de condicionamiento clásico activado por los
emparejamientos del estímulo de advertencia (el EC) con el evento aversivo (el EI) en los ensayos
en que el organismo no realiza la respuesta de evitación. Dado que el EI es un estímulo aversivo,
el EC llega a provocar miedo a través del condicionamiento clásico. Por consiguiente, el primer
componente de la teoría de los dos procesos es el condicionamiento clásico del miedo al
EC. La teoría de los dos procesos trata al miedo condicionado como una fuente de motivación para
el aprendizaje de evitación.

Mowrer suponía que el aprendizaje de la respuesta instrumental de evitación ocurre cuando la


respuesta termina con el EC y por lo tanto reduce el miedo condicionado que provoca el EC. De
este modo, el segundo componente de la teoría de los dos procesos es el reforzamiento
instrumental de la respuesta de evitación por medio de la reducción del miedo.

El reforzamiento instrumental por medio de la reducción del miedo no es posible hasta que el
miedo se ha condicionado al EC. Por consiguiente, primero tiene que ocurrir el proceso de
condicionamiento clásico. Esto permite el reforzamiento de la respuesta instrumental por medio de
la reducción del miedo. Sin embargo, las respuestas exitosas de evitación constituyen ensayos de
extinción para el EC (ya que se omite el EI). La teoría de los dos procesos explica la conducta de
evitación en términos del escape del miedo condicionado más que en términos de la prevención de
la descarga.

Experimentos sobre la pulsión adquirida


En el procedimiento típico de evitación, en una serie de ensayos se entremezclan el
condicionamiento clásico del miedo y el reforzamiento instrumental por medio de la reducción del
miedo. Sin embargo, si esos dos procedimientos hacen contribuciones separadas al aprendizaje de
evitación, entonces debería ser posible demostrar su operación en una situación en la cual no se
entremezclen ambos tipos de condicionamiento. Esta es la meta de los experimentos de la
pulsión adquirida. La estrategia básica del experimento de pulsión adquirida es condicionar
primero el miedo a un EC con un procedimiento de condicionamiento clásico puro en que el EC se
empareje con el EI sin importar lo que haga el sujeto. En la siguiente fase del experimento, los
sujetos son expuestos periódicamente al EC que provoca el miedo y se les permite realizar una
respuesta instrumental que elimine al EC (y que por consecuencia reduzca el miedo). En la
segunda fase no se programan descargas. La motivación para realizar la respuesta instrumental (el
miedo) no es innata sino que se aprende por medio del condicionamiento clásico. Recientemente,
el procedimiento ha llegado a conocerse como paradigma de escape del miedo.

Los experimentos de escape del miedo por lo general confirman las predicciones de la teoría de
dos procesos: la terminación de un estímulo aversivo condicionado es un reforzador eficaz de la
conducta instrumental.

Medición independiente del miedo durante la adquisición de la conducta de evitación


Otra estrategia importante que se ha empleado en investigaciones de la conducta de evitación
implica mediciones independientes del miedo y de la respuesta instrumental de evitación. Este
enfoque se basa en la suposición de que si el miedo motiva y refuerza la respuesta de evitación,
entonces el condicionamiento de éste y el condicionamiento de la conducta instrumental de
evitación deberían ir de la mano. Sin embargo, contrario a esta predicción, el miedo condicionado y
la respuesta de evitación no siempre presentan una correlación elevada.
Solomon y sus colaboradores advirtieron que los perros se mostraban menos miedosos a medida
que se volvían más competentes en el desempeño de una respuesta de evitación.

Extinción de la conducta de evitación por medio del impedimento de la respuesta y la


exposición al EC solo.
La respuesta de evitación puede persistir por mucho tiempo si se logra terminar el EC y no se
presentan descargas.

Un procedimiento de extinción de la conducta de evitación que resulta eficaz y ha sido


ampliamente investigado se denomina inundación o prevención de respuesta. El procedimiento
implica la presentación del EC en una situación de evitación sin el EI, pero con el aparato
modificado de tal forma que el participante no puede emitir la respuesta de evitación. Por
consiguiente, el sujeto es expuesto al EC sin poder terminarlo, es decir, es “inundado” por el EC.
Los procedimientos de inundación tienen dos componentes importantes.
Uno es la exposición al EC sin el estímulo aversivo, Los procedimientos de inundación tienen dos
componentes importantes. Uno es la exposición al EC sin el estímulo aversivo… Además del
tiempo de exposición al EC, bloquear el acceso a la respuesta de evitación también facilita la
extinción.

Evitación no discriminada (operante libre)


La teoría de los dos procesos hace mucho hincapié en el papel de la señal de advertencia, o EC,
en el aprendizaje de evitación. Las señales claras de advertencia suelen ser evidentes en la
conducta patológica de evitación, como cuando alguien rehúye la intimidad después de una
relación de abuso. ¿Pueden los individuos aprender también una respuesta de evitación si en la
situación no hay un estímulo externo de advertencia? Sidman Ideó un procedimiento de
condicionamiento de evitación que no implicaba un estímulo de advertencia. Dicho procedimiento
llegó a conocerse como evitación no discriminada o de operante libre.

En un procedimiento de evitación de operante libre, el estímulo aversivo (por ejemplo una


descarga) se programa de modo que ocurra de manera periódica sin advertencia, digamos cada
cinco segundos. Cada vez que el participante realiza la respuesta de evitación obtiene un periodo
de seguridad, digamos de unos 15 segundos de duración, durante el cual no se presentan
descargas. La repetición de la respuesta de evitación antes que finalice el periodo libre de
descargas permite reiniciar el periodo de seguridad.
El procedimiento de evitación de operante libre se construye a partir de dos intervalos (figura 10.9).
Uno de ellos es el intervalo entre descargas en ausencia de la respuesta, y se le denomina
intervalo E-E (descarga-descarga). El otro periodo importante es el intervalo entre la respuesta de
evitación y la siguiente descarga programada, conocido como intervalo R-E (respuesta-descarga).
El intervalo R-E es el periodo de seguridad creado por cada respuesta.

Demostraciones del aprendizaje de evitación de operante libre


La mayor parte de la investigación sobre el aprendizaje de evitación de operante libre ha utilizado
ratas de laboratorio como participantes y una descarga breve en las patas como estímulo aversivo.
También se han realizado experimentos con participantes humanos y con estímulos aversivos
“más naturales”. En un estudio participaron cuatro estudiantes universitarios y se empleó la
exposición a dióxido de carbono (CO2) como estímulo incondicionado aversivo. Se utilizó el dióxido
de carbono en lugar de una descarga, pues los investigadores querían producir síntomas
relacionados con los ataques de pánico. La inhalación de dióxido de carbono produce dificultad
respiratoria, un incremento en la tasa cardiaca (taquicardias) y mareos similares a los que se
experimentan durante un ataque de pánico.
La conducta de evitación de operante libre ha sido investigada en muchos otros estudios en los
cuales se utilizan como sujetos ratas de laboratorio y una breve descarga como estímulo aversivo.
Esos experimentos han demostrado que la tasa de respuesta es controlada por la duración de los
intervalos E-E y R-E. Entre mayor sea la frecuencia con que se programa la descarga en ausencia
de la respuesta (el intervalo E-E), más probable es que el sujeto aprenda la respuesta de evitación.
El incremento de los periodos de seguridad producidos por la respuesta (el intervalo R-E) también
facilita la conducta de evitación. Además, también es importante el valor relativo de los intervalos
E-E y R-E. El periodo de seguridad producido por cada respuesta (intervalo R-E) tiene que ser más
largo que el intervalo entre las descargas que podrían ocurrir sin la respuesta (intervalo E-E).

Explicaciones teóricas alternativas de la conducta de evitación


Reforzamiento positivo a través de la inhibición condicionada del miedo o de las señales
condicionadas de seguridad:
El desempeño de una respuesta de evitación siempre tiene como resultado estímulos de
retroalimentación distintivos, Dado que la respuesta de evitación produce un periodo de seguridad
en todos los procedimientos de condicionamiento de evitación, los estímulos de retroalimentación
de la respuesta pueden adquirir propiedades inhibitorias condicionadas y convertirse en señales de
la ausencia de estimulación aversiva. Dichos estímulos se conocen como señales de seguridad.
De acuerdo con la hipótesis de la señal de seguridad, las señales de seguridad que acompañan a
las respuestas de evitación pueden proporcionar reforzamiento positivo para la conducta de
evitación. La hipótesis de la señal de seguridad predice que la introducción de un estímulo de
retroalimentación explícito facilitará el aprendizaje de una respuesta de evitación, lo cual ha sido
corroborado en numerosos experimentos.

Reforzamiento de la evitación a través de la reducción de la frecuencia de la descarga


El reforzamiento positivo por medio de la inhibición condicionada puede ocurrir junto con el
mecanismo de reforzamiento negativo de la teoría de los dos procesos. En contraste, se ha
propuesto otro mecanismo de reforzamiento, la reducción de la frecuencia de la descarga, como
una alternativa radical a la teoría de los dos procesos. La hipótesis de reducción de la frecuencia
de la descarga considera que la reducción de las descargas es fundamental para el reforzamiento
de la conducta de evitación. Varios experimentos han demostrado que los animales pueden
aprender a emitir una respuesta de evitación incluso si la respuesta no disminuye la frecuencia de
descargas que reciben. En esos estudios la respuesta demoraba el inicio de la siguiente descarga
programada, pero no impedía su presentación. Por consecuencia, no se modificaba la frecuencia
total de descargas. Esta evidencia sugiere que la reducción en la frecuencia de la descarga no es
necesaria para el aprendizaje de evitación.

Evitación y reacciones de defensa específicas de la especie (RDEE)


Los mecanismos de reforzamiento asumidos por todas las teorías requerían de cierto tiempo para
desarrollarse. Antes que la reducción del miedo pueda ser un reforzador efectivo, primero debe
condicionarse el miedo al EC; antes que las señales de retroalimentación de la respuesta puedan
llegar a funcionar como reforzadores deben convertirse en señales de la ausencia de la descarga,
y antes que pueda funcionar la reducción de la frecuencia de la descarga, los organismos deben
experimentar descargas suficientes para calcular su frecuencia. Por consiguiente, esas teorías nos
dicen poco acerca de la conducta del organismo durante los primeros ensayos del entrenamiento
de evitación.

Bolles suponía que las situaciones y los estímulos aversivos provocan fuertes respuestas
incondicionadas o innatas, las cuales supuestamente evolucionaron, ya que son una defensa
exitosa en contra del dolor y el daño. Por consiguiente, Bolles las denominó reacciones de
defensa específicas de la especie (RDEE). Por ejemplo, en las ratas las reacciones de defensa
específicas de la especie incluyen huir (correr), congelarse (permanecer vigilantes pero inmóviles,
excepto por la respiración) y ataques defensivos. Otras reacciones al peligro incluyen la tigmotaxia
(aproximarse a las paredes), el enterramiento defensivo (cubrir la fuente de estimulación aversiva)
y la búsqueda de áreas oscuras. La configuración del ambiente determina qué reacción de defensa
específica de la especie es la que ocurre. Por ejemplo, la huida puede prevalecer cuando se
dispone de una ruta de escape evidente y el congelamiento puede predominar si no hay salida de
la situación; como en realidad sucede.

Una predicción importante de la teoría de las reacciones de defensa específicas de la especie es


que en los experimentos de evitación, algunas respuestas se aprenderán con mayor facilidad que
otras. Ejemplo: las ratas pueden aprender muy pronto a correr en una rueda de actividad para
evitar una descarga. Se supone que correr se aprende con mayor rapidez, pues es una respuesta
más cercana a las reacciones de defensa específicas de la especie en la rueda de actividad.

La inminencia depredadora y las conductas defensivas y de recuperación


El papel de los factores ecológicos y evolutivos fue desarrollado con mayor detalle por Fanselow y
sus colaboradores, quienes plantearon el concepto de un continuo de inminencia depredadora, el
cual señala que ocurren diferentes respuestas defensivas dependiendo del nivel de peligro que
enfrenta un animal. Ej: la rata está más segura en su madriguera, pero tiene que salir
periódicamente para buscar comida. Cuando sale de forrajeo no hay mucho peligro siempre que no
haya gatos o serpientes alrededor. Cuando aparece una serpiente, el nivel de peligro de la rata
aumenta, pero no demasiado si la serpiente se encuentra lejos, pero si la serpiente se acerca, el
nivel de peligro se eleva. La situación es muy peligrosa cuando la serpiente está cerca y a punto de
atacar, y el peligro alcanza
su punto más alto cuando ocurre el ataque. Esta progresión de niveles crecientes de peligro es el
continuo de inminencia depredadora. Se supone que en diferentes niveles de la inminencia
depredadora ocurren diferentes respuestas de defensa específicas de la especie.
Cuando la serpiente toca de hecho a la rata, es probable que ésta salte, como si su conducta
anterior de congelarse la preparase para arrojarse “por los aires” cuando es tocada. Esto se
conoce como respuesta a un ataque inminente.

Igual que la teoría de las respuestas defensivas específicas de la especie, la hipótesis de la


inminencia depredadora supone que la conducta defensiva ocurre al principio como una respuesta
incondicionada. Las respuestas defensivas también pueden llegar a ser provocadas por un
estímulo condicionado si éste se asocia con un evento aversivo. La respuesta defensiva que ocurra
ante el EC depende de la relación temporal de dicho EC con el estímulo incondicionado aversivo.

Las diferencias de diversos grados de inminencia depredadora en las manifestaciones


conductuales están asociadas con el torrente correspondiente de estados neurobiológicos.

El concepto de inminencia depredadora puede utilizarse también para analizar las reacciones
humanas ante el peligro. En congruencia con esta idea, Craske (1999) describió las reacciones
humanas de miedo y ansiedad en términos de la inminencia del peligro percibido. El nivel más bajo
de peligro percibido genera preocupación. El siguiente nivel da lugar a miedo y vigilancia (como el
congelamiento en las ratas). El nivel más alto de la amenaza percibida lleva al pánico (que es
análogo de la respuesta a un ataque inminente). Lo curioso es que los hombres y las mujeres
responden de manera diferente al estrés del peligro percibido.

EL CASTIGO
Puede ser una técnica muy eficaz para modificar la conducta con parámetros apropiados de
procedimiento, la respuesta puede ser suprimida por completo en apenas uno o dos ensayos. En
otras circunstancias, la supresión de la conducta puede ser incompleta y es posible que se
recupere la respuesta. Considere un niño que por accidente clava un tenedor de metal en un
tomacorriente. Es probable que la descarga resultante desanime la repetición de esa respuesta por
el resto de la vida del niño. Compare eso con recibir una multa por conducir 10 kilómetros arriba del
límite de velocidad. ¿Producirá eso la misma supresión espectacular de la respuesta castigada?
No es probable.

Análisis experimental del castigo


El procedimiento básico del castigo es sencillo: se presenta un estímulo aversivo después de una
respuesta instrumental objetivo. Si el procedimiento es eficaz, la respuesta objetivo es suprimida.
Como el castigo implica la supresión de la conducta, sólo puede observarse con respuestas que,
en principio, tengan probabilidad de ocurrir. Este requisito se cumple fácilmente en situaciones
terapéuticas en que el objetivo del castigo es una actividad dañina que ocurre más a menudo de lo
que se desearía. Por ejemplo, Vorndran y Lerman documentaron la efectividad del castigo en dos
participantes con capacidades diferentes del desarrollo. Uno de los participantes hiperventilaba
muy a menudo y el otro se lastimaba la mano por llevarla con frecuencia a la boca. En ambos
casos las respuestas objetivo fueron suprimidas por el castigo. Los estudios del castigo en el
laboratorio por lo regular empiezan con una fase preliminar en la que se establece la respuesta
objetivo con reforzamiento positivo. Por ejemplo, una paloma puede ser reforzada con comida por
picotear una tecla. Luego se sobrepone un procedimiento de castigo al programa de reforzamiento
positivo, lo cual produce un conflicto entre responder para obtener el reforzamiento positivo y no
hacerlo para evitar el castigo.

Características del estímulo aversivo y del método con que se introduce


En los experimentos sobre el castigo se ha empleado una gran variedad de estímulos aversivos,
como descargas eléctricas, ruido fuerte, una señal previamente condicionada con una descarga,
etc. Otros procedimientos de supresión de respuesta han implicado la pérdida de reforzamiento
positivo, tiempo fuera de reforzamiento positivo, sobrecorrección y restricción manual. El tiempo
fuera se refiere a la eliminación de la oportunidad de obtener reforzamiento positivo; su utilización
es común para castigar a los niños, por ejemplo cuando se le dice a un niño que se siente en una
silla de tiempo fuera en la parte posterior del salón de clases. La silla de tiempo fuera suprime la
conducta, ya que impide que el niño haga otras cosas que disfruta más. La sobrecorrección
implica pedir a la persona no sólo que corrija lo que hizo mal, sino que sobrecorrija el error. Por
ejemplo, a un niño que se llevó un objeto a la boca se le puede pedir que se saque el objeto y que
se lave la boca con una solución antiséptica.

En los estudios del castigo en seres humanos, un estímulo aversivo conveniente es la pérdida de
puntos. Por ejemplo, en una investigación, estudiantes universitarios presionaban una palanca
para obtener puntos que podían canjear por dinero al final del experimento. Se utilizaron dos
estímulos discriminativos diferentes (líneas de distintas longitudes). La supresión de la respuesta
producida por el castigo depende en parte de las características del estímulo aversivo. Las
descargas más intensas y más largas son más eficaces para castigar la respuesta, El castigo de
baja intensidad produce una supresión apenas moderada de la conducta. Si el estímulo aversivo es
de alta intensidad, la respuesta se suprimirá por completo durante un tiempo prolongado.

La manera en la que los organismos responden a la exposición inicial al castigo determina la


manera en que responderán.

Estimulación aversiva contingente a la respuesta o independiente de la respuesta


Otra variable importante que determina la eficacia del castigo es si el estímulo aversivo se presenta
de manera contingente a la respuesta objetivo o de manera independiente de la conducta. La
estimulación aversiva independiente de la respuesta puede producir cierta supresión de la
conducta instrumental. Si el estímulo aversivo es ocasionado por la respuesta instrumental, la
supresión de la conducta es significativamente mayor.

Efectos de la demora del castigo


Otro factor importante en el castigo es el intervalo entre la respuesta objetivo y el estímulo
aversivo. Aumentar la demora del castigo produce menos supresión de la conducta. Es posible que
ocurran demoras inadvertidas si la respuesta indeseable no se detecta de inmediato, si se requiere
tiempo para investigar quién es en realidad responsable de un error o para preparar el estímulo
aversivo. Dichas demoras pueden anular por completo la efectividad del castigo. Si no puede
castigar la respuesta objetivo de inmediato, más valdría no castigarla.

Efectos de los programas de castigo


Así como el reforzamiento positivo no tiene que entregarse cada vez que ocurre la respuesta
instrumental, el castigo también puede aplicarse de manera intermitente, el grado de supresión de
la respuesta producido por el castigo depende de la proporción de respuestas que son castigadas.
En un estudio de castigo de razón fija, primero se entregó reforzamiento alimenticio a palomas por
picotear una tecla de acuerdo con un programa de intervalo variable. Luego se introdujo el castigo.
Se probaron diversos procedimientos de castigo de razón fija a la vez que permanecía en efecto el
programa de reforzamiento de IV. Cuando cada respuesta recibía una descarga (castigo RF 1), el
picoteo cesó por completo. Con los otros programas de castigo, la tasa de respuesta dependía de
lo intermitente del castigo. Los programas con razones fijas más altas permitían que más
respuestas quedaran sin castigo.

Potrebbero piacerti anche