El aprendizaje de evitacion ha sido el tema de muchos experimentos. Gran parte de la investigacion
ha sido estimulada por los esfuerzos para demostrar o refutar la teoria de los dos procesos. Si bien por razones de espacio no podemos revisar aqui toda la evidencia, consideraremos varios hallazgos importantes que deben ser tomados en cuenta para entender los mecanismos de la conducta de evitacion.
Experimentos sobre la pulsión adquirida
En el procedimiento tipico de evitacion, en una serie de ensayos se entremezclan el condicionamiento clasico del miedo y el reforzamiento instrumental por medio de la reduccion del miedo. Sin embargo, si esos dos procedimientos hacen contribuciones separadas al aprendizaje de evitacion, entonces deberia ser posible demostrar su operacion en una situacion en la cual no se entremezclen ambos tipos de condicionamiento. Esta es la meta de los experimentos de la pulsión adquirida. La estrategia basica es condicionar primero el miedo a un EC con un procedimiento de condicionamiento clasico puro en que el EC se empareje con el EI sin importar lo que haga el sujeto. En la siguiente fase del experimento, los sujetos son expuestos periodicamente al EC que provoca el miedo y se les permite realizar una respuesta instrumental que elimine al EC (y que por consecuencia reduzca el miedo). En la segunda fase no se programan descargas. Este tipo de experimento se denomino originalmente de pulsión adquirida, pues la motivacion para realizar la respuesta instrumental (el miedo) no es innata (como el hambre o la sed) sino que se aprende por medio del condicionamiento clasico. Recientemente, el procedimiento ha llegado a conocerse como paradigma de escape del miedo (PEM) (el trabajo de Cain y LeDoux, 2007, ofrece una revision exhaustiva). Los experimentos de escape del miedo por lo general confirman las predicciones de la teoria de dos procesos. Es decir, la terminacion de un estimulo aversivo condicionado es un reforzador eficaz de la conducta instrumental. Este resultado fue demostrado primero en un experimento clasico de Brown y Jacobs (1949). En el trabajo clinico contemporaneo se ha renovado el interés por el escape del miedo, ya que este representa una transicion de la reacción pasiva de miedo a una estrategia activa de afrontamiento que ayuda a superar el miedo y la ansiedad que conlleva el trauma (LeDoux y Gorman, 2001; Vander Kolk, 2006). En un estudio reciente, Esmoris-Arranz, Pardo-Vazquez y Vazquez-Garcia (2003) compararon el aprendizaje del escape del miedo después del condicionamiento demorado y simultaneo en una caja de vaiven. En la fase inicial del experimento las ratas fueron confinadas en un lado de la caja de vaiven (el lado de la descarga) y recibieron 10 ensayos pavlovianos en cada una de tres sesiones. El EC era una senal audiovisual que duraba 15 segundos y el EI era una descarga leve en las patas con una duracion de 15 segundos. El grupo de condicionamiento demorado siempre recibia el EI al final del EC; el grupo de condicionamiento simultáneo recibia el EI al mismo tiempo que el EC. Un tercer grupo servia como control y recibia el EC y el EI de manera no emparejada. Despues de la fase de condicionamiento de miedo, se retiro la barrera hacia el otro lado de la caja de vaiven y se probo el escape del miedo en las ratas. Cada ensayo empezaba con la rata colocada en el lado en el que se presentaba la descarga y con EC presente. Si la rata se desplazaba al otro lado en el lapso de un minuto, desactivaba el EC y se le permitia permanecer en el otro lado durante 30 segundos. Entonces comenzaba el siguiente ensayo. Las ratas que no se desplazaban al lado seguro en el curso de un minuto eran sacadas y colocadas en una caja de espera antes de iniciar su siguiente ensayo. En la figura 10.6 se muestra la latencia del escape al lado seguro. Tanto el grupo de condicionamiento demorado como el grupo de condicionamiento simultaneo mostraron una disminucion en las latencias para escapar del estimulo de miedo a lo largo de los ensayos, lo que indica que aprendieron a escapar del miedo. En el grupo control no emparejado no se observaron cambios sistematicos en la latencia del escape. Esos resultados muestran un claro aprendizaje del escape del miedo, tal como lo predice la teoria de los dos procesos (Cain y LeDoux, 2007).
Medición independiente del miedo durante la adquisición de la conducta de evitación
Otra estrategia importante que se ha empleado en investigaciones de la conducta de evitacion implica mediciones independientes del miedo y de la respuesta instrumental de evitacion. Este enfoque se basa en la suposicion de que si el miedo motiva y refuerza la respuesta de evitacion, entonces el condicionamiento de este y el condicionamiento de la conducta instrumental de evitacion deberian ir de la mano. Sin embargo, contrario a esta prediccion, el miedo condicionado y la respuesta de evitacion no siempre presentan una correlacion elevada (Mineka, 1979). Muy al principio del estudio del aprendizaje de evitacion, Solomon y sus colaboradores advirtieron que los perros se mostraban menos miedosos a medida que se volvian mas competentes en el desempeno de una respuesta de evitacion (Solomon, Kamin y Wynne, 1953; Solomon y Wynne, 1953). Posteriormente, observaciones mas sistematicas del miedo y la conducta de evitacion han confirmado esta observación (Kamin, Brimer y Black, 1963; Mineka y Gino, 1980; Neuenschwander, Fabrigoule y Mackintosh, 1987). Por lo regular, esos estudios utilizan ratas de laboratorio condicionadas en una tarea de evitacion en la caja de vaiven, y emplean tecnicas de supresion condicionada para medir el miedo. Tambien en sujetos humanos se ha observado una separacion similar entre el miedo y el aprendizaje de evitacion. En un estudio reciente (Lovibond, Saunders, Weidemann y Mitchell, 2008), se condiciono a estudiantes universitarios con tres estimulos diferentes, designados como A, B y C. Los estimulos eran bloques de colores presentados en la pantalla de una computadora. El EI era una descarga aplicada en el dedo índice con una intensidad que era definitivamente desagradable pero no dolorosa. En los ensayos con el estimulo A estaba en efecto un procedimiento de condicionamiento de evitacion. El estimulo A se presentaba durante cinco segundos y 10 segundos despues era seguido por la descarga (A+). Sin embargo, si el sujeto presionaba el boton correcto durante el EC, la descarga se omitia en ese ensayo. El estimulo B solo recibia condicionamiento pavloviano como comparacion. Cada presentacion de B era seguida por la descarga (B+) sin la oportunidad de evitarla. El estimulo C era una senal de control que nunca fue seguida por la descarga (C–). Para seguir la trayectoria del efecto de esos procedimientos, se pidió a los participantes que calificaran sus expectativas de que ocurriría la descarga y se registraron sus respuestas de conductividad de la piel como indicador de miedo. Las calificaciones de la expectativa de descarga se obtuvieron durante la demora de 10 segundos entre el EC y el EI programado. Los resultados del experimento se muestran en la figura 10.7. La grafica izquierda muestra los cambios en la conductividad de la piel como medida del miedo. Como era de esperar, el miedo ante el estimulo C siempre era bajo, pues este nunca terminaba en la descarga. En el curso de los ensayos iba aumentando el miedo ante el estimulo pavloviano B, que en cada ensayo terminaba en la descarga (B+). En contraste, con cada ensayo iba disminuyendo el miedo ante el estimulo de evitacion (A+). Los cambios en el miedo ante los estimulos A y B fueron analogos a los cambios en la expectativa de la descarga. Esta expectativa aumento a lo largo de los ensayos para el estimulo pavloviano B, pero disminuyo para el estimulo de evitacion A. Los ensayos de prueba posteriores indicaron que los participantes no tenian miedo al estimulo A porque habian aprendido a impedir la descarga en los ensayos en que estaba presente ese estimulo. Si se impedía su respuesta de evitacion, el miedo reaparecia igual que su expectativa de que la descarga ocurriria de nuevo. Esos hallazgos ilustran que la conducta de evitación exitosa esta asociada con bajos niveles de miedo y bajas expectativas de peligro. La disminucion del miedo ante el EC con el entrenamiento exhaustivo de evitacion supone un enigma para la teoria de los dos procesos y ha estimulado planteamientos alternativos, algunos de los cuales veremos a continuación (Lovibond et al., 2008).
Extinción de la conducta de evitación por medio del impedimento de la respuesta y la exposición
al EC solo La respuesta de evitacion puede persistir por mucho tiempo si se logra terminar el EC y no se presentan descargas. Por ejemplo, en un antiguo experimento realizado con perros, Solomon, Kamin y Wynne (1953) describieron a un sujeto que realizo la respuesta de evitacion en 650 ensayos sucesivos despues de unas cuantas descargas. Con base en esta persistencia, .como podria extinguirse la conducta de evitacion? La respuesta a esta pregunta es muy importante no solo para los analisis teoricos de la conducta de evitacion, sino tambien para el tratamiento de las respuestas de evitacion patologicas o inadaptadas. Un procedimiento de extincion de la conducta de evitacion que resulta eficaz y ha sido ampliamente investigado se denomina inundación o prevención de respuesta (Baum, 1970). El procedimiento implica la presentacion del EC en una situacion de evitacion sin el EI, pero con el aparato modificado de tal forma que el participante no puede emitir la respuesta de evitacion. Por consiguiente, el sujeto es expuesto al EC sin poder terminarlo, es decir, es “inundado” por el EC. (Consulte la descripcion de un procedimiento relacionado, conocido como terapia implosiva, en los trabajos de Levis, 1995; Levis y Brewer, 2001.) Los procedimientos de inundacion tienen dos componentes importantes. Uno es la exposicion al EC sin el estimulo aversivo, lo cual es claramente ilustrado en un experimento clasico de Schiff, Smith y Prochaska (1972). Se entreno a ratas para evitar una descarga desplazandose a un compartimento seguro en respuesta a un estimulo auditivo. Despues de la adquisicion, el compartimento seguro fue bloqueado con una barrera y las ratas recibieron diferentes cantidades de exposicion al EC sin la descarga. Diferentes grupos recibieron uno, cinco o 12 bloques de ensayos, y en cada uno de esos ensayos el EC era presentado durante uno, cinco, 10, 50 o 120 segundos. Luego se elimino la barrera que impedia la respuesta de evitacion y se probó a los animales. Al inicio de cada ensayo de prueba, el animal era colocado en el aparato y se presentaba el EC hasta que cruzaba al compartimento seguro. En los ensayos de prueba nunca se presentaron las descargas y cada animal fue probado hasta que tardaba al menos 120 segundos en cruzar al compartimento seguro en tres ensayos consecutivos. La fuerza de la respuesta de evitacion se midio por el numero de los ensayos requeridos para alcanzar este criterio de extincion. Los resultados del experimento se muestran en la figura 10.8. Como se esperaba, la exposicion al EC con la barrera facilito la extincion de la respuesta de evitacion. Ademas, este efecto fue determinado principalmente por la duración total de la exposicion al EC. El numero de ensayos de inundacion utilizados (uno, cinco o 12) facilito la extincion, ya que cada ensayo se sumaba al tiempo total de la exposicion al EC. Los incrementos de la duracion total de la exposicion al EC con la barrera produjeron mas extincion (consulte tambien los trabajos de Baum, 1969; Weinberger, 1965). Ademas del tiempo de exposicion al EC, bloquear el acceso a la respuesta de evitacion tambien facilita la extincion (Katzev y Berman, 1974). En el estudio de condicionamiento de miedo en estudiantes universitarios de Lovibond y sus colaboradores (2008) que se describio antes, el miedo y la expectativa de la descarga disminuian con el entrenamiento exitoso de la evitacion, pero ambos reaparecian con rapidez durante los ensayos de prueba cuando se impedía la oportunidad de realizar la respuesta de evitacion. Los procedimientos en que se impide la respuesta de evitacion pueden ser especialmente eficaces para extinguir la conducta de evitacion, pues permiten el regreso del miedo y por ende lo hacen mas accesible a la extincion. El bloqueo de la respuesta en extincion también deja claro que la imposibilidad de emitir la respuesta de evitacion ya no tiene como resultado una descarga y eso deberia facilitar el reajuste de expectativas de descarga adquiridas previamente.
Evitación no discriminada (operante libre)
Como se ha descrito, la teoria de los dos procesos hace mucho hincapie en el papel de la senal de advertencia, o EC, en el aprendizaje de evitacion. Las señales claras de advertencia suelen ser evidentes en la conducta patologica de evitacion, como cuando alguien rehuye la intimidad despues de una relacion de abuso. .Pueden los individuos aprender tambien una respuesta de evitacion si en la situacion no hay un estimulo externo de advertencia? En el contexto de la teoría de los dos factores esta es una pregunta heretica. Por consecuencia, el progreso de la ciencia requiere plantear preguntas audaces, y eso fue justo lo que hizo Sidman (1953a, 1953b). Ideo un procedimiento de condicionamiento de evitacion que no implicaba un estimulo de advertencia. Dicho procedimiento llego a conocerse como evitación no discriminada o de operante libre. En un procedimiento de evitacion de operante libre, el estimulo aversivo (por ejemplo una descarga) se programa de modo que ocurra de manera periodica sin advertencia, digamos cada cinco segundos. Cada vez que el participante realiza la respuesta de evitacion obtiene un periodo de seguridad, digamos de unos 15 segundos de duracion, durante el cual no se presentan descargas. La repetición de la respuesta de evitacion antes que finalice el periodo libre de descargas permite reiniciar el periodo de seguridad. El procedimiento de evitacion de operante libre se construye a partir de dos intervalos (figura 10.9). Uno de ellos es el intervalo entre descargas en ausencia de la respuesta, y se le denomina intervalo E- E (descarga-descarga). El otro periodo importante es el intervalo entre la respuesta de evitacion y la siguiente descarga programada, conocido como intervalo R-E (respuesta-descarga). El intervalo R-E es el periodo de seguridad creado por cada respuesta. En nuestro ejemplo, el intervalo E-E era de cinco segundos y el intervalo R-E era de 15 segundos. Otra característica importante es que la respuesta de evitacion puede ocurrir en cualquier momento y siempre reiniciara el intervalo R-E (de ahi el termino evitación de operante libre). Si el sujeto responde justo antes del final de cada intervalo R-E puede reiniciar el intervalo R-E y de ese modo prolongar indefinidamente su periodo de seguridad.
Demostraciones del aprendizaje de evitación de operante libre
La mayor parte de la investigacion sobre el aprendizaje de evitacion de operante libre ha utilizado ratas de laboratorio como participantes y una descarga breve en las patas como estimulo aversivo. Sin embargo, tambien se han realizado experimentos con participantes humanos y con estimulos aversivos “mas naturales”. Por ejemplo, en un estudio participaron cuatro estudiantes universitarios y se empleo la exposicion a dioxido de carbono (CO2) como estimulo incondicionado aversivo (Lejuez et al., 1998). Se utilizo el dioxido de carbono en lugar de una descarga, pues los investigadores querian producir sintomas relacionados con los ataques de panico. La inhalacion de dioxido de carbono produce dificultad respiratoria, un incremento en la tasa cardiaca (taquicardias) y mareos similares a los que se experimentan durante un ataque de panico. Antes de empezar el experimento, los participantes potenciales fueron sometidos a una revision medica para asegurarse de que no tenian un historial de problemas respiratorios. Durante el experimento se les pidio que usaran una mascara que normalmente proporcionaba aire de la habitacion. Para entregar el estimulo aversivo el aire de la habitacion fue cambiado a una concentración de 20% de CO2 durante 25 segundos. Cada entrega del dioxido de carbono era seguida de un periodo de descanso de 65 segundos para permitir la reanudación de la respiracion normal. La respuesta instrumental consistia en la manipulación de un embolo. Tres segundos despues del periodo de descanso, si los sujetos no jalaban el embolo recibian sin advertencia un golpe de dioxido de carbono (intervalo E-E = tres segundos). Despues de una respuesta, la siguiente entrega del dioxido de carbono estaba programada para ocurrir 10 segundos despues (intervalo R-E = 10 segundos). Ademas, cada emision de la respuesta de evitacion reiniciaba el intervalo R-E. Si los participantes no respondian nunca, podian recibir hasta 22 entregas de dioxido de carbono en cada sesion. Si respondían antes del final del primer intervalo E-E y luego antes del final de cada intervalo R-E posterior, podian evitar todas las entregas de dioxido de carbono. Las sesiones en que estaba en efecto la contingencia de evitacion se alternaron con sesiones de control durante las cuales la respuesta no tenia efecto y los participantes recibian una entrega de dioxido de carbono en promedio cada seis minutos. Los resultados del experimento se muestran en la figura 10.10. El lado izquierdo de la figura muestra las tasas de respuesta de los cuatro estudiantes durante las sesiones de evitacion y las de control. El lado derecho de la figura muestra la cantidad de entregas de dioxido de carbono que recibieron los sujetos en ambos tipos de sesiones. Observe que las tasas de respuesta fueron mas altas durante las sesiones de evitacion que durante las sesiones de control. Ademas, a medida que los estudiantes adquirian la respuesta de evitacion disminuia la cantidad de presentaciones de dioxido de carbono que recibian. Estos cambios en la conducta (y en las consecuencias) ocurrian incluso si las presentaciones del dioxido de carbono no eran senaladas por un estimulo de advertencia explicito. Al inicio del experimento no se proporcionaron instrucciones explicitas concernientes a la respuesta en el embolo. Los estudiantes E1 y E2 descubrieron por si mismos la contingencia de evitacion sin mucha dificultad. En contraste, los estudiantes E3 y E4 al principio tuvieron un poco de dificultad por lo que se les dio un indicio antes de sus sesiones sexta y septima respectivamente. El indicio era: “Lo unico que puedes lograr si jalas el embolo es que en ocasiones cambia el numero de veces que recibes el aire enriquecido con dioxido de carbono. Incluso es posible tambien que en ocasiones no recibas las presentaciones del dioxido de carbono”. Este indicio fue suficiente para lograr que E3 y E4 respondieran de manera eficiente en las sesiones de evitacion posteriores. Sin embargo, observe que las instrucciones no proporcionaban una pista sobre la diferencia entre las sesiones de evitacion y las sesiones de control. No obstante, para el final del experimento E3 y E4 respondian con mayor fuerza durante las sesiones de evitacion que durante las sesiones de control. Por lo tanto, la diferencia en los niveles de respuesta (y las presentaciones del dioxido de carbono) observada durante las sesiones de evitación en comparacion con las sesiones de control no puede atribuirse, para ninguno de los estudiantes, al seguimiento de instrucciones. Todos tuvieron que descubrir sin ayuda cuando estaba en efecto la contingencia de evitacion y cuando no. La conducta de evitacion de operante libre ha sido investigada en muchos otros estudios en los cuales se utilizan como sujetos ratas de laboratorio y una breve descarga como estimulo aversivo (revise los trabajos de Hineline, 1977; y de Sidman, 1966). Dado que se emplearon sujetos no verbales, no tiene que preocuparse por el posible papel de las instrucciones. Esos experimentos han demostrado que la tasa de respuesta es controlada por la duracion de los intervalos E-E y R-E. Entre mayor sea la frecuencia con que se programa la descarga en ausencia de la respuesta (el intervalo E-E), mas probable es que el sujeto aprenda la respuesta de evitacion. El incremento de los periodos de seguridad producidos por la respuesta (el intervalo R-E) tambien facilita la conducta de evitacion. Ademas, tambien es importante el valor relativo de los intervalos E-E y R-E. El periodo de seguridad producido por cada respuesta (intervalo R-E) tiene que ser mas largo que el intervalo entre las descargas que podrian ocurrir sin la respuesta (intervalo E-E).
La evitación de operante libre y la teoría de los dos procesos
La conducta de evitacion de operante libre supone un desafio para la teoria de los dos procesos, ya que no hay un EC explicito que provoque el miedo condicionado, y por ende no queda clara la manera en la cual la respuesta de evitación reduce el miedo. Sin embargo, la teoria de los dos procesos no se ha abandonado del todo en los intentos por explicar la evitacion de operante libre (Anger, 1963). Los intervalos E-E y R-E usados en los procedimientos eficaces por lo regular son mas bien breves (menos de un minuto). Ademas, se mantienen fijos durante el experimento, por lo que es facil predecirlos. Por consiguiente, los animales pueden aprender a responder al paso del tiempo como una senal de la descarga. (En el capitulo 12 tendremos mas que decir acerca del aprendizaje temporal.) La suposicion del condicionamiento temporal permite la aplicacion de los mecanismos de la teoria de los dos procesos a los procedimientos de evitacion de operante libre. Dado que el paso del tiempo es un predictor confiable de la siguiente descarga, las senales temporales pueden condicionarse para provocar miedo. Es evidente que el tiempo para la siguiente descarga se reinicia con cada respuesta de evitacion, cada respuesta elimina de manera eficaz las senales temporales que provocan el miedo. Esto puede entonces reforzar la respuesta de evitacion por medio de la reduccion del miedo. Por consecuencia, las senales temporales que predicen la descarga pueden cumplir en los procedimientos de operante libre la misma funcion que cumple el EC explicito en una evitacion discriminada. El analisis anterior predice que los organismos no distribuiran sus respuestas al azar en un procedimiento de evitacion de operante libre, sino que concentraran mas bien sus respuestas al final del intervalo R-E, pues es aqui cuando las señales temporales provocan supuestamente la mayor cantidad de miedo (y la respuesta produce la mayor reduccion del mismo). Se han obtenido resultados congruentes con esta prediccion, aun cuando muchos animales logran evitar muchísimas descargas sin distribuir sus respuestas de la manera pronosticada por la teoria de los dos procesos (Sidman, 1966). Ademas, se ha logrado condicionar con exito la conducta de evitacion con el uso de procedimientos de operante libre en que se varian los intervalos E-E y R-E a lo largo del experimento (Herrnstein y Hineline, 1966). Hacer que los intervalos E-E y R-E resulten impredecibles hace mas difícil utilizar el paso del tiempo como senal de la descarga. Los resultados de esos procedimientos han desalentado en algunos investigadores la aceptacion de la teoría de los dos procesos como explicacion del aprendizaje de evitacion de operante libre (Herrnstein, 1969; Hineline, 1977, 1981).