Sei sulla pagina 1di 17

ACONDICIONAMIENTO Y APRENDIZAJE

Los principios básicos del aprendizaje siempre funcionan y siempre influyen en el


comportamiento humano. Este módulo analiza las dos formas más fundamentales de
aprendizaje: el condicionamiento clásico (pavloviano) y el instrumental (operante). A
través de ellos, aprendemos respectivamente a asociar 1) estímulos en el entorno, o 2)
nuestros propios comportamientos, con eventos significativos, como recompensas y
castigos.
Los dos tipos de aprendizaje se han estudiado intensamente porque tienen efectos
poderosos sobre el comportamiento y porque proporcionan métodos que permiten a los
científicos analizar los procesos de aprendizaje de manera rigurosa. Este módulo describe
algunas de las cosas más importantes que necesita saber sobre el condicionamiento
clásico e instrumental, e ilustra algunas de las muchas formas en que nos ayudan a
comprender el comportamiento normal y desordenado en los humanos.
Objetivos de aprendizaje

 Distinga entre el condicionamiento clásico (pavloviano) y el condicionamiento


instrumental (operante).
 Comprenda algunos hechos importantes sobre cada uno que nos dicen cómo
funcionan.
 Comprenda cómo funcionan por separado y juntos para influir en el comportamiento
humano en el mundo fuera del laboratorio.
 Los estudiantes podrán enumerar los cuatro aspectos del aprendizaje por observación
de acuerdo con la teoría del aprendizaje social.
DOS TIPOS DE CONDICIONAMIENTO
Aunque Ivan Pavlov ganó un Premio Nobel por estudiar la digestión, es mucho más
famoso por otra cosa: trabajar con un perro, una campana y un tazón de saliva. Muchas
personas están familiarizadas con el estudio clásico del "perro de Pavlov", pero rara vez
comprenden la importancia de su descubrimiento. De hecho, el trabajo de Pavlov ayuda a
explicar por qué algunas personas se ponen ansiosas simplemente mirando un autobús
lleno de gente, por qué el sonido de una alarma matutina es tan odiado e incluso por qué
rechazamos ciertos alimentos que solo hemos probado una vez.
El condicionamiento clásico (o pavloviano) es una de las formas fundamentales en que
aprendemos sobre el mundo que nos rodea. Pero es mucho más que una simple teoría del
aprendizaje; También es posiblemente una teoría de la identidad. Porque, una vez que
entiendas el condicionamiento clásico, reconocerás que tu música favorita, tu ropa,
incluso tu candidato político, A principios del siglo XX, los científicos interesados en
comprender el comportamiento de los animales y los humanos comenzaron a apreciar la
importancia de dos formas básicas de aprendizaje.
Uno, que fue estudiado por primera vez por el fisiólogo ruso Ivan Pavlov, se conoce como
condicionamiento clásico o pavloviano. En su famoso experimento, Pavlov tocó una
campana y luego le dio algo de comida a un perro. Después de repetir este
emparejamiento varias veces, el perro finalmente trató la campana como una señal de
comida, y comenzó a salivar anticipando el regalo.
Este tipo de resultado se ha reproducido en el laboratorio utilizando una amplia gama de
señales (p. Ej., Tonos, luz, gustos, configuraciones) junto con muchos eventos diferentes
además de los alimentos (p. Ej., Drogas, descargas, enfermedades; ver más abajo).
Ahora creemos que este mismo proceso de aprendizaje está involucrado, por ejemplo,
cuando los humanos asocian una droga que tomaron con el ambiente en el que la
tomaron; cuando asocian un estímulo (por ejemplo, un símbolo de vacaciones, como una
gran toalla de playa) con un evento emocional (como un estallido de felicidad); y cuando
asocian el sabor de un alimento con la intoxicación alimentaria. Aunque el
condicionamiento clásico puede parecer una teoría "antigua" o "demasiado simple",
todavía se estudia ampliamente hoy en día por al menos dos razones: Primero, es una
prueba directa del aprendizaje asociativo que se puede usar para estudiar otros
comportamientos más complejos.
Segundo, debido a que el condicionamiento clásico siempre ocurre en nuestras vidas, sus
efectos sobre el comportamiento tienen implicaciones importantes para comprender el
comportamiento normal y desordenado en los humanos.
De manera general, el condicionamiento clásico ocurre cuando los estímulos neutros se
asocian con eventos psicológicamente significativos. Con la intoxicación alimentaria, por
ejemplo, aunque comer pescado para la cena normalmente no es algo de lo que
preocuparse (es decir, un "estímulo neutral"), si hace que se enferme, es probable que
ahora asocie ese estímulo neutral (el pescado) con el evento psicológicamente
significativo de enfermarse. Estos eventos emparejados a menudo se describen utilizando
términos que se pueden aplicar a cualquier situación.
La comida para perros en el experimento de Pavlov se llama estímulo no condicionado
(EE. UU.) Porque provoca una respuesta no condicionada (UR). Es decir, sin ningún tipo de
"entrenamiento" o "enseñanza", el estímulo produce una reacción natural o instintiva. En
el caso de Pavlov, la comida (EE. UU.) Automáticamente hace que el perro babee (UR).
Otros ejemplos de estímulos no condicionados incluyen ruidos fuertes (EE. UU.) Que nos
asustan (UR) o una ducha caliente (EE. UU.) Que produce placer (UR).
Por otro lado, un estímulo condicionado produce una respuesta condicionada. Un
estímulo condicionado (CS) es una señal que no tiene importancia para el organismo hasta
que se combina con algo que sí tiene importancia.
Por ejemplo, en el experimento de Pavlov, la campana es el estímulo condicionado. Antes
de que el perro haya aprendido a asociar la campana (CS) con la presencia de comida (EE.
UU.), Escuchar la campana no significa nada para el perro. Sin embargo, después de varios
emparejamientos de la campana con la presentación de la comida, el perro comienza a
babear al sonido de la campana.
Este babeo en respuesta a la campana es la respuesta condicionada (CR). Aunque puede
ser confuso, la respuesta condicionada es casi siempre la misma que la respuesta no
condicionada. Sin embargo, se llama la respuesta condicionada porque está condicionada
a (o depende de) estar emparejada con el estímulo condicionado (por ejemplo, la
campana).
Para ayudar a aclarar esto, considere tener mucha hambre cuando vea el logotipo de un
restaurante de comida rápida. Hay una buena posibilidad de que empieces a salivar.
Aunque es el consumo real de alimentos (EE. UU.) Lo que normalmente produce la
salivación (UR), simplemente ver el logotipo del restaurante (CS) puede desencadenar la
misma reacción (CR).
Otro ejemplo con el que probablemente esté muy familiarizado es su reloj despertador. Si
eres como la mayoría de las personas, levantarte temprano generalmente te hace infeliz.
En este caso, levantarse temprano (EE. UU.) Produce una sensación natural de mal humor
(UR). Sin embargo, en lugar de levantarse temprano por su cuenta, es probable que tenga
un despertador que suene un tono para despertarlo. Antes de configurar su alarma a ese
tono en particular, imaginemos que tiene sentimientos neutrales al respecto (es decir, el
tono no tenía un significado previo para usted). Sin embargo, ahora que lo usa para
despertarse todas las mañanas, psicológicamente “empareja” ese tono (CS) con sus
sentimientos de mal humor en la mañana (UR).
Después de suficientes emparejamientos, este tono (CS) producirá automáticamente su
respuesta natural de mal humor (CR). Por lo tanto, este vínculo entre el estímulo no
condicionado (EE. UU.; Levantarse temprano) y el estímulo condicionado (CS; el tono) es
tan fuerte que la respuesta incondicionada (UR; estar gruñón) se convertirá en una
respuesta condicionada (CR; por ejemplo, escuchar el tono en cualquier momento del día,
ya sea que se despierte o camine por la calle, lo pondrá de mal humor) . Los estudios
modernos del condicionamiento clásico utilizan una gama muy amplia de CS y US y miden
una amplia gama de respuestas condicionadas.
Aunque el condicionamiento clásico es una explicación poderosa de cómo aprendemos
muchas cosas diferentes, existe una segunda forma de condicionamiento que también
ayuda a explicar cómo aprendemos. Primero estudiado por Edward Thorndike, y luego
extendido por BF Skinner, este segundo tipo de condicionamiento se conoce como
condicionamiento instrumental u operante. El condicionamiento operante ocurre cuando
un comportamiento (en oposición a un estímulo) está asociado con la ocurrencia de un
evento significativo. En el ejemplo más conocido, una rata en un laboratorio aprende a
presionar una palanca en una jaula (llamada "caja Skinner") para recibir comida. Debido a
que la rata no tiene una asociación "natural" entre presionar una palanca y obtener
comida, la rata tiene que aprender esta conexión. Al principio, la rata puede simplemente
explorar su jaula, treparse encima de las cosas, excavar debajo de las cosas, en busca de
comida. Finalmente, mientras hurga alrededor de su jaula, la rata presiona
accidentalmente la palanca y cae una bolita de comida. Este comportamiento voluntario
se llama un comportamiento operante, porque "opera" en el medio ambiente (es decir, es
una acción que el animal mismo hace)
Ahora, una vez que la rata reconoce que recibe un pedazo de comida cada vez que
presiona la palanca, el comportamiento de presionar la palanca se refuerza. Es decir, las
bolitas de comida sirven como reforzados porque fortalecen el deseo de la rata de
interactuar con el medio ambiente de esta manera particular. En un ejemplo paralelo,
imagina que estás jugando un videojuego de carreras callejeras. A medida que conduce
por un curso de la ciudad varias veces, prueba varias calles diferentes para llegar a la línea
de meta.
En una de estas pruebas, descubre un acceso directo que mejora drásticamente su tiempo
total. Has aprendido este nuevo camino a través del condicionamiento operante. Es decir,
al involucrarse con su entorno (respuestas operantes), realizó una secuencia de
comportamientos que se reforzó positivamente (es decir, encontró la distancia más corta
a la línea de meta). Y ahora qué ha aprendido a conducir este curso, realizará la misma
secuencia de comportamientos de conducción (al igual que la rata presiona la palanca)
para recibir su recompensa de un final más rápido.
La investigación de condicionamiento operante estudia cómo los efectos de un
comportamiento influyen en la probabilidad de que vuelva a ocurrir. Por ejemplo, los
efectos del comportamiento de presionar la palanca de la rata (es decir, recibir un gránulo
de comida) influye en la probabilidad de que siga presionando la palanca.
Porque, de acuerdo con la ley de efecto de Thorndike, cuando un comportamiento tiene
un efecto o consecuencia positiva (satisfactoria), es probable que se repita en el futuro.
Sin embargo, cuando un comportamiento tiene una consecuencia negativa (dolorosa /
molesta), es menos probable que se repita en el futuro. Los efectos que aumentan los
comportamientos se denominan reforzadores y los efectos que los disminuyen se
denominan castigadores.
Un ejemplo cotidiano que ayuda a ilustrar el condicionamiento operante es luchar por una
buena calificación en clase, lo que podría considerarse una recompensa para los
estudiantes (es decir, produce una respuesta emocional positiva).
Para obtener esa recompensa (similar a la rata que aprende a presionar la palanca), el
estudiante necesita modificar su comportamiento.
Por ejemplo, el estudiante puede aprender que hablar en clase le da puntos de
participación (un refuerzo), por lo que el estudiante habla repetidamente. Sin embargo, el
estudiante también aprende que él / ella no debe hablar sobre cualquier cosa; hablar
sobre temas no relacionados con la escuela en realidad cuesta puntos. Por lo tanto, a
través de los comportamientos libremente elegidos por el estudiante, él / ella aprende
qué comportamientos se refuerzan y cuáles se castigan.
Una distinción importante del condicionamiento operante es que proporciona un método
para estudiar cómo las consecuencias influyen en el comportamiento "voluntario". La
decisión de la rata de presionar la palanca es voluntaria, en el sentido de que la rata es
libre de hacer y repetir esa respuesta cuando lo desee.
El condicionamiento clásico, por otro lado, es todo lo contrario, dependiendo en cambio
del comportamiento "involuntario" (por ejemplo, el perro no elige babear; simplemente lo
hace). Entonces, mientras que la rata debe participar activamente y realizar algún tipo de
comportamiento para lograr su recompensa, el perro en el experimento de Pavlov es un
participante pasivo.
Una de las lecciones de la investigación del condicionamiento operante, entonces, es que
el comportamiento voluntario está fuertemente influenciado por sus consecuencias.
La ilustración de arriba resume los elementos básicos del condicionamiento clásico e
instrumental. Los dos tipos de aprendizaje difieren de muchas maneras. Sin embargo, los
pensadores modernos a menudo enfatizan el hecho de que difieren, como se ilustra aquí,
en lo que se aprende. En el condicionamiento clásico, el animal se comporta como si
hubiera aprendido a asociar un estímulo con un evento significativo. En el
condicionamiento operante, el animal se comporta como si hubiera aprendido a asociar
un comportamiento con un evento significativo.
Otra diferencia es que la respuesta en la situación clásica (por ejemplo, la salivación) se
suscitó por un estímulo que viene antes, mientras que la respuesta en el caso operante no
se produce por ningún estímulo particular. En cambio, se dice que se emiten respuestas
operantes. La palabra "emitido" transmite aún más la idea de que los comportamientos
operantes son esencialmente de naturaleza voluntaria.
Comprender el condicionamiento clásico y operante proporciona a los psicólogos muchas
herramientas para comprender el aprendizaje y el comportamiento en el mundo fuera del
laboratorio. Esto se debe en parte a que los dos tipos de aprendizaje ocurren
continuamente a lo largo de nuestras vidas. Se ha dicho que "al igual que las leyes de la
gravedad, las leyes del aprendizaje siempre están vigentes".
COSAS ÚTILES QUE DEBE SABER SOBRE EL CONDICIONAMIENTO CLÁSICO
EL CONDICIONAMIENTO CLÁSICO TIENE MUCHOS EFECTOS SOBRE EL
COMPORTAMIENTO
Una CS clásica (p. Ej., La campana) no solo provoca un simple reflejo unitario. Pavlov
enfatizó la salivación porque esa fue la única respuesta que midió. Pero su campana casi
seguramente provocó un sistema completo de respuestas que funcionaron para preparar
al organismo para los próximos Estados Unidos (alimentos) (ver Timberlake, 2001).) Por
ejemplo, además de la salivación, los CS (como la campana) que indican que los alimentos
están cerca también provocan la secreción de ácido gástrico, enzimas pancreáticas e
insulina (que transporta la glucosa a las células).
Todas estas respuestas preparan al cuerpo para la digestión. Además, el CS provoca un
comportamiento de aproximación y un estado de emoción. Y presentar un CS para comida
también puede hacer que los animales cuyos estómagos estén llenos coman más comida
si está disponible. De hecho, los CS alimentarios son tan frecuentes en la sociedad
moderna, que los humanos también tienden a comer o sentir hambre en respuesta a las
señales asociadas con los alimentos, como el sonido de una bolsa de papas fritas
abriéndose, la vista de un logotipo conocido ( por ejemplo, Coca-Cola), o la sensación del
sofá frente al televisor. El condicionamiento clásico también está involucrado en otros
aspectos de la alimentación. Los sabores asociados con ciertos nutrientes (como el azúcar
o la grasa) pueden ser preferidos sin despertar ninguna conciencia de la combinación. Por
ejemplo, la proteína es un EE. UU.
Que su cuerpo anhela automáticamente más de una vez que comienza a consumirla (UR):
dado que las proteínas están altamente concentradas en la carne, el sabor de la carne se
convierte en un CS (o señal, que las proteínas están en camino), que perpetúa el ciclo de
ansias de más carne (esta reacción corporal automática ahora es un CR).
De manera similar, los sabores asociados con el dolor o la enfermedad estomacal se evitan
y desagrada. Por ejemplo, una persona que se enferma después de beber demasiado
tequila puede adquirir un profundo disgusto por el sabor y el olor del tequila, un
fenómeno llamado acondicionamiento de la aversión al sabor.
El hecho de que los sabores a menudo se asocian con tantas consecuencias de comer es
importante para los animales (incluidas las ratas y los humanos) que frecuentemente
están expuestos a nuevos alimentos. Y es clínicamente relevante. Por ejemplo, los
medicamentos utilizados en la quimioterapia a menudo enferman a los pacientes con
cáncer. Como consecuencia, los pacientes a menudo adquieren aversiones a los alimentos
que se comen justo antes del tratamiento, o incluso aversiones a cosas como la sala de
espera de la clínica de quimioterapia.
El condicionamiento clásico ocurre con una variedad de eventos significativos. Si un
experimentador emite un tono justo antes de aplicar una leve conmoción en las patas de
una rata, el tono provocará miedo o ansiedad después de una o dos parejas. El
condicionamiento similar del miedo desempeña un papel en la creación de muchos
trastornos de ansiedad en los humanos, como las fobias y los trastornos de pánico, donde
las personas asocian señales (como espacios cerrados o un centro comercial) con pánico u
otro trauma emocional. Aquí, en lugar de una respuesta física (como babear), el CS
desencadena una emoción.
Otro efecto interesante del condicionamiento clásico puede ocurrir cuando ingerimos
drogas. Es decir, cuando se toma un medicamento, puede asociarse con las señales que
están presentes al mismo tiempo (por ejemplo, habitaciones, olores, parafernalia de
drogas). En este sentido, si alguien asocia un olor particular con la sensación inducida por
la droga, cada vez que esa persona huele el mismo olor después, puede indicar respuestas
(físicas y / o emocionales) relacionadas con el consumo de la droga.
Pero las señales de drogas tienen una propiedad aún más interesante: provocan
respuestas que a menudo "compensan" el próximo efecto de la droga (ver Siegel, 1989)
Por ejemplo, la morfina misma suprime el dolor; sin embargo, si alguien está
acostumbrado a tomar morfina, una señal que indica que el "medicamento llegará
pronto" puede hacer que la persona sea más sensible al dolor.
Debido a que la persona sabe que pronto se administrará un supresor del dolor, el cuerpo
se vuelve más sensible, anticipando que "el medicamento pronto se encargará de él".
Sorprendentemente, tales respuestas compensatorias condicionadas a su vez disminuyen
el impacto de la droga en el cuerpo, porque el cuerpo se ha vuelto más sensible al dolor.
Esta respuesta compensatoria condicionada tiene muchas implicaciones. Por ejemplo, un
usuario de drogas será más "tolerante" a la droga en presencia de señales que se han
asociado con ella (porque tales señales provocan respuestas compensatorias). Como
resultado, la sobredosis generalmente no se debe a un aumento en la dosis, sino a tomar
el medicamento en un nuevo lugar sin las señales familiares, lo que de otro modo hubiera
permitido al usuario tolerar el medicamento.
Las respuestas compensatorias condicionadas (que incluyen una mayor sensibilidad al
dolor y una disminución de la temperatura corporal, entre otros) también pueden causar
molestias, lo que motiva al usuario de drogas a continuar el uso de la droga para
reducirlas. Esta es una de varias formas en que el condicionamiento clásico podría ser un
factor en la adicción y dependencia a las drogas.
Un efecto final de las señales clásicas es que motivan el comportamiento operante
continuo.
Por ejemplo, si una rata ha aprendido a través del condicionamiento operante que
presionar una palanca le dará una droga, en presencia de señales que indiquen que "la
droga llegará pronto" (como el sonido del chirrido de la palanca), la rata trabajará más
duro presionar la palanca que si esas señales no estuvieran presentes (es decir, no hay
sonido de palanca chirriante).
Del mismo modo, en presencia de señales asociadas a los alimentos (p. Ej., Olores), una
rata (o una persona que come en exceso) trabajará más duro por la comida. Y, por último,
incluso en presencia de señales negativas (como algo que indica miedo), una rata, un ser
humano o cualquier otro organismo trabajarán más para evitar esas situaciones que
pueden provocar un trauma. Por lo tanto, los CS clásicos tienen muchos efectos que
pueden contribuir a fenómenos conductuales significativos.
EL PROCESO DE APRENDIZAJE
Como se mencionó anteriormente, el condicionamiento clásico proporciona un método
para estudiar los procesos básicos de aprendizaje. Sin embargo, de forma algo contra
intuitiva, los estudios muestran que emparejar un CS y un EE. UU. Juntos no es suficiente
para que se aprenda una asociación entre ellos. Considere un efecto llamado bloqueo (ver
Kamin, 1969).) En este efecto, un animal primero aprende a asociar un CS, lo que se llama
estímulo A, con un EE. UU. En la ilustración de arriba, el sonido de una campana (estímulo
A) se combina con la presentación de los alimentos.
Una vez que se aprende esta asociación, en una segunda fase, se presenta un segundo
estímulo, el estímulo B, junto con el estímulo A, de modo que los dos estímulos se
emparejan con los Estados Unidos juntos. En la ilustración, se agrega una luz y se enciende
al mismo tiempo que suena la campana. Sin embargo, debido a que el animal ya aprendió
la asociación entre el estímulo A (la campana) y la comida, el animal no aprende una
asociación entre el estímulo B (la luz) y la comida.
Es decir, la respuesta condicionada solo ocurre durante la presentación del estímulo A,
porque el condicionamiento anterior de A "bloquea" el condicionamiento de B cuando B
se agrega a A. ¿La razón? El estímulo A ya predice a los EE. UU., Por lo que los EE. UU. No
es sorprendente cuando ocurre con el estímulo B.
El aprendizaje depende de tal sorpresa, o una discrepancia entre lo que ocurre en una
prueba de acondicionamiento y lo que ya está predicho por las señales que están
presentes en la prueba. Para aprender algo a través del condicionamiento clásico, primero
debe haber algún error de predicción, o la posibilidad de que un estímulo condicionado no
conduzca al resultado esperado.
Con el ejemplo de la campana y la luz, debido a que la campana siempre conduce a la
recompensa de los alimentos, no hay un "error de predicción" que la adición de la luz
ayude a corregir. Sin embargo, si el investigador repentinamente requiere que la campana
y la luz ocurran para recibir la comida, la campana solo producirá un error de predicción
que el animal tiene que aprender.
El bloqueo y otros efectos relacionados indican que el proceso de aprendizaje tiende a
incluir los predictores más válidos de eventos significativos e ignora los menos útiles. Esto
es común en el mundo real. Por ejemplo, imagine que su supermercado coloca grandes
calcomanías en forma de estrella en los productos que están a la venta. Rápidamente,
aprende que los artículos con las grandes pegatinas en forma de estrella son más baratos.
Sin embargo, imagina que vas a un supermercado similar que no solo usa estas pegatinas,
sino que también usa etiquetas de precio de color naranja brillante para indicar un
descuento.
Debido al bloqueo (es decir, ya sabe que las pegatinas en forma de estrella indican un
descuento), no tiene que aprender el sistema de color también. Las pegatinas en forma de
estrella le dicen todo lo que necesita saber (es decir, no hay error de predicción para el
descuento) y, por lo tanto, el sistema de color es irrelevante.
El condicionamiento clásico es más fuerte si el CS y los EE. UU. Son intensos o
sobresalientes. También es mejor si el CS y los EE. UU. Son relativamente nuevos y el
organismo no ha estado expuesto a ellos con frecuencia antes. Y es especialmente fuerte
si la biología del organismo lo ha preparado para asociar un CS y EE. UU.
En particular. Por ejemplo, las ratas y los humanos están naturalmente inclinados a
asociar una enfermedad con un sabor, en lugar de con una luz o un tono. Debido a que los
alimentos son más comúnmente experimentados por el sabor, si hay un alimento en
particular que nos enferma, asociar el sabor (en lugar de la apariencia, que puede ser
similar a otros alimentos) con la enfermedad garantizará en gran medida que evitemos
ese alimento en el futuro, y así evitar enfermarse. Esta tendencia de clasificación,
establecida por la evolución, se llama preparación.
Hay muchos factores que afectan la fuerza del condicionamiento clásico, y estos han sido
objeto de mucha investigación y teoría.
Los neurocientíficos conductuales también han utilizado el condicionamiento clásico para
investigar muchos de los procesos cerebrales básicos que intervienen en el aprendizaje.
BORRANDO EL APRENDIZAJE CLÁSICO
Después del acondicionamiento, la respuesta a la CS puede eliminarse si la CS se presenta
repetidamente sin los EE. UU. Este efecto se llama extinción, y se dice que la respuesta se
"apaga". Por ejemplo, si Pavlov seguía tocando la campana pero nunca le daba comida al
perro después, eventualmente el CR (babeo) del perro ya no sucedería cuando escuchara
el CS (la campana), porque la campana ya no sería un predictor de comida. La extinción es
importante por muchas razones. Por un lado, es la base de muchas terapias que utilizan
los psicólogos clínicos para eliminar las conductas desadaptativas y no deseadas.
Tome el ejemplo de una persona que tiene un miedo debilitante a las arañas: un enfoque
podría incluir la exposición sistemática a las arañas. Mientras que, inicialmente, la persona
tiene un CR (p. Ej., Miedo extremo) cada vez que ve el CS (p. Ej., La araña), después de
mostrar repetidamente imágenes de arañas en condiciones neutrales, muy pronto el CS ya
no predice el CR (es decir, la persona no tiene la reacción de miedo al ver arañas, ya que
aprendió que las arañas ya no sirven como "señal" para ese miedo). Aquí, la exposición
repetida a las arañas sin una consecuencia aversiva provoca la extinción.
Sin embargo, los psicólogos deben aceptar un hecho importante sobre la extinción: no
necesariamente destruye el aprendizaje original (ver Bouton, 2004 ). Por ejemplo, imagina
que asocias fuertemente el olor de las pizarras con la agonía de la detención en la escuela
intermedia. Ahora imagine que, después de años de encontrarse con pizarras, su olor ya
no recuerda la agonía de la detención (un ejemplo de extinción). Sin embargo, un día,
después de entrar en un nuevo edificio por primera vez, de repente se nota el olor de una
pizarra y ¡WHAM!, vuelve la agonía de la detención. Esto se llama recuperación
espontánea: después de un lapso en la exposición al CS después de la extinción, a veces la
reexposición al CS (p. Ej., El olor de las pizarras) puede evocar el CR nuevamente (p. Ej., La
agonía de la detención).
Otro fenómeno relacionado es el efecto de renovación: después de la extinción, si el CS se
prueba en un nuevo contexto, como una habitación o ubicación diferente, el CR también
puede regresar. En el ejemplo de la pizarra, la acción de ingresar a un nuevo edificio,
donde no esperas oler pizarras, renueva repentinamente las sensaciones asociadas con la
detención. Se ha interpretado que estos efectos sugieren que la extinción inhibe en lugar
de borrar el comportamiento aprendido, y esta inhibición se expresa principalmente en el
contexto en el que se aprende (ver "contexto" en la sección de Vocabulario clave a
continuación).
Esto no significa que la extinción sea un mal tratamiento para los trastornos del
comportamiento. En cambio, los médicos pueden aumentar su efectividad mediante el
uso de investigaciones básicas sobre el aprendizaje para ayudar a vencer estos efectos de
recaída (ver Craske et al., 2008 ).
Por ejemplo, realizar terapias de extinción en contextos donde los pacientes podrían ser
más vulnerables a las recaídas (por ejemplo, en el trabajo), podría ser una buena
estrategia para mejorar el éxito de la terapia.
COSAS ÚTILES QUE DEBE SABER SOBRE EL CONDICIONAMIENTO INSTRUMENTAL
La mayoría de las cosas que afectan la fuerza del condicionamiento clásico también
afectan la fuerza del aprendizaje instrumental, mediante el cual aprendemos a asociar
nuestras acciones con sus resultados. Como se señaló anteriormente, cuanto más grande
es el reforzador (o castigador), más fuerte es el aprendizaje. Y, si un comportamiento
instrumental ya no se refuerza, también se extinguirá. La mayoría de las reglas del
aprendizaje asociativo que se aplican al condicionamiento clásico también se aplican al
aprendizaje instrumental, pero también vale la pena conocer otros hechos sobre el
aprendizaje instrumental.
LAS RESPUESTAS INSTRUMENTALES ESTÁN BAJO CONTROL DE ESTÍMULO
Como saben, la respuesta operante clásica en el laboratorio es presionar con la palanca en
ratas, reforzada por alimentos. Sin embargo, las cosas se pueden organizar de modo que
presionar la palanca solo produzca gránulos cuando hay un estímulo particular. Por
ejemplo, presionar la palanca solo puede reforzarse cuando se enciende una luz en el
cuadro Skinner; Cuando la luz está apagada, no se libera comida al presionar la palanca. La
rata pronto aprende a discriminar entre las condiciones de encendido y apagado, y
presiona la palanca solo en presencia de la luz (las respuestas en el apagado se extinguen).
En la vida cotidiana, piense en esperar en el carril de giro en un semáforo. Aunque sabes
que verde significa ir, solo cuando tienes la flecha verde giras. A este respecto, ahora se
dice que el comportamiento operante está bajo control de estímulo.. Y, como es el caso
con el semáforo, en el mundo real, el control de estímulos es probablemente la regla.
El estímulo que controla la respuesta operante se llama estímulo discriminativo. Se puede
asociar directamente con la respuesta o con el reforzador (ver más abajo). Sin embargo,
generalmente no genera la respuesta como lo hace un CS clásico. En cambio, se dice que
"establece la ocasión para" la respuesta operante. Por ejemplo, un lienzo colocado
delante de un artista no provoca un comportamiento de pintura ni la obliga a pintar.
Permite, o establece la ocasión para que ocurra la pintura.
Las técnicas de control de estímulos se utilizan ampliamente en el laboratorio para
estudiar la percepción y otros procesos psicológicos en animales. Por ejemplo, la rata no
podría responder adecuadamente a las condiciones de encendido y apagado si no pudiera
ver la luz. Siguiendo esta lógica, los experimentos que utilizan métodos de control de
estímulos han probado qué tan bien los animales ven los colores, escuchan los
ultrasonidos y detectan los campos magnéticos. Es decir, los investigadores combinan
estos estímulos discriminativos con aquellos que saben que los animales ya entienden
(como presionar la palanca).
De esta manera, los investigadores pueden probar si los animales pueden aprender a
presionar la palanca solo cuando se reproduce un ultrasonido, por ejemplo.
Estos métodos también se pueden utilizar para estudiar procesos cognitivos "superiores".
Por ejemplo, las palomas pueden aprender a picotear diferentes botones en una caja de
Skinner cuando se muestran imágenes de flores, automóviles, sillas o personas en una
pantalla de televisión en miniatura (ver Wasserman, 1995 ). El botón de picoteo 1 (y
ningún otro) se refuerza en presencia de una imagen de flor, el botón 2 en presencia de
una imagen de silla, y así sucesivamente. Las palomas pueden aprender la discriminación
fácilmente y, en las condiciones adecuadas, incluso picotearán los botones correctos
asociados con imágenes de nuevas flores, automóviles, sillas y personas que nunca antes
han visto. Las aves han aprendido a clasificar los conjuntos de estímulos. Los métodos de
control de estímulo pueden usarse para estudiar cómo se aprende dicha categorización.
EL CONDICIONAMIENTO OPERATIVO IMPLICA ELECCIÓN
Otra cosa que debe saber sobre el condicionamiento operante es que la respuesta
siempre requiere elegir un comportamiento sobre los demás. El estudiante que va al bar
el jueves por la noche elige beber en lugar de quedarse en casa y estudiar. La rata elige
presionar la palanca en lugar de dormir o rascarse la oreja en la parte posterior de la caja.
Los comportamientos alternativos están asociados con sus propios reforzadores. Y la
tendencia a realizar una acción particular depende tanto de los reforzadores ganados por
ella como de los reforzadores ganados por sus alternativas.
Para investigar esta idea, se ha estudiado la elección en el cuadro de Skinner poniendo a
disposición dos palancas para la rata (o dos botones disponibles para la paloma), cada uno
de los cuales tiene su propia tasa de refuerzo o pago. Un estudio exhaustivo de la elección
en situaciones como esta ha llevado a una regla llamada ley cuantitativa del efecto (ver
Herrnstein, 1970), que puede entenderse sin entrar en detalles cuantitativos: la ley
reconoce el hecho de que los efectos de reforzar un comportamiento dependen de
manera crucial de cuánto refuerzo se obtiene para las alternativas del comportamiento.
Por ejemplo, si una paloma aprende que picotear una luz recompensará dos bolitas de
comida, mientras que la otra luz solo recompensa una, la paloma solo picoteará la primera
luz.
Sin embargo, ¿qué sucede si la primera luz es más difícil de alcanzar que la segunda? ¿El
costo de la energía superará la bonificación de los alimentos? ¿O valdrá la pena el trabajo
extra? En general, un reforzador dado será menos reforzador si hay muchos reforzadores
alternativos en el medio ambiente. Por esta razón, el alcohol, el sexo o las drogas pueden
ser reforzadores menos poderosos si el entorno de la persona está lleno de otras fuentes
de refuerzo,
COGNICIÓN EN EL APRENDIZAJE INSTRUMENTAL
La investigación moderna también indica que los reforzadores hacen más que
simplemente fortalecer o "sellar" los comportamientos de los que son consecuencia,
como era la visión original de Thorndike. En cambio, los animales aprenden sobre las
consecuencias específicas de cada comportamiento, y llevarán a cabo un comportamiento
dependiendo de cuánto quieran actualmente o "valoren" sus consecuencias.
Esta idea se ilustra mejor con un fenómeno llamado efecto devaluación del reforzador
(ver Colwill y Rescorla, 1986).) Primero se entrena a una rata para realizar dos acciones
instrumentales (por ejemplo, presionar una palanca a la izquierda y a la derecha), cada
una de ellas con un refuerzo diferente (por ejemplo, una solución de sacarosa dulce y un
gránulo de comida). Al final de este entrenamiento, la rata tiende a presionar ambas
palancas, alternando entre la solución de sacarosa y el gránulo de comida. En una segunda
fase, uno de los reforzadores (p. Ej., La sacarosa) se combina por separado con la
enfermedad. Esto condiciona una aversión gustativa a la sacarosa.
En una prueba final, la rata se devuelve a la caja Skinner y se le permite presionar
cualquier palanca libremente. No se presentan refuerzos durante esta prueba (es decir, no
saca sacarosa ni alimentos al presionar las palancas), por lo que el comportamiento
durante la prueba solo puede ser el resultado de la memoria de la rata de lo que aprendió
anteriormente. Es importante destacar que aquí, la rata elige nopara realizar la respuesta
que una vez produjo el reforzador al que ahora tiene una aversión (por ejemplo, no
presionará la palanca de sacarosa). Esto significa que la rata aprendió y recordó el
reforzador asociado con cada respuesta, y puede combinar ese conocimiento con el
conocimiento de que el reforzador ahora es "malo".
Los reforzadores no se limitan a estampar en las respuestas; el animal aprende mucho
más que eso. Se dice que el comportamiento está " dirigido a un objetivo " (ver Dickinson
y Balleine, 1994 ), porque está influenciado por el valor actual de su objetivo asociado (es
decir, cuánto quiere / no quiere el reforzador la rata).
Sin embargo, las cosas pueden volverse más complicadas si la rata realiza las acciones
instrumentales con frecuencia y repetidamente. Es decir, si la rata ha pasado muchos
meses aprendiendo el valor de presionar cada una de las palancas, el acto de presionarlas
se vuelve automático y rutinario. Y aquí, esta acción una vez dirigida a un objetivo (es
decir, la rata que presiona la palanca para obtener sacarosa / comida) puede convertirse
en un hábito. Por lo tanto, si una rata pasa muchos meses realizando el comportamiento
de presionar la palanca (convirtiendo dicho comportamiento en un hábito), incluso
cuando la sacarosa se vuelva a asociar con la enfermedad, la rata continuará presionando
esa palanca (ver Holland, 2004) Después de toda la práctica, la respuesta instrumental
(presionar la palanca) ya no es sensible a la devaluación del reforzador.
La rata continúa respondiendo automáticamente, independientemente del hecho de que
la sacarosa de esta palanca la enferma.
Los hábitos son muy comunes en la experiencia humana y pueden ser útiles. No necesita
volver a aprender cada día cómo preparar su café por la mañana o cómo cepillarse los
dientes. Los comportamientos instrumentales eventualmente pueden volverse habituales,
permitiéndonos hacer el trabajo mientras somos libres de pensar en otras cosas.
PONIENDO EL CONDICIONAMIENTO CLÁSICO E INSTRUMENTAL JUNTOS
El condicionamiento clásico y operante generalmente se estudia por separado. Pero fuera
del laboratorio, casi siempre ocurren al mismo tiempo. Por ejemplo, una persona que está
reforzada por beber alcohol o comer en exceso aprende estos comportamientos en
presencia de ciertos estímulos: un pub, un grupo de amigos, un restaurante o
posiblemente el sofá frente al televisor. Estos estímulos también están disponibles para su
asociación con el reforzador. De esta manera, el condicionamiento clásico y operante
siempre se entrelaza.
La siguiente figura resume esta idea y ayuda a revisar lo que hemos discutido en este
módulo. En términos generales, cualquier respuesta operante reforzada o castigada (R) se
combina con un resultado (O) en presencia de algún estímulo o conjunto de estímulos (S).
La figura ilustra los tipos de asociaciones que se pueden aprender en este escenario muy
general. Por un lado, el organismo aprenderá a asociar la respuesta y el resultado (R - O).
Este es un condicionamiento instrumental.
El proceso de aprendizaje aquí es probablemente similar al condicionamiento clásico, con
todo su énfasis en la sorpresa y el error de predicción. Y, como discutimos al considerar el
efecto de devaluación del reforzador, una vez que se aprende R - O, el organismo estará
listo para realizar la respuesta si el resultado es deseado o valorado. El valor del
reforzador también puede ser influenciado por otros reforzadores obtenidos por otros
comportamientos en la situación. Estos factores están en el corazón del aprendizaje
instrumental.
En segundo lugar, el organismo también puede aprender a asociar el estímulo con el
resultado de refuerzo (S - O). Este es el componente de condicionamiento clásico y, como
hemos visto, puede tener muchas consecuencias en el comportamiento.
Por un lado, el estímulo llegará a evocar un sistema de respuestas que ayudarán al
organismo a prepararse para el refuerzo (no se muestra en la figura): el bebedor puede
sufrir cambios en la temperatura corporal; el comedor puede salivar y tener un aumento
en la secreción de insulina. Además, el estímulo evocará un enfoque (si el resultado es
positivo) o una retirada (si el resultado es negativo). La presentación del estímulo también
provocará la respuesta instrumental.
La tercera asociación en el diagrama es la que existe entre el estímulo y la respuesta (S -
R). Como se discutió anteriormente, después de mucha práctica, el estímulo puede
comenzar a provocar la respuesta directamente. Este es el aprendizaje de hábitos, por el
cual la respuesta se produce de forma relativamente automática, sin mucho
procesamiento mental de la relación entre la acción y el resultado y el valor actual del
resultado.
El vínculo final en la figura es entre el estímulo y la asociación respuesta-resultado [S - (R -
O)]. Más que simplemente entrar en una asociación simple con la R o la O, el estímulo
puede indicar que la relación R - O está vigente. Esto es lo que queremos decir cuando
decimos que el estímulo puede "establecer la ocasión" para la respuesta operante:
establece la ocasión para la relación respuesta-reforzador.
A través de este mecanismo, el pintor puede comenzar a pintar cuando se le brindan las
herramientas adecuadas y la oportunidad que brinda el lienzo. El lienzo teóricamente
indica que el comportamiento de la pintura ahora se verá reforzado por consecuencias
positivas.
La figura proporciona un marco que puede usar para comprender casi cualquier
comportamiento aprendido que observe en usted, su familia o sus amigos. Si desea
comprenderlo más profundamente, considere tomar un curso sobre aprendizaje en el
futuro, que le dará una apreciación más completa de cómo el aprendizaje clásico, el
aprendizaje instrumental, el aprendizaje de hábitos y el establecimiento de ocasiones
realmente funcionan e interactúan.
APRENDIZAJE MEDIANTE LA OBSERVACIÓN
No todas las formas de aprendizaje se explican por completo por el condicionamiento
clásico y operante. Imagine a un niño caminando hacia un grupo de niños jugando un
juego en el patio de recreo. El juego se ve divertido, pero es nuevo y desconocido. En lugar
de unirse al juego de inmediato, el niño opta por sentarse y ver a los otros niños jugar una
ronda o dos. Al observar a los demás, el niño toma nota de las formas en que se
comportan mientras juegan. Al observar el comportamiento de los otros niños, el niño
puede descubrir las reglas del juego e incluso algunas estrategias para hacerlo bien en el
juego. Esto se llama aprendizaje observacional.
El aprendizaje por observación es un componente de la Teoría del aprendizaje social de
Albert Bandura (Bandura, 1977), que postula que los individuos pueden aprender
respuestas novedosas a través de la observación de los comportamientos clave de los
demás. El aprendizaje observacional no requiere necesariamente refuerzo, sino que
depende de la presencia de otros, conocidos como modelos sociales.. Los modelos
sociales son típicamente de mayor estatus o autoridad en comparación con el observador,
cuyos ejemplos incluyen padres, maestros y policías.
En el ejemplo anterior, los niños que ya saben jugar pueden considerarse autoridades y,
por lo tanto, modelos sociales, aunque tengan la misma edad que el observador. Al
observar cómo se comportan los modelos sociales, un individuo puede aprender a actuar
en una situación determinada. Otros ejemplos de aprendizaje observacional podrían
incluir un niño que aprende a colocar su servilleta en su regazo mirando a sus padres en la
mesa de la cena, o un cliente que aprende dónde encontrar la salsa de tomate y la
mostaza después de observar a otros clientes en un puesto de perritos calientes.
Bandura teoriza que el proceso de aprendizaje observacional consta de cuatro partes. El
primero es la atención, ya que, simplemente, uno debe prestar atención a lo que está
observando para aprender. La segunda parte es la retención: para aprender, uno debe ser
capaz de retener el comportamiento que está observando en la memoria. La tercera parte
del aprendizaje observacional, iniciación, reconoce que el alumno debe ser capaz de
ejecutar (o iniciar) el comportamiento aprendido. Por último, el observador debe poseer
la motivación para participar en el aprendizaje observacional. En nuestra viñeta, el niño
debe querer aprender a jugar para participar adecuadamente en el aprendizaje
observacional.
Los investigadores han realizado innumerables experimentos diseñados para explorar el
aprendizaje observacional, el más famoso de los cuales es el "experimento de la muñeca
Bobo" de Albert Bandura.
En este experimento (Bandura, Ross y Ross 1961), Bandura hizo que los niños observaran
individualmente a un modelo social adulto interactuar con una muñeca de payaso
("Bobo"). Para un grupo de niños, el adulto interactuó agresivamente con Bobo:
golpeándolo, pateándolo, tirándolo e incluso golpeándolo en la cara con un mazo de
juguete. Otro grupo de niños observó al adulto interactuar con otros juguetes, sin mostrar
agresividad hacia Bobo. En ambos casos, el adulto se fue y los niños pudieron interactuar
con Bobo por su cuenta. Bandura descubrió que los niños expuestos al modelo social
agresivo eran significativamente más propensos a comportarse agresivamente hacia Bobo,
golpeándolo y pateándolo, en comparación con los expuestos al modelo no agresivo.
Si bien no se requirió refuerzo para provocar el comportamiento de los niños en el primer
experimento de Bandura, es importante reconocer que las consecuencias juegan un papel
en el aprendizaje observacional. Una futura adaptación de este estudio (Bandura, Ross y
Ross, 1963) demostró que los niños en el grupo de agresión mostraron un
comportamiento menos agresivo si presenciaron que el modelo adulto recibe castigo por
agredir a Bobo. Bandura se refirió a este proceso como refuerzo indirecto, ya que los niños
no experimentaron el refuerzo o el castigo directamente, pero aun así fueron
influenciados al observarlo.

CONCLUSIÓN
Hemos cubierto tres explicaciones principales sobre cómo aprendemos a comportarnos e
interactuar con el mundo que nos rodea. Teniendo en cuenta sus propias experiencias,
¿qué tan bien se aplican estas teorías a usted? Quizás al reflexionar sobre su sentido
personal de la moda, se dé cuenta de que tiende a seleccionar la ropa que otros le han
felicitado (condicionamiento operante). O tal vez, al pensar en un nuevo restaurante que
probó recientemente, se da cuenta de que lo eligió porque sus comerciales reproducen
música feliz (acondicionamiento clásico). O tal vez ahora esté siempre a tiempo con sus
tareas, porque vio cómo se castigaba a los demás cuando llegaba tarde (aprendizaje de
observación). Independientemente de la actividad, el comportamiento o la respuesta,
existe una buena probabilidad de que su "decisión" de hacerlo pueda explicarse en
función de una de las teorías presentadas en este módulo.

Potrebbero piacerti anche