Sei sulla pagina 1di 62

Resumen libro:Principios de aprendizaje y conducta - Domjan 9th

CAPITULO 1:
ANTECEDENTES HISTÓRICOS

Dualismo Cartesiano: 2 tipos de conducta

1) Conducta Involuntaria: Respuestas automáticas a los estímulos externos y está mediada por un
mecanismo llamado reflejo.

2) Conducta Voluntaria: No requiere de la intervención de estímulos externos sino que se debe a la


voluntad consciente de actuar de una determinada forma.

Desarrollo histórico del estudio de la mente

Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura
nativista.

Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a través de
experiencias posteriores al nacimiento. Modelo adoptado por filósofos británicos entre XVII-XIX. A los
seguidores se les conocería como Empiristas británicos.

Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes.
Las personas siempre tratarán de lograr el placer y evitar el dolor.

Concepto de asociación: Concepto importante para los empiristas británicos para explicar el funcionamiento de
la mente. Las sensaciones simples se combinan hasta formas ideas complejas por medio de asociaciones.

Leyes de asociación

Leyes primarias: (Origen en Aristóteles) contigüidad, similitud y contraste

Contigüidad: La más importante en el estudio de las asociaciones. Si dos eventos ocurren juntos en el espacio
o en el tiempo de forma repetida quedarán asociados.

Similitud y contraste: Dos ideas se asocian si son similares en algún aspecto o si tienen alguna característica
contraria

Leyes secundarias: (Thomas Brown 1778-1820). La formación de asociaciones entre dos sensaciones estaba
influida por un número de factores, incluyendo la intensidad de las sensaciones y la frecuencia y recencia con
que las dos sensaciones ocurrían conjuntamente. Además se consideraba que la formación de una asociación
entre dos eventos dependía del número de asociaciones anteriores en las que cada uno de dichos eventos
estaba involucrado, y la similitud entre estas asociaciones pasadas y la que se forma en el presente.

Sílabas sin sentido: Combinaciones de 3 letras despojadas de cualquier significado que pudiera influir en
cómo se reaccionaba entre ellas. El alemán este, Ebbinghaus, se utilizó a si mismo para medir su capacidad
de recordarlas en diferentes condiciones experimentales. Comprobó que la fuerza de las asociaciones
mejoraba con el entrenamiento

Desarrollo histórico del estudio de los reflejos

Charles Bell y François Magendie demostraron que eran fibras nerviosas distintas las que se encargaban de
transmitir la información sensorial desde los órganos de los sentidos hasta el sistema nervioso central y otras
fibras que transmitían la información motora desde el sistema nervioso central hasta los músculos.
En 1669 John Swamerdamm mostró que la irritación mecánica de un nervio era suficiente para producir una
contracción muscular, asi que lo de los espiritus animales desde la glandula pineal era innecesario.

Posteriormente, Francis Glisson demostró que las contracciones musculares no se debían a que los músculos
fueran hinchados por un gas.
con todo esto llegamos al siglo XIX y los rusos entran en acción:

I.M Sechenov (1829-1905) – Propuso que los estímulos no siempre elicitan respuestas reflejas de forma
directa. En algunos casos un estímulo puede liberar una respuesta que estaba inhibida y la fuerza de la respuesta
no dependerá de la intensidad del estímulo.

Sin embargo el trabajo de Sechenov tenía un fallo: No tuvo en consideración que a lo largo de la vida de
un individuo, su respuesta ante un estímulo puede variar debido a la experiencia.
Ivan Pavlov (1849 – 1936): Demostró experimentalmente que no todos los reflejos son innatos. Mediante
mecanismos asociativos se pueden establecer nuevos reflejos para estímulos. Su papel fue similar al del
alemán que hablabamos antes, Ebbinghaus, pero Pavlov realizó su trabajo desde la tradición filosófica de la
reflexología.

La cognición comparada y la evolución de la inteligencia

Descartes pensaba que los humanos eran los únicos animales que poseían mente.

Darwin criticó duramente esta idea y en su libro “el origen del hombre” postuló que el hombre desciende de
algún ser más primitivo, a pesar de que por el momento se desconozcan los eslabones intermedios”. En
opinión de Darwin, la mente humana es producto de la evolución y si el ser humano tiene habilidades mentales
como hacerse preguntas, memorizar, o razonar, el resto de animales posee también dichas habilidades.

George Romanes: Definió la inteligencia a partir de la capacidad de aprender.


Esta definición fue ampliamente aceptada a finales del XIX y principios del XX

Neurologia funcional

Nervismo: (Pavlov) – De acuerdo con el nervismo, las principales funciones fisiológicas están controladas por
el sistema nervioso.

Sin embargo…años más tarde (1902) surgen dos investigadores británicos (Bayliss y Starling) demostraron que
el páncreas estaba controlado parcialmente por factores hormonales y no neurales. Este nuevo descubrimiento
le llevó a Pavlov a pensar que por ahí no iban los tiros y abandonar su investigación sobre la fisiología del
sistema digestivo y centrarse en los reflejos condicionados.

Pavlov consideró los estudios de condicionamiento como un medio para obtener información sobre las
funciones del sistema nervioso.

Modelos animales de la conducta humana

Se pensaba que la investigación con animales podría proporcionar información útil para la comprensión del
comportamiento humano.

Los modelos animales permiten investigar problemas que son difíciles o imposibles de estudiar directamente en
personas. Un modelo permite realizar la investigación en condiciones más sencillas, mejor controladas y más
económicas.

Lo más importante a la hora de construir un modelo animal útil es identificar las similitudes relevantes entre el
modelo animal y la conducta humana en cuestión.
Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio realizados con
animales no humanos se usaran para aislar e identificar los fenómenos que podrían ser estudiados
posteriormente con éxito en las personas.

Modelos animales y robótica

La meta de la robótica es hacer máquinas tan inteligentes como sea posible. Los ingenieros actuales
contemplan la capacidad de recordar y aprender a partir de la experiencia como un rasgo importante de los
sistemas artificiales inteligentes.

Según Domjan: “El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estímulos
y/o respuestas específicas y que es resultado de la experiencia previa con esos estímulos y respuestas o con
otros similares”

Distinción entre aprendizaje y ejecución

Acerca de la definición anterior es importante puntualizar que atribuye el aprendizaje a un cambio en los
mecanismos de conducta, no a un cambio directo en la conducta. Esto es importante ya que pueden haber
cambios en la conducta que no sean consecuencia de un aprendizaje

Ejecución: Se refiere a las acciones de un organismo en un momento concreto. Que hagamos (o no) algo
depende de muchas cosas, como la motivación, capacidades sensoriales, etc, además del aprendizaje.

El aprendizaje y otras fuentes de cambio conductual

Existen cambios en la conducta tan breves que no pueden ser considerados como ejemplos de aprendizaje:

Fatiga: El esfuerzo físico debilita gradualmente la fuerza de una respuesta.

Cambio en las condiciones estimulares: Encender las luces a mitad de la película en el cine provoca una
respuesta en los espectadores.

Estado Fisiológico o motivacional del organismo: El hambre y la sed provocan respuestas que no se
observan en otros momentos.

Maduración: Un niño crece y alcanza una estantería a la que antes no llegaba. No se considera aprendizaje ya
que es un cambio debido al paso del tiempo.

Diferentes tipos de mecanismos causales

Existen 4 tipos de causas descritos por Aristóteles:

Causa eficiente: Es la experiencia anterior con estímulos y/o respuestas específicos que produce el cambio en
la conducta que señala la presencia del aprendizaje.

Causa material: Hacen referencia a los cambios físicos en el sistema nervioso que median en el aprendizaje.

Causa formal: Las causas formales son las teorías o modelos de aprendizaje. Estas terorías o modelos
pueden expresarse en términos matemáticos o computacionales.
Causa final: La causa final de un comportamiento o de cualquier proceso biológico es cómo ese proceso
contribuye al éxito reproductivo del organismo. La causa final se mide a partir del número de descendientes de
un organismo.

El aprendizaje como ciencia experimental


Los investigadores del aprendizaje han centrado su atención en las causas eficientes, materiales y formales. Las
causas no pueden observarse directamente. Tan sólo pueden ser inferidas a partir de los resultados de las
manipulaciones experimentales.

Para identificar una causa se requiere la realización de una prueba en ausencia de dicha causa. Entonces
podremos comparar los resultados obtenidos en presencia y en ausencia de la presunta causa. La pregunta típica
es si un procedimiento produce un efecto de aprendizaje en particular. Para responder a esta pregunta, hay que
comparar las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestión con
las acciones de los individuos que no han sido expuestos a dicho procedimiento.

La perspectiva de proceso general en el estudio del aprendizaje

Elementos de la perspectiva de proceso general

La característica más obvia de la naturaleza es su diversidad. Sin embargo todos los científicos han optado por
fijarse en los aspectos comunes a la hora de estudiarla. Han tratado de formular leyes generales con las que
organizar y explicar la diversidad de los eventos del universo. Los investigadores del aprendizaje animal han
seguido esta tradición.

Un presupuesto fundamental en la perspectiva de proceso general es que los fenómenos estudiados son el
resultado de procesos más elementales. Además se supone que estos procesos elementales operan de forma
similar independientemente de donde se encuentren. Los investigadores del condicionamiento y el aprendizaje
se han adherido a esta perspectiva de proceso general desde los comienzos de esta área de estudio en psicología.

Darwin, Pavlov o C. Lloyd Morgan seguían esta perspectiva. Creían en la existencia de leyes universales (por
ejemplo las leyes de asociación) para todas las especies, aunque también afirmaban que cada especie podía
tener un ritmo diferente de aprendizaje para unas mismas leyes elementales.
Implicaciones metodológicas de la perspectiva de proceso general

La principal implicación metodológica de esta perspectiva es que se pueden descubrir los principios de
aprendizaje estudiando cualquier especie o sistema de respuesta que demuestre aprendizaje. Esta implicación ha
llevado a una estandarización en la comunidad científica de los paradigmas experimentales.

Demostración de la generalidad de los fenómenos de aprendizaje

Es importante tener en mente que la adopción de la perspectiva de proceso general no prueba la generalidad de
los procesos de aprendizaje. Una teoría general no puede verificarse empíricamente utilizando unos pocos
paradigmas experimentales estandarizados. La generalidad del aprendizaje debe probarse realizando estudios en
distintas especies y situaciones.

Razones del uso de animales no humanos en la investigación sobre aprendizaje

Con los animales de laboratorio los científicos pueden estudiar cómo se aprenden las reacciones emocionales
intensas. Sin embargo, con las personas, los investigadores se ven limitados a tratar de modificar las respuestas
emocionales inadaptadas una vez que éstas ya han sido aprendidas. Para modificar esta respuesta tienen que
comprender cómo se aprendió, y es por esta razón por la que se estudian las respuestas emocionales en los
animales de laboratorio y extrapolan la conclusión a los seres humanos.

Una de las preguntas fundamentales acerca de la naturaleza humana es cómo evolucionaron la cognición y la
inteligencia. Por ello la investigación sobre la evolución de la cognición y la inteligencia se apoya fuertemente
en estudios de aprendizaje realizado con animales.

Ventajas de utilizar animales de laboratorio en lugar de personas

Los procesos de aprendizaje suelen ser más simples


El comportamiento de los animales no se ve complicado por procesos lingüísticos
No es necesario hacer peticiones explícitas a los sujetos
El investigador no debe preocuparse sobre si los actos de los participantes no están influidos por el deseo de
complacer al investigador

Los animales de laboratorio y la conducta normal

La ética de la investigación con animales de laboratorio

Han surgido reglas estrictas que obligan a los laboratorios a tratar bien a los animales. Sin embargo se olvida
que aunque no existan estas reglas, los científicos siempre los tratarían bien, ya que la información extraída a
partir de experimentos a animales enfermos o ansiosos no es fiable. Por lo tanto los propios científicos son los
primeros interesados en el bienestar de sus sujetos experimentales.

A veces los experimentos conllevan incomodidades, como la privación de comida o estimulos aversivos.
Algunos temas importantes, como el castigo o el condicionamiento del miedo no pueden estudiarse sin
alguna incomodidad por parte del sujeto. Los estudios de aprendizaje del miedo utilizan a menudo
descargas eléctricas, pero de baja intensidad.

¿Qué constituye un trato humano a los animales?

Asumiendo que una especie merece el trato que establezcan las normas oficiales,
¿cuáles deberían ser esas normas? A menudo se describe el “trato humano” como el tratamiento apropiado para
los animales de laboratorio. Sin embargo las ratas prefieren vivir en madrigueras oscuras hechas de basura y los
humanos en habitaciones limpias e iluminadas…y así es precisamente como se tiene a las ratas en los
laboratorios. Quizá el “trato humano” que les damos no es precisamente el que las ratas preferirían…

¿Deben los seres humanos beneficiarse del uso de otros animales?

Muchos animales domésticos también se benefician de la relación con los humanos, de hecho algunos no
existirían. Se trata de una relación simbiótica.
Además el uso de animales de laboratorio representa tan sólo una pequeña parte del uso que otros humanos
hacen de los animales domésticos, incluyendo su uso como fuente de alimentación.
Si a estos datos sumamos el impacto en su habitat que tiene la construcción de carreteras, viviendas, etc o los
miles de animales muertos por insecticidas, etc. La proporción de los utilizados en laboratorios es aún más
insignificante.
Alternativas a la investigación con animales
Russell y Burch (1959) formularon las 3 “R” de la investigación con animales.
Reemplazamiento del uso de animales por otras técnicas de estudio
Reducción del número de animales empleados por medio de técnicas estadísticas
Refinamiento de los procesos experimentales para causar menos sufrimiento
Algunas de las alternativas propuestas son las siguientes:

1. Técnicas observacionales: No se puede. Los estudios de aprendizaje requieren manipulaciones


experimentales de la experiencia pasada.
2. Uso de plantas: No se puede estudiar el aprendizaje ya que carecen de Sistema nervioso.
3. Cultivo de tejidos: El funcionamiento de estos procesos celulares en el organismo intacto solo puede
estudiarse en el organismo intacto.
4. Simulaciones informáticas: La preparación de un programa informático que simule
un fenómeno natural requiere un conocimiento profundo del fenómeno en cuestión. No pueden utilizarse
para generar hechos anteriormente desconocidos sobre la conducta. Eso sólo puede hacerse estudiando a los
organismos vivos.
CAPITULO 2:
CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN
Gran parte de la conducta de los animales tiene lugar como respuesta a estímulos, es decir, ocurre de forma
elicitada.

El concepto de reflejo

Un reflejo se compone de dos elementos, un estímulo elicitante y su correspondiente respuesta. Estos dos
elementos se comprenden bien mediante la organización del sistema nervioso. En los vertebrados los reflejos
simples están mediados por 3 neuronas:

Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a la medula espinal.

Neurona motora (eferente): Activa el músculo involucrado en la respuesta refleja.

Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de neuronas anteriores.

Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la neurona motora. En los
vertebrados, el arco reflejo representa el numero mínimo de conexiones neuronales necesarias para que tenga
lugar el acto reflejo.

La mayor parte de los reflejos contribuyen al bienestar del organismo.

Un reflejo importante en los recién nacidos es el reflejo de oclusión respiratoria: si algo (prendas,
mucosidades) tapona la nariz del bebé, su reflejo será echar la cabeza hacia atrás buscando aire, si sigue sin
encontrar aire comenzará a llorar, lo que provocará una expulsión vigorosa del aire eliminando cualquier
obstrucción de las vias respiratorias.
Pautas de acción modal

Las pautas de acción modal (PAMs) son respuestas típicas de especies particulares.
Una de las características de las PAMs es que el umbral de estimulación necesario para que éstas se pongan en
marcha varía en función de las circunstancias. El estímulo puede tener efectos diversos dependiendo del estado
fisiológico del animal y de las acciones que haya realizado recientemente.

Estimulos elicitantes de las pautas de acción modal

Un estímulo elicitante se identifica fácilmente cuando se trata de reflejos simples, ante un ruido mostraremos
una respuesta de sobresalto. En cambio los estimulos elicitantes de las PAMs son más complejos.
Estimulos supranormales: Son estímulos inusualmente efectivos. Aquí volvieron a estudiar a las gaviotas, en
concreto cuales eran los huevos que más protegían. Huevos verdes, grandes y moteados eran sus
preferidos. Entonces los científicos crearon un super huevo verde artificial y lleno de motas que era mucho más
efectivo que el natural a la hora de elicitar la respuesta de acción.

La organización secuencial de la conducta

Las respuestas no tienen lugar aisladas unas de otras sino que se organizan en secuencias de comportamiento
funcionalmente efectivas.. Toda conducta dirigida a metas involucra secuencias de acciones sistemáticamente
organizadas.

Los etólogos denominaron conducta apetitiva a los primeros componentes de la secuencia del comportamiento
y conducta consumatoria a los ultimos.
Modo de búsqueda general: Antes de que la ardilla pueda identificar un nogal se moverá buscando posibles
fuentes de alimentación.
Modo de búsqueda focalizada: Al encontrar un nogal pasará al modo focalizado en
el que sólo buscará nueces en ese árbol.
Modo de manipulación de alimento (o consumatorio): Obtener la nuez y masticarla.

Atención visual en los bebes humanos

Conclusión: La atención visual provocada por un estímulo novedoso cambia a medida que el bebé se
familiariza con el estímulo.

Salivación y evaluación del sabor en humanos

El sabor de la comida elicita la salivación como respuesta refleja. En un estudio se midió la respuesta de
salivación de 8 mujeres ante el sabor del zumo de limón y el zumo de lima. La salivación como respuesta al
sabor disminuía con cada ensayo, pero después de 10 ensayos con limón, se introducía lima en el ensayo 11 y
los sujetos volvían a salibar de nuevo.

Respuesta de sobresalto en ratas

La respuesta de sobresalto se da en muchas especies, incluida la humana. Consiste en un salto repentino y


una contracción de los músculos de la parte superior del cuello. En las ratas puede medirse esta respuesta
mediante la cámara estabilimétrica que mediante sensores mide la intensidad de la reacción de sobresalto.

Se metía a las ratas en la cámara y mediante sonidos y luces se les daba sustos para medir su respuesta de
sobresalto.

Efecto de habituación: Disminución de la tendencia a responder producido por la estimulación repetida.

Efecto de sensibilización: Incremento en la tendencia a responder producido por la estimulación repetida.

Adaptabilidad y generalidad de la habituación y sensibilización

En nuestro día a día estamos bombardeados por multitud de estímulos, olores, imágenes, texturas, etc. Los
efectos de habituación y sensibilización nos ayudan a decidir qué estímulos ignorar y a cuáles responder, de lo
contrario nuestra conducta sería desorganizada y caótica.

Diferencias entre habituación, adaptación sensorial y fatiga

La habituación no es el único efecto que da lugar a una disminución en la respuesta. Un reflejo también puede

provocar una disminución en la respuesta. Recordemos que el reflejo consta de 3 componentes:

Un estímulo que activa los órganos sensoriales


Interneuronas que transmiten los mensajes sensoriales a los órganos motores
Impulsos nerviosos que activan los músculos

La adaptación sensorial ocurre en los órganos sensoriales


La fatiga de la respuesta tiene lugar en los músculos efectores
La habituación y sensibilización tienen lugar en el sistema nervioso

¿Cómo distinguimos todo esto?

La habituación se distingue de la adaptación sensorial en que la habituación es específica de la respuesta.


La habituación se distingue de la fatiga en que la habituación es específica del estímulo.

Teoría del proceso dual de habituación y sensibilización

Esta teoría fue formulada por Groves y Thompson (1970). La teoría del proceso dual presupone que los
incrementos y disminuciones en la tendencia a responder a un estímulo son producto de procesos neurales
diferentes. El proceso de habituación provoca una disminución en la tendencia a responder, en cambio, el
proceso de sensibilización produce un incremento en la tendencia a responder.

Sin embargo ambos procesos están relacionados y pueden estar activos al mismo tiempo ante un mismo
estímulo.

Groves y Thomson sugirieron que los procesos de habitación y sensibilización tienen lugar en diferentes partes
del sistema nervioso:

Proceso de habituación: tiene lugar en el sistema E-R (estimulo respuesta)


Proceso de sensibilización: tiene lugar en el sistema de estado. Este sistema abarca otras partes del
sistema nervioso que determinan el nivel general de disposición a responder.

Implicaciones de la teoría del proceso dual

El sistema E-R se activa siempre que un estímulo elicita una respuesta ya que es el circuito neuronal que
lleva los impulsos desde la entrada sensorial hasta la salida conductual.
El sistema de estado sólo interviene en circunstancias especiales.

La teoría del proceso dual de habituación y sensibilización ha tenido una gran influencia en el estudio
de la plasticidad de la conducta elicitada.

1. Curso temporal

La mayor parte de los cambios conductuales se mantiene durante períodos largos.

Curso temporal de sensibilización

Por lo general los procesos de sensibilización tienen efectos temporales. En todos los sistemas de respuesta
la duración de los efectos de sensibilización está determinada por la intensidad del estimulo. Los
estímulos más intensos producen mayores incrementos de la tendencia a responder y una sensibilización
más persistente.

Curso temporal de la habituación

2 tipos de efectos de habituación cualitativamente distintos:

La habituación a corto plazo (desaparece en segundos o minutos)


La habituación a largo plazo (persiste durante muchos días)

Recuperación instantánea: Recuperación de una respuesta habituada o de una respuesta extinguida tras un
período de descanso. La recuperación instantánea es la característica principal del efecto de habituación a corto
plazo.

2. Especificidad del estimulo

Especificidad del estimulo en la habituación

La habituación es específica del estímulo que ha sido presentado repetidamente. Una respuesta a un estímulo
previamente habituada puede manifestarse plenamente alterando alguna característica importante del estímulo.
Especificidad del estimulo de sensibilización

La sensibilización no es muy específica del estímulo. Si un animal se activa o sensibiliza por alguna razón, su
reactividad se incrementará para toda una variedad de estímulos, no sólo para el causante de su sensibilización

3. Efecto de un estímulo externo intenso

Deshabituación: Una respuesta habituada puede restablecerse sensibilizando al organismo con la exposición
a un estímulo externo. Es importante tener en cuenta que la deshabituación hace referencia a la recuperación
de la respuesta al estímulo previamente habituado.

Reacciones emocionales y sus efectos posteriores

Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo constan de dos fases. Una
emoción tiene lugar durante la presentación del estímulo elicitante y la opuesta se observa cuando el estímulo
desaparece.

Otra característica de las reacciones emocionales es que cambian con la experiencia. La reacción primaria se
hace más débil y su postefecto se hace más fuerte.

Tolerancia a la droga: Habituación de la primera reacción a la droga


También podemos encontrar esta misma analogía de dos procesos en el amor y el apego.

La teoría del proceso oponente

Esta teoría se diseñó para explicar los 3 rasgos característicos de las emociones.

1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto.
2. La reacción primaria de debilita con la estimulación repetida.
3. El debilitamiento de la reacción primaria va acompañado de un fortalecimiento del postefecto.

La teoría asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de
mantener la estabilidad emocional, se trata de minimizar las desviaciones intentando volver a la neutralidad de
nuestro estado emocional. Por esta razón decimos que es una teoría homeostática.

Encontramos dos tipos de procesos:

Proceso primario o proceso a: Es el responsable de la naturaleza del estado emocional que tiene lugar en
presencia del estímulo (la alegría).

Proceso oponente o proceso b: Es el que genera la reacción emocional opuesta (por ejemplo tristeza).

Mecanismos oponentes durante la exposición inicial al estímulo

En la primera presentación del estímulo el proceso b no es lo suficientemente fuerte para compensar por
completo la respuesta emocional primaria, que persiste mientras esté presente el estímulo elicitante. Cuando el
estímulo se retira, el proceso a se detiene rápidamente pero el proceso b permanece por algún tiempo y
se hace evidente por primera vez.

Mecanismos oponentes tras la exposición prolongada al estímulo

El proceso b se fortalece con la exposición prolongada al estímulo, por el contrario se asume que el proceso a
permanece inalterado. Por tanto, tras la presentación repetida de un estímulo, la respuesta emocional
primaria queda compensada de forma más efectiva por el proceso oponente.
Motivación y postefecto oponente

Si los consumidores habituales de drogas cada vez notan menos placer al consumirlas ¿porqué se hacen
adictos? La teoría del proceso oponente sugiere que la adicción a las drogas es un intento de reducir la aversión
producida por el postefecto afectivo de las drogas (bajón, irritabilidad, malestar). Hay dos formas de reducir el
postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el mono) pero muchas veces
el mono es tan largo que la otra forma de pasarlo es volver a consumir la droga. Este mecanismo es lo que hace
que la gente se haga adicta, no por el placer directo que obtienen de la droga, sino para reducir los
efectos de retirada.

Valoración general de la teoría del proceso oponente

Esta teoría no ha conseguido explicar tantas cosas como prometía. Lo más destacable es que ha supuesto
una importante contribución al aplicar el concepto de regulación homeostática al análisis de las emociones y la
motivación.

Variaciones en la conducta dirigida a metas

Responder para escapar de la molestia producida por la retirada de un estímulo es solo uno de los tipos
de conducta motivada o dirigida a metas. En los siguientes temas veremos más ejemplos de este tipo de
conductas, prestando especial atención a las situaciones en las que los individuos dan una respuesta para
alcanzar un estímulo gratificante. Este objeto meta recibe el nombre de reforzador.
CAPITULO 3:
CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Los primeros estudios comenzaron con el trabajo de Pavlov.


Otro científico llamado Edwin B. Twitmyer también lo descubrió de manera independiente a
Pavlov.

Los descubrimientos de Vul´fson y Snarskii

Fueron los primeros en estudiar el condicionamiento clásico en el laboratorio de Pavlov. Siguieron


experimentando con los perros y su salivación.

Estímulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura y sabor


características. Estas sensaciones reciben el nombre de estímulos orofaringeos.

El paradigma de condicionamiento clásico

El procedimiento de Pavlov constaba de dos estímulos:

-Los que no provoca salivación al principio del experimento. Se trata del estímulo condicional ya que su
efectividad depende de su emparejamiento con el ácido. Provoca una respuesta condicional

-Solución ácida situada en la boca. Se trata del estímulo incondicional ya que no depende de nada para
producir saliva. Provoca una respuesta incondicional.

Condicionamiento del miedo

Watson y Rainer (1920). Pensaban que los niños estaban muy limitados para dar respuestas emocionales
distintas. Se dieron cuenta que mediante el condicionamiento clásico podían “despertar” este abanico de
emociones. Y no tuvieron mejor cosa que hacer que condicionar la respuesta de miedo a un niño de 9
meses ante la presentación de una rata blanca. Le ponían la rata delante y hacían sonar justo detrás de su
cabeza una barra de hierro muy fuerte y se asustaba, al poco tiempo la sola presencia de la rata hacia que se
asustase. Este miedo se generalizó a otros objetos peludos como un conejo, un abrigo de piel o un
mascara de santa Claus.
Aparte del experimento de la palanca también utilizaban la supresión condicionada del lameteo en el
cual ratas sedientas bebían de un tubo que desprendía agua y mediante el EC se paralizaban y no bebían.

Condicionamiento del parpadeo

Conocido como reflejo palpebral.

1. Presentación de un estímulo condicionado – Tono


2. Soplo de aire a los ojos – estímulo incondicionado – Se produce el parpadeo.
3. El sujeto aprende a parpadear ante la sola presencia del estímulo condicionado
El condicionamiento palpebral y la búsqueda del engrama

Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva información se llama
engrama.

¿Dónde se encuentra el engrama?

Richard Thompson ha buscado la respuesta durante casi 4 décadas.


La búsqueda del engrama comenzó por el hipocampo. Sin embargo comprobaron en animales que si les
extirpaban el hipocampo la capacidad de aprendizaje condicionado no se alteraba. Entonces concluyeron
que el engrama se encontraba en el cerebelo …

Estímulo incondicionado – La señal llega al cerebelo a través de fibras trepadoras


Estímulo condicionado – La señal llega al cerebelo a través de fibras musgosas

Seguimiento del signo

Pavlov pensaba que el condicionamiento solo se daba en sistemas de respuesta reflejos, sin embargo
después apareció el paradigma de seguimiento del signo o automoldeamiento que explicaba cosas
diferentes.

¿Cómo comprobaban el seguimiento del signo en el laboratorio?

Con Palomas dentro de una caja. Había una tecla (EC) que se iluminaba durante 8 segundos y a
continuación se administraba comida (EI) en un pequeño comedero (no era necesario pulsar la tecla para
administrar comida, ya que el procedimiento era automático). Sin embargo con las repeticiones, cada
vez que la tecla se encendía, las palomas picoteaban la tecla.

Aprendizaje de aversión al sabor

El acto de comer proporciona numerosas oportunidades para el aprendizaje de asociación.

La aversión a un sabor puede aprenderse si la ingestión de un sabor nuevo va seguida de enfermedad o de


otras circunstancias negativas. Por el contrario la preferencia por un sabor va acompañada de
sensaciones de saciedad u otras circunstancias positivas.

Características de la aversión al sabor

Un único emparejamiento entre EC y EI puede provocar la aversión (eso también puede suceder con el
aprendizaje del miedo). Sin embargo se necesitan más emparejamientos en el condicionamiento palpebral, el
condicionamiento salival o el seguimiento del signo.
Se produce aversión aunque la enfermedad se presente horas después de haber
comido. Es lo que se conoce como “Aprendizaje demorado”.

Procedimientos típicos de condicionamiento pavloviano

Es muy importante la ordenación temporal del estímulo condicionado y el estímulo


incondicionado.

Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio del siguiente.
Intervalo entre estímulos: Tiempo entre el EC y el IE.

Para que haya respuesta de condicionamiento, el intervalo entre estímulos debe ser mucho menor que el
intervalo entre ensayos.

5 procedimientos comunes de condicionamiento clásico


Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que haya finalizado, se
presenta el EI.
Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el
EI. Al intervalo entre ambos se le llama intervalo de huella.
Condicionamiento de demora larga: Como el de demora corta pero el EC dura mucho más tiempo.
Entonces se presenta el EI antes de que EC acabe.
Condicionamiento simultáneo: EC y EI se presentan a la vez.
Condicionamiento hacia atrás: Al revés que todos los anteriores. Se presenta el EI y luego el EC.
Medida de las respuestas condicionadas

Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la respuesta
condicionada en ausencia de la respuesta incondicionada. Son fundamentales en para evaluar el
aprendizaje en el condicionamiento simultáneo y hacia atrás.

Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta condicionada.
Muy relacionada con la probabilidad (cómo de probable es que el EC de una respuesta condicionada)

Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta
condicionada.

Procedimientos de control en el condicionamiento clásico

En los primeros capítulos veíamos que los procedimientos de control de la habituación y la sensibilización
eran muy simples ya que únicamente consistían en la ausencia de exposición al estímulo.

.
Pseudocondicionamiento: Casos en los que la mera exposición al Estímulo Incondicionado
da lugar a respuestas similares a la respuesta condicionada.

Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento clásico


(asociación entre EC y EI) son necesarios los procedimientos de control.

Control aleatorio: Procedimiento en el que los estímulos condicionado e incondicionado se presentan en


momento aleatorios uno con respecto a otro. Sin embargo este tipo de control puede dar lugar a
aprendizaje asociativo.

Control desemparejado explícito: EC y EI se presentan lo suficientemente separados para evitar que se


asocien.

Eficacia de los procedimientos típicos de condicionamiento

Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja anterior daba más
muestras de aprendizaje. Para ello lo primero que hay que tener en cuenta es el intervalo entre
estímulos o intervalo EC-EI.

Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que el intervalo EC-EI es 0.


Demora corta: facilita la respuesta condicionada
Demora larga: Disminuye la respuesta condicionada
De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto más separados están
EC y EI, se produce menos condicionamiento.
Hacia atrás: Ofrece resultados ambiguos. Se ha observado condicionamiento excitatorio o inhibitorio.

El condicionamiento es más efectivo cuando el EC es una buena señal de que el EI


aparecerá pronto.
- Se produce mejor condicionamiento cuando el intervalo EC-EI es corto.

Hipótesis de codificación temporal: El sujeto no sólo aprende a relacionar EC y EI, sino que dependiendo
del procedimiento utilizado (de los 5 que hemos visto) también aprenderá cúando en el tiempo va a ocurrir

CONDICIONAMIENTO PAVLOVIANO INHIBITORIO

Este tipo de condicionamiento pretende predecir la ausencia del estímulo incondicionado.

Estímulos condicionados inhibitorios: Señales que predicen la ausencia de un estímulo aversivo.

Procedimientos de condicionamiento inhibitorio

El condicionamiento excitatorio puede proceder sin condiciones previas especiales, sin embargo para que se
dé el condicionamiento inhibitorio hay un requisito importante: el EI debe ocurrir periódicamente en la
situación.

Procedimiento estándar de inhibición condicionada Este procedimiento consta de dos ensayos diferentes

que se intercalan.

Ensayo A (condicionamiento excitatorio)

Tenemos un EC+ y un EI. Es un ensayo de tipo excitatorio como los que vimos al principio. El Estímulo
incondicionado ocurre inmediatamente después del estímulo condicionado y de esta manera quedan
asociados.
Ensayo B (condicionamiento inhibitorio)

A diferencia del ensayo A, aquí no se presenta el EI. Tan sólo tenemos un EC+ y un EC- que se presentará
en el contexto excitatorio proporcionado por el EC+. Pero no se empareja con el EI. Por lo tanto
decimos que el EC- es un inhibidor condicionado.

Contingencia o correlación negativa entre el EC y el EI

Una contingencia o correlación negativa indica que el EI es menos probable tras el EC que en otro
momento. En el gráfico podemos observar que la presencia de EC predice la ausencia del EI durante
un tiempo.

En este tipo de procedimiento, el EI aversivo puede aparecer de vez en cuando tras el EC, pero con una
probabilidad pequeña.

Medición de la inhibición condicionada

La inhibición condicionada produce cambios en la conducta observable, pero ¿Cómo podemos observar
estos cambios?

A) Sistemas de respuestas bidireccionales

Se puede medir fácilmente en aquellos sistemas que tengan una línea base. El ritmo cardiaco o la
respiración nos permite saber si sus valores suben o bajan, o un animal que se acerca o se aleja de un
estímulo.

En estos casos la excitación condicionada da lugar a un cambio conductual en una dirección y la


inhibición condicionada la lugar a un cambio en la dirección opuesta.
Limitaciones
Sólo funciona con respuestas que pueden ir en direcciones opuestas.
Sólo muestra el efecto neto (resultado) entre la excitación y la inhibición.

B) La prueba del estímulo compuesto o sumación

Volviendo al ejemplo del conejo y el parpadeo: Si hemos condicionado un estímulo para inhibir la
respuesta de parpadeo, obviamente no lo veremos parpadear, entonces ¿cómo podemos medir la eficacia que
tiene nuestro estímulo inhibidor?

Mediante la “Prueba de sumación o del estímulo compuesto”

La prueba de sumación implica la presentación de dos estímulos, un EC+ y un EC- juntos. La idea es
que cada estímulo produce su propia reacción asociativa (excitación e inhibición) y que cada reacción
se suma de forma algebraica. Puesto que son procesos antagónicos, la asociación inhibitoria suprime la
excitatoria. Este efecto se cuantifica midiendo la fuerza del estímulo condicionado excitatorio (EC+) sin
emparejar, evaluándolo de nuevo en combinación con el estímulo condicionado inhibitorio (EC-), y
calculando después la diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de la
reacción excitatoria en ambos casos. Sin embargo, si el estímulo condicionado inhibitorio es fuerte
(produce RC inhibitoria), se observa una disminución del nivel de excitación del EC+ al presentar los
estímulos simultáneamente

C) La prueba del retraso en la adquisición

Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser especialmente difícil de
condicionar ese estímulo para que provoque la conducta. Es decir, la velocidad de adquisición de una
respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado.
PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO

Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una demora corta entre
el EC y el EI.

Un área de investigación importante es cómo las personas llegan a considerar que un evento es la
causa de otro. Hay una gran concordancia en los resultados de los experimentos sobre juicios de
causalidad y los de condicionamiento pavloviano. Por lo tanto los mecanismos asociativos de Pavlov
pueden tener un papel importante en nuestras vidas

Algunos ámbitos de la vida en los que se desarrolla el condicionamiento de Pavlov:

- Aversiones y preferencias alimenticias


- Adquisición de miedos.
- Tolerancia y adicción a las drogas
- Respuestas de los niños y de las madres durante la lactancia
- Situaciones sexuales
CAPITULO 4:
CONDICIONAMIENTO CLÁSICO –MECANISMOS

Respuestas iniciales a los estímulos

Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad de hacerlo


como resultado del desarrollo de una asociación con el

Sin embargo la identificación de EC y EI es relativa ya que un evento puede servir de EC respecto a un


estímulo y de EI respecto a otro.

La novedad de los estímulos condicionados e incondicionados

Cuando los estímulos son novedosos, el aprendizaje se desarrolla más rápido.

A la hora de experimentar sobre la novedad o familiaridad de los estímulos, se realiza en dos fases:

a) Se expone repetidamente a los sujetos al estímulo que luego será EC. b) EC se empareja con un EI

Sin embargo se observa que la familiaridad que el sujeto tiene con EC hace que el emparejamiento con
el estímulo incondicionado sea más lento. Este fenómeno se denomina efecto de preexposición al EC o
efecto de Inhibición latente.

La Habituación sirve para sesgar la conducta elicitada a favor de los estímulos novedosos.

La Inhibición latente sirve para sesgar el aprendizaje a favor de los estímulos novedosos. Es la habilidad de
inconscientemente ignorar los estímulos que son percibidos como irrelevantes para lo que uno necesita.
Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba familiarizado con
el estímulo incondicionado tardará más en relacionarlo con el EC. Esto recibe el nombre de Efecto de
preexposición al EI.

2 Mecanismos para explicar los dos efectos de preexposición

Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos estímulos para


participar en nuevas asociaciones.
Interferencia de memoria: Los participantes recuerdan que en la fase “a” el estímulo se les presentada
aislado y este recuerdo altera la respuesta condicionada.

Intensidad y saliencia del EC y del EI

La intesidad de los estímulos es una variable importante que recibe el nombre de saliencia del estímulo. El
aprendizaje se llevará a cabo de manera más rápida cuanto mayor sea la saliencia del estímulo.

Relevancia o pertinencia EC – EI

Es otra variable que afecta a la velocidad de aprendizaje del condicionamiento clásico La relevancia es el
grado en el que el EC es relevante con respecto al EI. En un ambiente natural, es normal que las ratas
enfermen tras tomar un alimento en mal estado. También es normal que sufran algún daño tras ser
perseguidas por un animal al que pueden oir.

Recuadro 4.1 Aproximaciones conductuales al control del tabaquismo


Destacar que las técnicas más efectivas para dejar de fumar son aquellas en las que el estímulo aversivo es
“relevante” en relación a la situación.

El concepto de fuerza biológica

La fuerza biológica es la fuerza que tiene cada estímulo (EC y EI) ante nosotros por naturaleza.
Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológica menor que el
estímulo incondicionado.

Condicionamiento de orden superior

Situación:

a) Un tono se empareja fuertemente con la comida.


b) La sola presencia del tono produce salivación. (condicionamiento de 1er orden)
c) Empezamos a emparejar el tono (que produce salivación) con una luz
d) Al final la sola presencia de la luz producirá salivación (condicionamiento de 2º orden)

Nomenclaturas para no liarnos

EC1 (también EC+) =Es el primer estímulo condicionado, osea, el tono


EC2 (también EC-) = Es el segundo estímulo condicionado, osea la luz.

Recuadro 4.2 Condicionamiento de orden superior del miedo


Los miedos irracionales suelen desarrollarse por medio del condicionamiento de orden superior. Se explica
el ejemplo de una mujer con miedo a las multitudes cuyo miedo se extendió a otros estímulos en principio
inocuos, como ir al cine.

Contracondicionamiento

Dos estímulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente
respuestas intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese
estímulo con un EI que provoca una reacción opuesta.

Precondicionamiento sensorial

Se pueden aprender asociaciones entre estímulos que tan sólo elicitan una breve respuesta de
orientación antes del condicionamiento.

El modelo de sustitución del estímulo

EI como factor determinante de la RC

Aquí habla de que la forma de la respuesta condicionada va a tener algo de relación con que tipo de EI
haya.

Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo

La homeostasis se refiere a los mecanismos fisiológicos que mantiene los aspectos críticos del cuerpo
dentro de los límites aceptables. Cualquier amenaza a nivel homeostático pone en marcha una reacción
compensatoria que neutraliza la alteración. Esta reacción funciona por procesos de retroalimentación
negativa (Walter Cannon). Dworkin señaló que las alteraciones en la homeostasis pueden compensarse más
efectivamente si pueden anticiparse. Esto recibe el nombre de respuesta homeostática condicionada.
Las drogas suelen provocar alteraciones fisiológicas de la homeostasis que activan reacciones
compensatorias condicionadas. Las claves que se asocian a esta alteración pueden elicitar estas
reacciones compensatorias como respuestas condicionadas anticipatorias.

A) Proceso normal=Drogas - Alteración homeostasis – reacciones compensatorias condicionadas


B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogas- alteración homeostasis)
– reacciones compensatorias condicionadas – respuestas condicionadas anticipatorias.

El modelo de condicionamiento de tolerancia a las drogas

Siempre se ha considerado que la tolerancia a las drogas se debía a procesos farmacológicos,


sin embargo Shepard Siegel encuentra otra explicación basada en el condicionamiento clásico… La
explicación se basa en el concepto de homeostasis aprendida.

Tomamos droga y se producen unos cambios fisiológicos en nuestro organismo (son el EI). Entonces se
ponen en marcha unos ajustes para compensar esos cambios, son la respuesta incondicionada (RI).
Mediante el condicionamiento pavloviano o clásico, los estímulos que acompañan a la administración
de droga se asocian con el EI. Estos estímulos condicionados pueden ser la hora del día, o el lugar donde se
consume droga habitualmente.

el EC como determinante de la forma de la RC


Conducta condicionada y sistemas de conducta

Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios
estímulos y respuestas relevantes, dispuestos con determinado orden espacial y/o secuencial.

Esta teoría asume que la presentación de un EI activa el sistema de conducta (formado por uno o varios EC)
para ese EI.

La forma de la RC depende del intervalo EC-EI que se utilice. La razón es que el intervalo EC-EI
determinará el lugar en el que se incorporará el EC dentro de la secuencia de respuestas del sistema
de conducta. El EC no sustituye ni compensa al EI. En lugar de eso, sustituye a un estímulo en un
punto del sistema de conducta determinado por el intervalo EC-EI.

Aprendizaje E-R frente a aprendizaje E-E

Aprendizaje E-R: Este aprendizaje establece una nueva conexión Entre el EC y la RC

Aprendizaje E-E: Es una visión más moderna, en la que los individuos aprenden una asociación entre
el EC y el EI. Los sujetos responden al EC, no porque éste elicite directamente la RC sino porque el EC
hace que el sujeto piense en EI.

Mediante la técnica de la devaluación del EI, que consiste en la reducción del atractivo de un estímulo
incondicionado, normalmente obtenida mediante la aversión o la saciedad.

El efecto de bloqueo

Si tenemos dos estímulo A y B y emparejamos fuertemente el estímulo A con un EI, provocando


una respuesta condicionada intensa, y luego presentamos los dos estímulos (A y B) conjuntamente junto
al EI, se observa que el condicionamiento de A no se extiende a B.

¿Porqué la presencia del estímulo A previamente condicionado bloquea la adquisición de la


respuesta a B?
Kamin señala que el EI debe ser sorprendente. Es decir si el EI va señalado por un estímulo
previamente condicionado (A), no sorprenderá al sujeto y, por tanto no funcionará bien a la hora de
condicionar al estímulo añadido (B).

Recuadro 4.3 El problema dibujo-palabra en la enseñanza de la lectura: Una forma de bloqueo. El


aprendizaje de la lectura mediante la presentación de palabras y dibujos puede producir procesos
similares al bloqueo. Por esta razón hay que utilizar estos métodos con precaución ya que pueden
dificultar el aprendizaje en lugar de facilitarlo.

El modelo de Rescorla y Wagner

Se trata de un modelo matemático que explica porqué la efectividad de un EI está determinada por
el grado en que resulta sorprendente.

Pueden haber:

- EI inesperadamente grandes: Son la base del condicionamiento excitatorio


- EI inesperadamente pequeños: Son la base del condicionamiento inhibitorio

ΔV = k( λ - V )

λ : Asíntota de aprendizaje
V: Valor asociativo de los estímulos que preceden al EI
k: Constante relacionada con la saliencia del EC y del EI
ΔV: Cambio en el valor asociativo de un estímulo

Aplicación al efecto de bloqueo

Final de la primera fase: VA = λ


Segunda fase: No hay condicionamiento del estímulo B en la fase 2, ya que el EI es predecible por
la presencia del estímulo A:

EI = (λ-VA+B) = 0

Pérdida del valor asociativo a pesar de los emparejamientos con el EI

El modelo Rescola-Wagner predice que los estímulos perderán valor asociativo si se presentan juntos
en un ensayo de condicionamiento después de haber sido entrenados por separado.

Fase 1
Asociamos el estímulo A con una bolita de comida (EI)
Paralelamente asociamos el estímulo B con la misma bolita de comida (EI)

Ambos estímulos se han condicionado perfectamente, de manera que predicen perfectamente el


EI de una bolita de comida, es decir, VA = VB = λ

Fase 2
Presentamos ambos estímulos conjuntos (A y B) con la bolita de comida (EI)

Porque la expectativa basada en los estímulos individuales son 2 bolitas de comida y sin embargo se le
presenta 1 única bolita. Por lo tanto existe una discrepancia entre lo que se espera (2 bolitas) y lo que se
presenta (1 bolita). Los participantes encuentran que el EI es sorprendentemente pequeño, por lo tanto para
ajustar la expectativa a lo que realmente ocurre, A y B perderán valor.
Inhibición condicionada

La inhibición condicionada consta de dos tipos de ensayos:

Ensayos reforzados: Se presenta el EI


Ensayos no reforzados: Se omite el EI

Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias.

Por el contrario, en los ensayos no reforzados, el EI no ocurre Se trata de un caso de expectativa


excesiva.

Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores asociativos de EC+ y
EC- tienen que sumar cero.

Extinción de la excitación y la inhibición Excitación:


En este procedimiento, el estímulo condicionado se presenta repetidamente con el EI.
Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta solo el EC
habrá un exceso de expectativa a que también se presente el EI. Conforme se siga presentado el EC solo,
la expectativa de que aparezca EI se va acercando a 0.

Inhibición:
Es un poco lo contrario que el caso anterior. Aquí el EC- comienza con un valor asociativo negativo que se
considera una predicción excesivamente baja del EI. Para ajustarse a las expectativas, el valor asociativo
negativo del EC- se va perdiendo hasta llegar a 0.

Problemas del modelo de Rescorla y Wagner

1º Problema: Su análisis de la extinción de la inhibición condicionada es incorrecto


El modelo predice que la presentación repetida de un inhibidor condicionado (EC-) sin el EI debería dar
lugar a una pérdida de la inhibición condicionada, pero esto no sucede.

2º Problema: El modelo considera la excitación como lo opuesto a la extinción. Y no debe verse así.

3º Problema: El modelo solo permite que los EC tengan un único valor asociativo (EC+ o
EC-) sin embargo se ha descubierto que en ciertas condiciones puede tener ambos.

4º Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas
de aversión al sabor y el olor. Concretamente tiene problemas para explicar el efecto de aumento o
contrabloqueo. (el estímulo previamente condicionado aumenta el condicionamiento del EC añadido)

Otros modelos de condicionamiento clásico

Modelos atencionales de condicionamiento

Para que el condicionamiento tenga lugar, los sujetos deben prestar atención al EC.

Se asume que el grado de atención que un animal presta al EC en un ensayo determinado depende
del grado en el que el EI haya sido sorprendente en el ensayo anterior.

La sorpresividad del EI en un ensayo determinado altera el grado de atención dedicado al EC en los


ensayos siguientes. Por lo tanto la sorpresividad del EI tiene sólo un efecto prospectivo o proactivo sobre
la atención y el condicionamiento

Factores temporales y respuesta condicionada


Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el condicionamiento. Sin
embargo el intervalo EC-EI es una variable temporal importante ya que los intervalos EC-EI más
largos producen menos respuestas.

Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una mayor respuesta
condicionada cuando se utilizan procedimientos en los que los ensayos están más separados entre sí.

Existen distintas interpretaciones sobre porqué la respuesta condicionada está tan fuertemente
determinada por la razón IEE/DE. Vamos a ver dos hipótesis a continuación.

Hipótesis del tiempo de espera relativo

Un EC proporciona información acerca de la aparición del EI, sólo si el sujeto tiene que pasar menos
tiempo esperando al EI tras la presentación del EC que cuando está simplemente expuesto al contexto
experimental.

-Razón IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparición EI
-Razón IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparición EI

Hipótesis del comparador

La respuesta condicionada depende no sólo de la asociación entre el EC y el EI, sino también de todas
las posibles asociaciones que puedan establecerse entre las claves contextuales y el EI.

Se compara el “peso” o valor del EC crítico frente al valor excitatorio de las claves contextuales.

A diferencia de la hipótesis del tiempo de espera relativo, la hipótesis del comparador se centra más en
las asociaciones que se puedan producir.
Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo

1ª asociación: Une el EC crítico (X) con el EI.


2ª asociación: Une el EC crítico con las claves contextuales de comparación
3ª asociación: Une los estímulos de comparación y el EI

La hipótesis del comparador no indica cómo se establecen las asociaciones, se trata de una teoría de
ejecución, no de aprendizaje.
La comparación entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el
momento de la prueba.
También se ha probado esta hipótesis en estudios sobre inhibición condicionada.
Atribuye la inhibición condicionada a situaciones en las que la asociación del EC crítico con el EI es
más débil que la asociación de las claves contextuales con el EI.
Es la única hipótesis que predice que la extinción de la inhibición condicionada se puede lograr no
presentando el EC- de forma aislada, sino extinguiendo las claves que sirven de EC+ y que
proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-.
El modelo predice también que incrementar el valor excitatorio de las claves contextuales tras el
tratamiento reducirá la respuesta condicionada del EC crítico.
Otra contribución ha sido suponer que las diferencias en la respuesta condicionada
pueden reflejar diferencias en la ejecución más que en el aprendizaje.

Visión general de las alternativas teóricas

Hipótesis del tiempo: Se centra en la distribución temporal


Hipótesis del comparador: Es una teoría de la ejecución más que del aprendizaje
Modelos atencionales: Se parece más a Rescorla-Wagner pero también comparte sus limitaciones.

Sin embargo ninguna de estas 3 tuvo tanta fama en el condicionamiento clásico como el modelo
Rescorla-Wagner en los setenta.

A diferencia de los capítulos anteriores, en este tema los estímulos a los que un organismo se
enfrenta son resultado de su conducta. Es lo que se conoce como “conducta dirigida a una meta”.

Un estudiante estudiará para obtener mejores notas. Este tipo de conducta se utiliza porque ha
servido previamente como instrumento para conseguir lo mismo y recibe el nombre de “conducta
instrumental”.
CAPITULO 5

CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS

A) PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL

Comienzan con Thorndike. Su intención original era estudiar la inteligencia animal.

Los resultados son obvios, con la repetición elanimal cada vez tarda menos tiempo en repetir la
acción que abre la caja. Sin embargo hay que hacer una puntualización, Thorndike no explicaba que
los animales compredieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como
una asociación estímulo-respuesta. Ley del efecto: Si una respuesta en presencia de un estímulo es seguida
por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la
respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica
un aprendizaje E-R.

B) APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO


INSTRUMENTAL

Procedimientos de ensayo discreto

Normalmente se llevan a cabo en laberintos

W.S. Small (1899-1900) creó laberintos para estudiar la conducta de las ratas. Uno tenía forma de T
(para estudiar la conducta de elección )y otro era simplemente alargado con forma de I

Con los laberintos se puede medir la velocidad de la carrera y el tiempo de latencia

Procedimientos de operante libre

Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones..
Skinner quería obtener una respuesta más natural en los experimentos. La observación informal sugiere
que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto
de operante como la forma de dividir la conducta en unidades medibles con significado.

Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida. Cuando
la rata aprieta la palanca cae comida.

La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El
operante de presión de la palanca se define como una presión hacia abajo suficiente para que cause el cierre
del microinterruptor.

Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del


signo mediante un sonido (condicionamiento clásico) para que el animal se dirija al comedero. (esto es el
entrenamiento al comedero). Tras este entrenamiento el animal está preparado para aprender la
respuesta instrumental. Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente
NUNCA sucederá por si misma la respuesta que produce el reforzador. Es decir, para empezar le
daremos comida a la rata cada vez que se levanta sobre sus dos patas de forma natural. Cuando hemos
conseguido la respuesta de alzamiento entonces daremos un paso más y le daremos la comida SOLO SI
realiza la respuesta de alzamiento sobre la palanca. Poco a poco vamos produciendo un moldeamiento hasta
conseguir la respuesta buscada.
Esta dos fases que hemos visto del modeamiento son: “reforzamiento de aproximaciones sucesivas” y “no
reforzamiento de las formas de respuesta tempranas

Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata está formada por un
conjunto de respuestas preexistentes . Es decir, se le enseña una nueva combinación de respuestas
familiares en una nueva actividad.
Es importante señalar que el moldeamiento aprovecha la variabilidad inherente de la conducta. Es
decir, se puede variar la conducta en una dirección u otra.
Con el mismo experimento se obtenían resultados que explicaban que el moldeamiento puede producir
nuevas formas de respuesta nunca antes realizadas por el organismo.
La tasa de respuesta como medida de la conducta operante Los experimentos con operante libre
permiten una observación continua durante largos periodos Skinner propuso la “tasa de ocurrencia”
(frecuencia de la respuesta por minuto) como medida de la probabilidad de una respuesta. Las respuestas
más probables ocurren con frecuencia y muestran una tasa alta.

Estimulo apetitivo: Una consecuencia placentera.


Estímulo aversivo: Una consecuencia molesta.
Contingencia positiva: La respuesta instrumental proporciona el estímulo (un chico corta el césped y
recibe dinero)
Contingencia negativa: La respuesta instrumental evita el estímulo (cierro la ventana y no entra
lluvia)
Reforzamiento positivo: La respuesta instrumental produce un estímulo apetitivo. Por lo tanto existe
contingencia positiva entre la respuesta y el estímulo.

Castigo: La respuesta instrumental produce un estímulo aversivo. Reforzamiento negativo: Se trata


de un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estímulo
aversivo. Hay dos tipos de reforzamiento negativo:

A) Escape: Se presenta el estímulo aversivo pero puede ser eliminado por la respuesta
instrumental.
B) Evitación: Implica la programación de un estímulo aversivo para ser presentado en algún momento del
futuro.

Entrenamiento de omisión: La respuesta instrumental previene la presentación de un estímulo


apetitivo.. El entrenamiento de omisión también recibe el nombre de “reforzamiento diferencial de otras
conductas” o RDO. El RDO refleja el hecho de que el individuo recibe un estímulo apetitivo
periódicamente a condición de que se dedique a realizar otra conducta diferente a la anterior.

Aunque ya lo he señalado antes, pero repito la importancia del cuado de la página 134 para evitar
confusiones con estos términos

El condicionamiento instrumental consta de 3 elementos claves:

Una respuesta
Una consecuencia (el reforzador)
Relación (o contingencia) entre la respuesta y la consecuencia
La respuesta instrumental

Variabilidad conductual versus estereotipia

Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de


que la respuesta instrumental se repita en el futuro. Es decir, repeticiones de la misma respuesta. Sin
embargo esto no significa que el condicionamiento instrumental no pueda producir también respuestas
creativas o variables. Los organismos pueden aprender a obtener reforzamiento en una situación donde
se requiere hacer algo nuevo. Por lo tanto la variabilidad de la respuesta puede ser la base para el
reforzamiento instrumental.

La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento.


En ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con
un condicionamiento instrumental continuado.

Relevancia o pertinencia en el condicionamiento instrumental

En el condicionamiento instrumental ocurre algo parecido, Con esto se explica el concepto de pertinencia.

Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hroa de entrenar
animales para realizar exhibiciones en circos. Observaron que los animales realizaban conductas
relacionadas con su forma de alimentación en lugar de reproducir la conducta buscada por los educadores.

Sistemas de conducta y limitaciones en el condicionamiento instrumental

De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se
encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa y se
dedica a otras actividades relacionadas con la comida. De acuerdo con la aproximación de los
sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementarán con un
reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de
alimentación está activado en ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se
entiende con el siguiente ejemplo:

El reforzador instrumental

Cantidad y naturaleza del reforzador

Las dos características están muy relacionadas. Tener un reforzador más grande o más sabroso
provocará respuestas más intensas en los sujetos.

Cambios en la naturaleza y cantidad del reforzador

Si el EI es mayor de lo esperado, producirá condicionamiento excitatorio. Si por el contrario el EI es


menor de lo esperado, producirá condicionamiento inhibitorio.

Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una
experiencia anterior con una consecuencia menos atractiva.

Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una
experiencia anterior con una consecuencia mejor.

Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento
y sólo un cambio en la magnitud de la recompensa para los grupos de cambio

Contraste conductual simultáneo: Efectos de contraste conductual (contraste positivo y negativo) que
están producidos por frecuentes cambios entre una condición de recompensa favorable y una
desfavorable, con cada condición de recompensa asociada a su propio estímulo distintivo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está
determinada en parte por las experiencias del organismo con reforzadores en otras situaciones.

La relación respuesta-reforzador
En algunos casos hay una fuerte relación entre lo que una persona hace y la consecuencia que sigue, en otros
casos no hay ninguna relación y en otros casos la relación puede ser probabilística. Un organismo debe
organizar su tiempo para enfrentarse a varios retos y debe hacerlo de manera que lleve a cabo el mejor
uso de su tiempo y energía.

2 tipos de relaciones entre una respuesta y un reforzador

a) Relación temporal Tiempo que transcurre entre la respuesta y el reforzador. En la “Contigüidad


temporal” el reforzador se entrega inmediatamente después de la respuesta.
b) Relación causal: Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente
para la ocurrencia del reforzador.

Efectos de la contigüidad temporal

El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente después


de la ocurrencia de la respuesta instrumental facilita el aprendizaje. Hay varios factores que
explican porqué el condicionamiento instrumental es tan sensible a la demora del reforzamiento:

Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la que ha producido el
reforzador.

Para resolver este problema se entrega un reforzador condicionado o secundario


inmediatamente después de la respuesta instrumental y que ha sido asociado previamente con el
reforzador.

Otra manera de resolver el problema es mediante un “procedimiento de marcado” de la


respuesta instrumental correcta.

La contingencia respuesta-reforzador

Aunque la relación causal sea perfecta, el condicionamiento no ocurrirá si el reforzamiento es


demorado durante demasiado tiempo.

El experimento de superstición de Skinner

Skinner denominó a esto conducta supersticiosa. .

Skinner explica esta conducta mediante la idea del reforzamiento accidental o adventicio que se
refiere al emparejamiento accidental de una respuesta con la entrega del reforzador. Este experimento
sugería que una contingencia positiva respuesta- reforzador no es necesaria para el condicionamiento
instrumental.

Reinterpretación del experimento de superstición: Staddon y Simmelhag profundizaron un poco más en el


experimento de Skinner y dieron nombre a las conductas de las palomas. Denominaron respuestas
terminales a las que se daban al final del intervalo comida- comida y respuestas de interín a las que se
daban en medio del intervalo. Las Palomas solían coincidir en el tipo de respuestas terminales y en el tipo de
respuestas interín. Por lo tanto hay algo de contingencia entre el tipo de respuestas y el reforzador

Explicación de la periodicidad de las respuestas de interín y terminales: Staddon y Simmelhag


sugirieron que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación
de comida a medida que el tiempo se encuentra más cerca de la próxima presentación de comida. En
contraste, las respuestas interín son una manifestación de otras fuentes de motivación que eran más
importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable
El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal
tras la última aparición de comida:

a) – Búsqueda focalizada poscomida (cerca del cuenco)


b) – Búsqueda general (lejos del cuenco)
c) - Búsqueda focalizada (cerca del cuenco otra vez)

Efectos de la controlabilidad de los reforzadores

Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta
instrumental. Un hallazgo importante en experimentos con perros fue que la exposición a una
descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de
indefensión aprendida.
1. El diseño triádico:
Los experimentos de indefensión aprendida se realizan utilizando el diseño triádico. Contiene 2 fases:

a) Exposición

Grupo de ratas E: Expuesto a descargas periódicas de las que pueden escapar.


Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas
descargas pero no pueden escapar de ellas.
Grupo C: No recibe descargas pero está confinado en el aparato tanto tiempo como los otros.

b) Condicionamiento

Los 3 grupos reciben entrenamiento de escape – evitación

Resultados: La exposición a una descarga incontrolable (Grupo A) produce peores resultados en el


aprendizaje escape-evitación que el resto de los grupos. La diferencia en la tasa de aprendizaje entre los
grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador.

2. Hipótesis de la indefensión aprendida: Esta hipótesis asume que durante la exposición a descargas
incontrolables, los animales aprenden que las descargas son independientes de su conducta, no pueden
hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de control sobre la situación hace
que descienda la motivación de los sujetos para realizar una respuesta instrumental. .

3. Deficit de actividad: Las ratas del Grupo A aprendían a ser inactivas en respuesta a la descarga durante la
fase de exposición.

4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atención a sus
acciones

5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la conducta de


escape es que la respuesta instrumental tiene como consecuencia la terminación del estímulo aversivo.
Además, la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta.
Hay dos:

Claves de retroalimentación de la terminación de la descarga.


Claves de retroalimentación de la señal de seguridad.

Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo
elicitado por las claves contextuales de la cámara experimental. Hay mayor probabilidad que las claves
contextuales de la cámara en la que se administran las descargas queden condicionadas para elicitar
miedo cuando las descargas son inescapables.
CAPITULO 6:
PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

En el mundo real la contingencia perfecta entre la respuesta y el reforzamiento es rara.

Programa de reforzamiento: Programa o regla que determina la forma en que se relacionan las
presentaciones del reforzador con las ocurrencias de la respuesta instrumental. La entrega del
reforzador puede depender de varios factores, número de respuestas, paso del tiempo, etc.

Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten una
observación continua de la conducta, por lo que pueden observarse y analizarse los cambios en la tasa
de respuesta. Proporcionan más información sobre los factores que controlan el mantenimiento de la
conducta.

A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE

Son programas en los que un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza.

Programas de razón

El reforzamiento depende del número de respuestas.

Reforzamiento continuo: Una sóla respuesta provoca la entrega del reforzador.

Reforzamiento parcial o intermitente: La respuesta se refuerza sólo alguna vez.

Razón fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante
RF5, RF10, etc.

Registro acumulativo de la conducta: Es una forma especial de representar la forma de repetirse una
respuesta a lo largo del tiempo. Se utilizaba sobre todo antes de la existencia de los ordenadores. La
pendiente de la línea trazada representa la tasa de respuesta.

Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo después del reforzamiento.

Carrera de la razón: La tasa de respuesta alta y estable que completa cada requerimiento de la razón.

¿Qué ocurre cuando el requerimiento de la razón se incrementa un poco?

Con mayores requerimientos de la tasa, tienen a ocurrir pausas posreforzamiento más largas.
Si el incremento es muy grande (de RF120 a RF500), es probable que el animal realice una pausa
periódica cada vez que complete la razón requerida. Es lo que se conoce como tensión de razón.

Razón variable: Número de respuestas distinto para la entrega del reforzador.

Las pausas predecibles en la tasa de respuesta son menos probables con los programas de razón variable
que con los programas de razón fija. Los organismos suelen responder a una tasa claramente estable en los
programas de RV.

Programas de intervalo

Cuando ocurre cierta cantidad de tiempo desde la última entrega del reforzador.
Intervalo fijo (IF): El tiempo no varía de una ocasión a la siguiente.

Festón del intervalo fijo: A medida que el tiempo para la disponibilidad del próximo reforzador se
acerca, la tasa de respuesta aumenta. Este aumento en la tasa de respuesta se manifiesta como una
aceleración en el registro acumulativo hacia el final del IF.

Intervalo variable (IV): El tiempo varía de una ocasión a la siguiente.


Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas regulares.

Programas de intervalo y espera limitada: En la espera limitada el reforzador está disponible durante un
tiempo X, si pasado ese tiempo el sujeto no ha dado el número de respuestas necesario, el reforzador deja
de estar disponible.

Comparación de los programas de razón y de intervalo

Similitudes

Razón fija e intervalo fijo:


- Producen una pausa posreforzamiento después de la administración de cada reforzador.
- Producen altas tasas de respuesta antes de la administración del siguiente reforzador.

Razón variable e intervalo variable:


Mantienen tasas estables de respuesta, sin pausas predecibles.

Diferencias

Activan diferentes cambios neuroquímicos en el cerebro


Los programas de intervalo están relacionados con el sentido temporal del organismo.

Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y la siguiente se
denomina tiempo interrespuesta o TIR. Un sujeto que produce TIR cortos responderá a una tasa alta y si
produce TIR largos, su tasa será baja.

Un programa de razón favorece los TIR cortos Por el contrario, un programa de intervalo favorece los
TIR largos.

Programas de reforzamiento de tasas de respuesta

Los programas de tasas de respuesta requieren específicamente que el organismo responda a una
tasa particular para obtener el reforzador. Esto recibe el nombre de Reforzamiento diferencial de tasas altas,
o RDA.

Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza sólo si ocurre antes de
que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas
fomentan que los sujetos respondan rápidamente.

Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza sólo si ocurre después de
que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas fomentan que
los sujetos respondan lentamente

B) CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES

Medidas de la conducta de elección


Tasa relativa de respuesta de cada alternativa: La tasa relativa de respuesta en la tecla A se calcula
dividiendo la tasa de respuesta en la tecla A por la tasa total de respuesta (suma de la tasa A + la tasa B)

Tasa relativa de respuesta (A) = RA/ (RA+RB)

Si la paloma picotea igualmente en las dos teclas de respuesta, la razón será 0,5.
Si la tasa de respuesta es mayor en A que en B, la razón será mayor que 0,5.
Si la tasa de respuesta es menor en A que en B, la razón será menor que 0,5.

La forma en que un organismo distribuye su conducta entre las dos alternativas de respuesta está
muy influida por el programa de reforzamiento que funciona para cada respuesta.

Tasa relativa de reforzamiento: Es la frecuencia con la que el individuo obtiene recompensas en


cada lado. Se calcula de igual manera a la tasa relativa de respuesta.

Tasa relativa de reforzamiento (A) = rA/ (rA+rB)

La ley de igualación (de Herrnstein)

En el punto anterior (medidas de la conducta de elección) en los ejemplos se utilizaba el mismo


programa de reforzamiento (IV 60 seg) para las dos teclas. Por lo tanto la tasa relativa de respuesta y
la tasa relativa de reforzamiento daba 0,5 ya que los programas eran iguales…

A pesar de lo que hablábamos de la ley de igualación, las tasas relativas de respuesta no siempre se igualan
con exactamente con las tasas relativas de reforzamiento.

La ley de la igualación y el valor del reforzador: La tasa relativa de respuesta es una función de la
cantidad relativa de cada reforzador, de la demora y de la palatabilidad. Cuanto mayores, más
sabrosos y más inmediatos sean los reforzadores, serán de mayor valor.

La ley de la igualación y los programas simples de reforzamiento: Incluso las situaciones de


respuesta única pueden involucrar una elección entre realizar la respuesta especificada (picotear o presionar
una palanca) u ocuparse de otras actividades (caminar, acicalarse, etc)

Según esto, la ley de la igualación quedaría así:

RA / (RA+RO) = rA / (rA+rO)

Mecanismos de la ley de la igualación

3 mecanismos:

1. Maximización molecular
2. Maximización molar
3. Mejoramiento

Igualación y maximización de las tasas de reforzamiento: Los organismos distribuyen sus acciones entre
las alternativas de respuesta para recibir la máxima cantidad posible de reforzadores en cada situación.

1. Maximización molecular: Los organismos siempre eligen cualquier alternativa de respuesta con
mejores probabilidades de que sea reforzada en ese momento.
2. Maximización molar: El organismo distribuye sus respuestas entre las varias alternativas a fin
de maximizar la cantidad de reforzamiento que consiguen a la larga.
Sin embargo la maximización molar encuentra problemas a la hora de explicar la conducta de
elección en programas de intervalo (IV-IV) y para programas razón-intervalo (RF-IV).

3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las teorías molas y
molecular. El término “mejoramiento” se refiere a hacer algo mejor que el pasado reciente. No se refiere a
elegir la mejor alternativa en ese momento.

La teoría del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra
para mejorar la tasa local de reforzamiento que están recibiendo. El mecanismo de mejoramiento da
como resultado la igualación.

Esta teoría sostiene que un organismo cambiará su preferencia en favor de la alternativa de respuesta que
arroje la tasa local de reforzamiento más alta.

C) ELECCIÓN CON COMPROMISO

En nuestra vida diaria, en ocasiones elegir una alternativa hace que otras no estén disponibles. De
igual forma, las elecciones importantes en la vida a menudo implican un beneficio pequeño a corto plazo
frente a un beneficio más demorado pero mayor.

Es complicado extrapolar este tipo de decisiones al laboratorio para poder estudiarlas, por ello los
científicos han desarrollado el programa concurrente encadenado de reforzamiento.

Programa concurrente encadenado

Este programa involucra al menos dos fases o eslabones:

1ª fase: Eslabón de elección: Se permite al participante elegir entre dos programas alternativos
realizando una de dos respuestas.

2ª fase: Eslabón terminal: Una vez que el participante ha elegido uno de los dos eslabones de
elección, irá al eslabón terminal que está formado por dos programas de reforzamiento dependiendo de qué
opción haya escogido en la 1ª fase.

Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de razón variable (RV) ya
que proporciona reforzamiento por un número relativamente pequeño de respuestas.

El estímulo del eslabón terminal se convierte en un reforzador condicionado. Por lo tanto un programa
concurrente se caracteriza en que las respuestas al eslabón inicial se refuerzan por la presentación de
un reforzador condicionado. Las diferencias en el valor del reforzador condicionado determinarán entonces
la tasa relativa de cada respuesta de elección en el eslabón inicial.

Estudios de autocontrol

El autocontrol a menudo supone elegir una recompensa grande demorada en lugar de una recompensa
pequeña inmediata.

grande demorada si se requiere que los participantes esperen más tiempo para recibir cualquier
recompensa tras realizar su elección. Si las recompensas se entregan rápidamente tras una
respuesta de elección, los sujetos generalmente prefieren una recompensa pequeña inmediata más que
una recompensa grande demorada. Sin embargo, si se añade una demora constante a la entrega de
ambas recompensas, es más probable que los individuos muestren autocontrol y prefieran la recompensa
grande demorada.

Explicaciones del autocontrol:

El valor de un reforzador se reduce en función del tiempo que haya que esperar para obtenerlo. La función
matemática que representa esto se llama función descontadora del valor.

Las funciones descontadotas y los problemas de autocontrol en la adicción a la droga:

Cuando más acusada sea la función descontadora de la demora de una persona, más dificultad tendrá
para mostrar autocontrol (seleccionando una recompensa mayor demorada) en lugar de impulsividad
(seleccionando una recompensa más pequeña pero más rápida).

Experimentos para medir el autocontrol en personas dependientes de la heroína demostró que


tenían más impulsividad que el resto de las personas. . Para los dependientes de la heroína, el valor del
dinero disminuyó muy rápido si iban a tardar en dárselo.

¿Puede entrenarse el autocontrol?

La respuesta es sí.
CAPITULO 7:
COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Un sujeto está motivado para obtener un reforzador. Pero ¿qué significa estar motivado?

1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una perspectiva molecular.
Se centra en las respuestas individuales y sus antecedentes estimulares y consecuencias específicas.

2. Regulación conductual: (tradición skinneriana): El condicionamiento instrumental se considera desde


un contexto más amplio, es decir, desde una perspectiva molar. Se analizan las opciones conductuales
del organismo para alcanzar las metas, por lo tanto es una perspectiva más funcional.

1.ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO INSTRUMENTAL

Thorndike: El condicionamiento instrumental incluye algo más que una respuesta y un reforzador.
Deben considerarse 3 sucesos en el análisis del condicionamiento instrumental:

Contexto estimular (E)


Respuesta instrumental (R)
Consecuencia de la respuesta o reforzador (C)

La asociación E-R y la ley del efecto

El papel del reforzador (C) es establecer una asociación entre las claves contextuales (E) y la respuesta
instrumental (R).

La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, ya que el reforzador
(C) no participa en esta asociación.

Expectativa de recompensa y la asociación E-C

Los procesos pavlovianos son importantes en este tipo de asociación. El reforzamiento de la respuesta (R)
producirá una asociación entre el contexto estimular (E) y la consecuencia de la respuesta (C).

Hull estableció que la respuesta instrumental era motivada por dos factores:

a) (E) evoca la respuesta directamente por asociación con (R)


b) La actividad instrumental también llega a realizarse en respuesta a la expectativa de recompensa
debido al establecimiento de una asociación R-C.

La teoría moderna de los dos procesos: Esta teoría asume que hay 2 tipos de aprendizaje, el
condicionamiento pavloviano y el instrumental y están relacionados de una forma especial:

Durante el condicionamiento instrumental, (E) se relaciona con (C) a través de


condicionamiento pavloviano. Entonces tenemos la asociación (E-C). A través de esta asociación,
(E) motiva la conducta instrumental mediante la activación de un estado emocional central que
dependerá de la naturaleza del reforzador

¿Cómo podían demostrar que este estado de esperanza finalmente motivaría la conducta instrumental? La
tasa de una respuesta instrumental será modificada por la presentación de un estímulo clásicamente
condicionado. Reforzar una presión de palanca con comida crea la expectativa de comida y la
emoción de esperanza. Por lo tanto la presentación de un EC+ clásicamente condicionado con comida
durante la ejecución de una respuesta reforzada debería aumentar la esperanza y por lo tanto incrementar
la respuesta.

Resultados consecuentes con la teoría moderna de los dos procesos

Experimento de transferencia de control:

Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algún


procedimiento de reforzamiento positivo o negativo.
Fase 2: Se entrena a los participantes con un condicionamiento clásico en el cual se asocia un
EC explícito con la presencia o ausencia de un estímulo incondicionado.
Fase 3: Es la fase de transferencia crítica. Se permite a los participantes que realicen la respuesta
instrumental y se presenta el EC de la fase 2 para comprobar su efecto en la tasa de conducta instrumental.

Interacciones de respuesta en los experimentos de transferencia de control

Un estímulo clásicamente condicionado puede influir sobre la conducta instrumental a través de las
respuestas abiertas que elicita. Situación hipotética:
¿Estados emocionales centrales condicionados o expectativas específicas de recompensa?

En ciertas circunstancias los animales adquieren expectativas específicas del reforzador en lugar de un
estado emocional más general de “esperanza” durante el condicionamiento instrumental y clásico.

Relaciones R-C y E(R-C) en el condicionamiento instrumental

En los dos tipos de asociaciones que hemos visto antes (Throndike E-R y asociación E-C) no se incluía
de forma directa una relación entre la respuesta (R) y el reforzador (C).

Evidencia de asociaciones R-C: Una técnica para probar la asociación respuesta- consecuencia
consiste en devaluar el reforzador después del condicionamiento clásico para ver si esto disminuye la
respuesta instrumental.

La devaluación de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada


con ese reforzador.

Evidencia del aprendizaje de una relación jerárquica E-(R-C): Las asociaciones R-C no pueden actuar
aisladamente para producir la conducta instrumental. Se necesita un factor adicional para activar la
asociación R-C. Y este factor es el estímulo (E).

2. REGULACIÓN CONDUCTUAL

Los análisis de la regulación conductual se centran en cómo las contingencias instrumentales ponen
limitaciones a las actividades de un organismo.

Antecedentes de la regulación conductual

Al principio se consideraba que los reforzadores eran unos estímulos especiales que fortalecían la conducta
instrumental.

La teoría de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias típicas de la


especie (comer, beber, etc) son en sí mismas el rasgo crítico de los reforzadores. Se consideró que las
respuestas reforzadoras eran especiales porque involucraban la consumación o completamiento de
una secuencia instintiva de conducta.
El principio de Premack: Las respuestas incluidas en los reforzadores comúnmente utilizados son
actividades que es altamente probable que realicen los animales. Por el contrario las respuestas
instrumentales son actividades que normalmente ocurren a una baja probabilidad .

“Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la respuesta de


alta probabilidad A después de la respuesta de baja probabilidad B tendrá como resultado el
reforzamiento de la respuesta B. La oportunidad para realizar la respuesta B de baja probabilidad
después de la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A”

(B → A refuerza B)
( A → B no refuerza A)

La Hipótesis de la privación de respuesta: (Timberlake y Allison): La restricción de la respuesta reforzadora


es el factor crítico para el reforzamiento instrumental. Incluso el acceso a una respuesta de baja
probabilidad puede servir como reforzador siempre y cuando los sujetos tuvieran la restricción de
realizar esa respuesta.

Por lo tanto esto entra en conflicto con el principio de Premack al mostrar que la privación de respuesta
es más básica para la motivación de la conducta instrumental que la probabilidad diferencial de la
respuesta.

Tanto la teoría de Premack como la hipótesis de la privación de respuesta sugieren que los reforzadores no
existen en sentido absoluto.

Regulación conductual y el punto de deleite conductual

El concepto de regulación está muy relacionado con la homeostasis. Los organismos tienen una
distribución de actividades preferida que luchan por mantener frente a los cambios. Si se perturba
este nivel de actividades óptimo, se supone que la conducta cambiará para regular la desviación.

Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas entre varias
alternativas, lo harán de forma en que sea más cómodo para ellos. Este punto puede identificarse mediante
la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una situación sin
restricciones.

Imposición de una contingencia instrumental:


Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto de deleite
conductual sigue teniendo importancia ya que proporciona la motivación para la conducta instrumental.
Volver al punto conductual sigue siendo una meta en la distribución de respuestas.

Modelo de desviación minima (Staddon): La introducción de una contingencia respuesta-


reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales
y contingentes de manera que se minimice la desviación total de las dos respuestas con respecto al punto
óptimo o de deleite.

Explicación de los efectos del reforzamiento: El efecto de reforzamiento se identifica por un


incremento en la ocurrencia de una respuesta instrumental sobre el nivel de esa conducta en ausencia
de la contingencia respuesta-reforzador.

Una vision sobre las contingencias de reforzamiento en un contexto conductual más amplio: El contexto
también influye en todo esto ya que las contingencias instrumentales no suceden en un vacío, ocurren en
un contexto en el que se puden dar una variedad de respuestas y reforzadores.

Conceptos económicos y distribución de respuesta


“La economía es el estudio de la distribución de la conducta dentro de un sistema de restricciones”

Economía: Las restricciones de la conducta se imponen por los ingresos de un individuo y el precio de los
bienes que se quiere obtener.

Psicología: En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas


por el número de respuestas que un organismo es capaz de realizar y el número de respuestas requerido para
obtener el reforzador.

Demanda del consumidor: Es fundamental la relación entre el precio de una comodidad y cuánto se obtiene,
esto se denomina curva de la demanda

Elasticidad de la demanda: Grado en el cual el precio influye en el consumo.

Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cómo las restricciones de
un programa moldean la redistribución de la conducta:

1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artículo producen una
disminución en el consumo depende de la disponibilidad (y precio) de otros bienes que puedan utilizarse
en sustitución del artículo original. La disponibilidad de sustitutos aumenta la sensibilidad del artículo
original a los precios altos.

Economía abierta: A los animales se les da comida fuera de las sesiones experimentales

Economía cerrada: Los animales no reciben alimentación suplementaria.

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos. En
un rango de precios bajos, la demanda de comida no es elástica..

3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor con los incrementos del
precio.
Problemas con las aproximaciones de regulación conductual

El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada
respuesta acumulada a lo largo de un bloque temporal amplio..

Otro problema es que las respuestas durante un período de línea de base libre no siempre tienen el
mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta.

La regulación conductual no estudia los procesos conductuales moleculares, por lo tanto no dice nada
acerca de cómo los organismos defienden una combinación preferida de bienes o actividades.

Contribuciones de la regulación conductual

1. La regulación conductual y el principio de Premack nos alejó de la consideración de los reforzadores


como tipos especiales de estímulos o como tipos especiales de respuestas.
2. Los procedimiento de condicionamiento instrumental ya no se considera que “estampan” o
“fortalecen” la conducta instrumental, en su lugar es visto como una nueva distribución de respuestas.
3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras. Se distinguen
únicamente por los papeles asignados a ellas mediante un procedimiento de condicionamiento instrumental.
4. La regulación conductual y la economía conductual aceptan la idea de que los organismos
responden para maximizar sus beneficios
5. La regulación conductual y la economía conductual han proporcionado caminos nuevos para
describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el
repertorio de conducta de un organismo.

3. COMENTARIOS FINALES

Características propias de cada teoría que no comparte con la otra

Asociacionismo
Concepto de asociación
Exploración de los circuitos neuronales
Nivel molecular: El objetivo son los estímulos específicos, las respuestas y sus conexiones.
Está relacionada con procesos específicos (asociaciones E-R, E-C, R-C, etc)

Regulación conductual
Concepto de regulación conductual (puntos de deleite y restricciones del programa)
Poca aplicación neurológica
Nivel molar de agregados de conducta.
Está relacionada con metas a largo plazo
CAPITULO 8:
EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO
Respondemos de distinta manera dependiendo del estímulo que se nos presente. La supervivencia de los
animales depende de su habilidad para responder apropiadamente a la situación.

1. IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO

Respuesta diferencial y discriminación de estímulos

Otro concepto importante aquí es el de discriminación de estímulos: Un organismo muestra


discriminación de estímulos si responde de forma diferente a dos o más estímulos.

En realidad al hablar del control y de la discriminación estamos hablando de lo mismo pero desde diferentes
puntos de vista. Uno no existe sin lo otro. Además, en ausencia de procedimientos especiales, los
investigadores no siempre pueden predecir cuál de varios estímulos de aquellos que un organismo
experimenta adquirirá control sobre su conducta instrumental.
Generalización de estímulos

Se dice que un organismo muestra generalización de estímulos si responde de forma similar a dos o
más estímulos.

Gradiente de generalización de estímulos: Experimento en Palomas: Picoteaban una tecla de 580nm de


longitud de onda, se demostró que ante variaciones de la longitud entre
570 y 590 seguían respondiendo de la misma forma. El intervalo donde se generalizan las respuestas (570-
590) es lo que se conoce como gradiente de generalización del estímulo.

Los gradientes de generalización del estímulo como medidas del control por el estímulo

Los gradientes facilitan información acerca del grado de sensibilidad de la conducta de un organismo antes
la variación de un aspecto particular del ambiente. Los investigadores pueden determinar exactamente el
grado en que tiene que modificarse un estímulo para producir un cambio en la conducta.

Por el contrario, si el gradiente es muy acusado quiere decir que el organismo responde en mayor
medida a algunos estímulos de prueba que a otros.

2. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL ESTÍMULO

En el experimento de las palomas era muy fácil dividir las características del estímulo (triángulo y
fondo rojo), sin embargo en la vida real es mucho más dificil dividir las características ya que las situaciones
son mucho más complejas.

Capacidad sensorial y orientación

La capacidad sensorial y de orientación determinan qué estímulos se incluyen en el mundo sensorial de un


organismo. Lo que esté fuera de su rango sensorial no existe para un organismo (

Facilidad relativa del condicionamiento de varios estímulos

Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden sobre un
estímulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situación.
Esto se conoce como ensombrecimiento.
Cuanto más intenso sea el estímulo, más rápido se condicionará y ensombrecerá el aprendizaje del estímulo
más débil.

Tipos de reforzamiento

Es más probable que ciertos tipos de estímulos adquieran control sobre la conducta instrumental con
reforzamiento positivo que con reforzamiento negativo.

Tipos de respuesta instrumental

Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un experimento con perros
se demostró que las respuestas que se diferencian por la localización (levantar la para
derecha/levantar la pata izquierda) es más probable que estén bajo el control de la característica
especial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza
(hacer/no hacer) es más probable que lleguen a estar bajo el control de la naturaleza de la clave auditiva.
Respuestas de localización (levantar derecha o izquierda) – Localización clave auditiva
Respuestas de naturaleza de la acción (hacer o no hacer) – Tipo de clave auditiva
A todo este fenómeno lo llamamos: efecto de la naturaleza-localización
El efecto de naturaleza-localización es un ejemplo de asociación selectiva. Hay otros ejemplos de
asociación selectiva:
Elementos del estímulo frente a claves configuracionales en los estímulos compuestos

Aproximación elemental del estímulo: Los distintos elementos que forman un estímulo (localización,
color, sonido, etc) son tratados por el organismo como rasgos distintivos y sepadados del ambiente.
Aproximación de la clave configuracional: (es lo contrario a lo anterior): Los estímulos son percibidos
como un todo integral y no se dividen en partes más pequeñas.

Aunque parezcan aproximaciones opuestas, se han elaborado teorías para unificarlas. Se piensa que en
ciertas circunstancias predomina el control elemental mientras que en otras condiciones predomina el
control de las características configuracionales.

3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO

El hecho de que ciertos estímulos puedan percibirse no asegura que llegarán a controlar la conducta. Para
que ciertos estímulo lleguen a controlar la conducta, también depende de lo que el organismo haya
aprendido de ellos.

Pavlov: La generalización del estímulo se da porque el aprendizaje sobre el EC llega a tranferirse a


otros estímulos.

Entrenamiento en discriminación de estímulos

El estímulo que señala disponibilidad de reforzamiento se denomina E+ o ED (e de) El estímuo que señala
Δ
la falta de reforzamiento se denomina E- o E (e delta)

A medida que progresa el entrenamiento, la respuesta de los organismos en presencia de E+ aumenta


mientras que la respuesta en presencia de E- declina. Cuando tanto E+ como E- han adquirido control
sobre la conducta del organismo, se llaman estímulos discriminativos.

Programa múltiple de reforzamiento: el procedimiento de la figura 8.7 es un ejemplo de este tipo de


programa. En un programa múltiple funcionan diferentes programas de reforzamiento en presencia de
diferentes estímulos.

Efectos del entrenamiento en discriminación sobre el control por el estímulo


Para poder hacernos una idea de la precisión de control que el E+ adquiere sobre la conducta
instrumental no basta con solamente observar la respuesta diferencial ante E+ y E-. Se debe también
determinar lo acusado del gradiente de generalización.

El entrenamiento en discriminación aumenta el control por el estímulo de la conducta instrumental


Una dimensión particular del estímulo (como la frecuencia tonal) es más probable que adquiera control
sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estímulo

Rango de posibles estímulos discriminativos

Los procedimientos de discriminación pueden ser utilzados para situar la conducta instrumental de un
organismo bajo el control de una amplia variedad de estímulos

Estos procedimientos se utilizan a menudo para evaluar la capacidad sensorial de los animales.

¿Qué se aprende en el entrenamiento por discriminación?

Tenemos un E+ (luz roja) y un E- (tono intenso)

Un organismo puede aprender 3 cosas diferentes con prácticamente los mismos resultados:

1- Responder sólo ante la presencia de E+ y no aprender nada acerca de E-


2- Aprender a suprimir la respuesta durante E- pero no aprender nada acerca del E+
3- Aprender el significado tanto de E+ como de E- Teoría de Spence del aprendizaje de discriminación

La mera observación de que los organismos responden más al E+ que al E- no es suficiente para
probar que han aprendido algo acerca de ambos estímulos. Por lo tanto haremos experimentos donde
utilizaremos los gradientes de generalización del estímulo.

Gradiente de generalización del estímulo excitatorio: Si se ha condicionado una tendencia excitatoria al E+,
debe observarse un gradiente de generalización acusado con la mayor cantidad de respuesta ante el E+.

Gradiente de generalización del estímulo inhibitorio: Si se ha condicionado una tendencia inhibitoria al E-,
entonces los estímulos que difieran progresivamente del E- deberían ser cada vez menos efectivos en inhibir
la respuesta instrumental.

Algunos experimentos relacionados con esto muestran que el entrenamiento en discriminación


puede producir tanto condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-.

Interacciones entre el E+ y el E-: desplazamiento del máximo

Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa, sobre todo si
ambos se encuentran relacionados de alguna manera.

Discriminación intradimensional: Se produce cuando el E+ y el E- son semejantes excepto por un


rasgo o atributo.

La discriminación intradimensional es una forma de ejecución experta.

Explicación de Spence del desplazamiento del máximo: La explicación de Spence a este fenómeno se
basa en la interacción en forma de superposición matemática de los valores absolutos de los E+ y E-
originales (los que han participado en el entrenamiento). En otras palabras, Spence considera que,
independientemente de los estímulos que se presenten en la prueba de generalización, es posible
calcular el valor del rasgo del estímulo hacia el que va a desplazarse el máximo de respuestas
atendiendo exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una luz
de 100 nm y el E- una luz de 50 nm, puede deducirse que el máximo de respuesta se emitirá ante una luz de
150 nm, independientemente del valor que tengan en ese rasgo los estímulos de prueba que se presenten.

Explicaciones alternativas del desplazamiento del máximo: La explicación alternativa asume que los
organismos aprenden a responder a un estímulo basándose en la relación de ese estímulo con otras claves
de la situación (a diferencia del modelo de Spence que es un modelo de aprendizaje absoluto del estímulo)

Entrenamiento de equivalencia de estímulos

De la misma forma que el entrenamiento en discriminación potencia la respuesta diferencial, el


entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estímulos.

El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia funcional entre
esos estímulos con la consecuencia de que una respuesta condicionada a uno de ellos se generalizará a los
otros.

Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades matemáticas:

1) Reflexividad o igualdad (A=A, B=B, C=C)


2) Simetría (si A lleva a B, diremos que también B lleva a A)
3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)

4. CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES

Estímulo discreto: Aquel que se presenta durante un breve período de tiempo y tiene un comienzo y un final
claros.

Sin embargo los estímulos discretos suceden en presencia de un fondo de claves contextuales que
también pueden proporcionar una fuente importante de información acerca de la conducta aprendida.

Control por claves contextuales

Las claves contextuales pueden llegar a controlar la conducta de varias formas.

En varios experimentos se concluyó que efectivamente las claves contextuales (sin reforzador)
también pueden llegar a controlar la conducta instrumental. Además el control contextual por el estímulo
puede ocurrir sin que un contexto esté más fuertemente asociado con el reforzamiento que otro.

Control de las relaciones condicionales

Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI)

Modulador: En ciertas circunstancias la naturaleza de una relación binaria está determinada por
un tercer suceso llamado modulador.

Relación condicional: Es la relación de un modulador con la relación binaria que señala.

Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional


es que un evento señala la relación entre otros dos eventos.

Un estímulo discriminativo facilita la respuesta instrumental mientras que el modulador facilita la


respuesta elicitada por el EC.
Estímulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en los procedimientos
de discriminación instrumental.

Distinción entre la excitación y la modulación

- La extinción es un procedimiento en el cual un estímulo previamente condicionado se presenta


repetidamente pero se omite el EI. El resultado típico de la extinción es que disminuye la respuesta
condicionada.

La diferencia en los efectos de un procedimiento de extinción sobre los estímulos condicionados excitatorios
y los establecedores de la ocasión está relacionada con lo que se señala en cada uno de los procedimientos

- Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausencia del EI después
de la presentación del EC durante la extinción es una violación de esa expectativa. Por lo tanto el
valor como señal del EC tiene que reajustarse en la extinción para estar en consonancia con la nueva
realidad. Un reajuste como éste no se requiere en un procedimiento de extinción de un establecedor de la
ocasión.

Modulación frente a condicionamiento configuracional: Para que el sonido sirva como una señal de que la
luz de la tecla se emparejará con la comida, el sonido y la luz de la tecla tiene que ser tratados como
elementos independientes más que como una clave configuracional combinada. Por tanto, los efectos
modulatorios requieren la respuesta al compuesto estimular como constituido por elementos
independientes estimulares.

Compuesto serial: Para promover que los organismos traten los compuestos estimulares como construidos
por elementos independientes, los investigadores presentan los elementos uno tras otro, en lugar de
simultáneamente.
CAPITULO 9:
EXTINCIÓN DE LA CONDUCTA CONDICIONADA

La extinción implica la omisión del EI o reforzador.

Extinción en el condicionamiento clásico: incluye presentaciones repetidas del estímulo condicionado


por sí solo.
Extinción en el condicionamiento instrumental: Implica no volver a presentar el reforzador como una
consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada disminuye. Por ello se piensa que la extinción es lo contrario
a la adquisición sin embargo esto es incorrecto.

Diferencia entre extinción y olvido

Extinción: Se produce por la omisión del EI que sigue a las presentaciones del EC o la omisión del
reforzador que sigue a la respuesta instrumental.

Olvido: Disminución de la respuesta condicionada que se da con el paso del tiempo.

1. EFECTO DE LOS PROCEDIMIENTOS DE EXTINCIÓN

La respuesta disminuye cuando no vuelve a producir reforzamiento


Además la variabilidad de la respuesta aumenta
Sin embargo es importante señalar que aparte de la variabilidad de respuestas también seguía dándose la
respuesta inicial previa a la extinción, por lo tanto podemos decir que la estructura básica de la conducta
instrumental se altera muy poco por el hecho de introducir la extinción.

Frustración: Reacción emocional inducida por la falta de un reforzador esperado. Puede derivar en
agresión.

2. EXTINCIÓN Y APRENDIZAJE ORIGINAL


Recuperación espontánea

Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde


con el tiempo. Por lo tanto la respuesta condicionada volverá a estar presente si el sujeto se pone a
prueba tras una demora que siga al procedimiento de extinción.

Recuperación espontánea tras el condicionamiento instrumental: . En un experimento con ratas se


demostró que la respuesta cuya recuperación se comprobó tras un período de descanso posterior a la
extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se midió sin
un período de descanso posterior a la extinción (R-No descanso).

La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la


respuesta.

Renovación del condicionamiento excitatorio original

Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se


cambian las claves contextuales que estaban presentes durante la extinción.

El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de
extinción no refleja desaprendizaje de la respuesta de miedo condicionado.
La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo
que no es el de la adquisición original. Sin embargo en este caso la renovación no es tan sólida como cuando
se lleva al contexto original.

Implicación en la terapia de conducta: Aunque un procedimiento terapeútico sea efectivo extinguiendo una
fobia en la seguridad de una sala de consulta del terapeuta, el miedo condicionado puede volver a
presentarse cuando el paciente se enfrente con un EC de miedo en un contexto diferente.

Para reducir el efecto de renovación, investigadores han llevado a cabo la extinción en distintos
contextos.

Restauración de la ejecución propia de la extinción

La renovación implica la reactivación de la memoria del condicionamiento original mediante la retirada


del sujeto de las claves contextuales presentes durante la extinción. La renovación reactiva una
conducta aprendida previamente mediante el cambio del contexto a condiciones más aproximadas
a las presentes cuando la conducta se adquirió con anterioridad.

Recuperación espontánea: Implica la recuperación de la conducta condicionada originalmente que sigue a


la extinción si transcurre un período suficiente de tiempo tras la fase de extinción.

Restablecimiento de la excitación condicionada

Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado


extinguido.

Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento
puede ser un resultado del condicionamiento contextual. El condicionamiento contextual es un posible
factor contribuyente debido a que las presentaciones del EI que se dan durante la fase de restablecimiento
pueden producir un condicionamiento de las claves contextuales de la situación experimental.

Sensibilidad a la devaluación del reforzador

Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto
(el de la devaluación del reforzador) se observa también en estímulos (en el caso del condicionamiento
clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a
procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI
con el que se condicionó, la RC ante ese EC será todavía menor que si simplemente lo hubiésemos
extinguido.

Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las
asociaciones realizadas durante el condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o
R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.

3- ¿QUÉ SE APRENDE EN LA EXTINCIÓN?

Asociaciones E-R inhibitorias

La falta de reforzamiento produce una asociación E-R inhibitoria.

En realidad la extinción implica un tipo especial de ausencia de reforzamiento, es decir, se trata de


ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de reforzamiento sin esta
historia previa no es extinción, sino más bien habituación. La ausencia de reforzamiento resulta
aversiva sólo después de darse una historia de reforzamiento. Por lo tanto los efectos emocionales de la
ausencia de reforzamiento dependen de forma crítica de la historia previa del sujeto.

Los efectos de la extinción son tanto conductuales como emocionales. Los efectos emocionales se originan
en la frustración que se desencadena cuando un reforzador esperado no llega. Se supone que la
ausencia de reforzamiento cuando se espera recompensa desencadena una reacción frustrante aversiva
incondicionada. Esta emoción aversiva sirve para que se deje de responder durante el curso de la extinción
mediante el establecimiento de una asociación E-R inhibitoria.

Efectos paradójicos de la recompensa

Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la expectativa de
recompensa, y en consecuencia más fuerte será la frustración que se da cuando se introduce la extinción.

Efecto de sobreentrenamiento en la extinción: Si la disminución en la respuesta se debe a los efectos


frustrantes de la ausencia de recompensa, un entrenamiento más extenso debería producir una extinción
más rápida.

Efecto de la magnitud del reforzamiento en la extinción: La respuesta disminuye más rápido durante la
extinción que sigue a un reforzamiento con un reforzador mayor. La ausencia de reforzamiento
resulta más frustrante si el individuo espera una gran recompensa que si espera una pequeña.

Efecto del reforzamiento parcial en la extinción (ERPE): Los efectos de la extinción serán diferentes
dependiendo del programa de reforzamiento usado. La extinción es más lenta y produce menos reacciones
de frustración si había un programa de reforzamiento parcial en lugar de uno continuo..

Mecanismos del efecto de reforzamiento parcial en la extinción

Hipótesis de la discriminación: La ausencia de reforzamiento es mucho más fácil de detectar tras el


reforzamiento continuo. El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la
ausencia del reforzador, y esta persistencia aprendida se mantiene aun cuando los sujetos posteriormente
experimenten una cadena ininterrumpida de sucesos.

Teoría de la frustración: Los sujetos aprenden sobre los efectos emocionales de la ausencia de
recompensa durante el entrenamiento en reforzamiento parcial.
Teoría secuencial: Está basada en lo que los sujetos aprenden sobre la memoria de la
ausencia de recompensa.

Teoría de la frustración (Abraham Amsel): La persistencia en la extinción es resultado del aprendizaje de


algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. La
teoría de la frustración asume que el reforzamiento intermitente da como resultado aprender a
responder a pesar de esperar la ausencia de reforzamiento. El reforzamiento intermitente da como resultado
el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de
recompensa. Por el contrario, no existe nada en la experiencia del reforzamiento continuo que motive a
los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce
persistencia en la extinción.

Teoría secuencial: (Capaldi) Esta teoría está formulada en términos de conceptos de memoria. Asume
que los sujetos pueden recordar si fueron reforzador por realizar la respuesta instrumental en el
pasado reciente. El sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los
ensayos precedentes.

D. RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL


Momento conductual: Este concepto se basa en el concepto de momento de la física newtoniana. El
momento de un objeto físico es el producto de su peso (o masa) por su velocidad. Esta hipótesis dice que la
conducta que posee un momento elevado también será difícil de “parar” o interrumpir por las
manipulaciones.

La investigación sobre el momento conductual se ha llevado a cabo utilizando programas múltiples de


reforzamiento ya que capacitan a los investigadores para comparar la susceptibilidad de la conducta a la
interrupción bajo dos condiciones diferentes en la misma sesión.

El modelo conductual está relacionado directamente con la tasa de reforzamiento.


Una tasa más alta de reforzamiento produce una conducta que tiene un mayor momento y que es
menos susceptible a la interrupción.
El momento conductual no está relacionado con la tasa de respuesta, es decir, do
conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento
conductual.
Los programas que proporcionan tasas similares de reforzamiento pero tasas
diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un único concepto la
resistencia de la conducta a diversas posibilidades de cambio. El concepto “fuerza de la respuesta” está
relacionado con esto.
CAPITULO 10
CONTROL AVERSIVO: EVITACIÓN Y CASTIGO

El aprendizaje de la evitación se ha estudiado aproximadamente durante 100 años. En la mayor parte de los
experimentos han participado ratas de laboratorio que aprenden a responder para evitar una descarga. Sin
embargo, también se han realizado muchos estudios con participantes humanos así como también se han
probado diversos estímulos aversivos que incluyen pérdidas monetarias, pérdidas de puntos y tiempo fuera del
reforzamiento positivo

Orígenes del estudio de la conducta de evitación


No es posible entender el estudio de la conducta de evitación sin haber comprendido sus raíces históricas. Las
investigaciones experimentales de la evitación se originaron con los estudios del condicionamiento clásico.
Los primeros experimentos de evitación fueron realizados por el psicólogo ruso Vladimir Bechterev (1913)
como una extensión de la investigación de Pavlov, pero a diferencia de éste, Bechterev se interesaba en estudiar
el aprendizaje asociativo en seres humanos. En un estudio, se indicó a los participantes que colocaran un dedo
sobre una bandeja de metal; a continuación se presentaba un estímulo de advertencia

El procedimiento de evitación discriminada


Si bien la conducta de evitación no es sólo otro caso de condicionamiento clásico, hasta ahora la herencia del
condicionamiento clásico ha tenido gran influencia en los análisis experimentales y teóricos del estudio de la
conducta de evitación.

Los procedimientos de evitación discriminada suelen llevarse a cabo en una caja de vaivén como la que aparece
en la caja

El aprendizaje de la evitación se ha estudiado aproximadamente durante 100 años. En la mayor parte de los
experimentos han participado ratas de laboratorio que aprenden a responder para evitar una descarga. Sin
embargo, también se han realizado muchos estudios con participantes humanos así como también se han
probado diversos estímulos aversivos que incluyen pérdidas monetarias, pérdidas de puntos y tiempo fuera del
reforzamiento positivo

Orígenes del estudio de la conducta de evitación


No es posible entender el estudio de la conducta de evitación sin haber comprendido us raíces históricas. Las
investigaciones experimentales de la evitación se originaron con los estudios del condicionamiento clásico. Los
primeros experimentos de evitación fueron realizados por el psicólogo ruso Vladimir Bechterev (1913) como
una extensión de la investigación de Pavlov, pero a diferencia de éste, Bechterev se interesaba en estudiar el
aprendizaje asociativo en seres humanos.

El procedimiento de evitación discriminada


Si bien la conducta de evitación no es sólo otro caso de condicionamiento clásico, hasta ahora la herencia del
condicionamiento clásico ha tenido gran influencia en los análisis experimentales y teóricos del estudio de la
conducta de evitación. Los investigadores se han interesado en la importancia de la señal de advertencia en los
procedimientos de evitación y en la relación de dichas señales de advertencia con el EI y con la respuesta
instrumental. Preguntas experimentales de este tipo han sido investigadas exhaustivamente con procedimientos
similares a los utilizados por Brogden y sus colaboradores. Este método se conoce como evitación discriminada
o señalada.

Teoría de los dos procesos de la evitación Los procedimientos de evitación implican una contingencia negativa
entre una respuesta y un estímulo aversivo. Si uno emite las respuestas de evitación adecuadas, no se cae,no se
moja ni se sale de la carretera. No hay placer particular que se derive de esas experiencias; lo único que uno
logra es no salir lastimado. Se supone que la ausencia del estímulo aversivo es la razón de que se realicen las
respuestas de evitación pero, ¿cómo puede la ausencia de algo proporcionar reforzamiento para la conducta
instrumental? Esta es una pregunta fundamental en el estudio de la evitación.

Como lo implica su nombre, la teoría de los dos procesos supone que en el aprendizaje de evitación participan
dos mecanismos. El primero es un proceso de condicionamiento clásico activado por los emparejamientos del
estímulo de advertencia (el EC) con el evento aversivo (el EI) en los ensayos en que el organism no realiza la
respuesta de evitación. Dado que el EI es un estímulo aversivo, el EC llega a provocar miedo a través del
condicionamiento clásico. Por consiguiente, el primer componente de la teoría de los dos procesos es el
condicionamiento clásico del miedo al EC.

la investigación contemporánea se dedica a los mecanismos del condicionamiento del miedo, así como también
a su extinción. La teoría de los dos procesos trata al miedo condicionado como una fuente de motivación para el
aprendizaje de evitación. El miedo es un estado desagradable y emocionalmente activador.

El miedo y la amígdala
En el condicionamiento del miedo las señales neurales provocadas por el EC y el EI convergen dentro de la
amígdala La información sobre el EI es proporcionada por diversos circuitos neurales, cada uno de los cuales es
suficiente para apoyar el condicionamiento (Lanuza, Nader y LeDoux, 2004). La información acerca del EC es
proporcionada por tres sistemas funcionalmente distintos,

Análisis experimental de la conducta de evitación


El aprendizaje de evitación ha sido el tema de muchos experimentos. Gran parte de la investigación ha sido
estimulada por los esfuerzos para demostrar o refuter la teoría de los dos procesos. Si bien por razones de
espacio no podemos revisar aquí toda la evidencia, consideraremos varios hallazgos importantes que deben ser
tomados en cuenta para entender los mecanismos de la conducta de evitación.

Medición independiente del miedo durante la adquisición de la conducta de evitación Otra estrategia importante
que se ha empleado en investigaciones de la conducta de evitación implica mediciones independientes del
miedo y de la respuesta instrumental de evitación.

Medición independiente del miedo durante la adquisición de la conducta de evitación

Por lo regular, esos estudios utilizan ratas de laboratorio condicionadas en una tarea de evitación en la caja de
vaivén, y emplean técnicas de supresión condicionada para medir el miedo. También en sujetos humanos se ha
observado una separación similar entre el miedo y el aprendizaje de evitación.

La disminución del miedo ante el EC con el entrenamiento exhaustivo de evitación supone un enigma para la
teoría de los dos procesos y ha estimulado planteamientos alternativos,

Extinción de la conducta de evitación por medio del impedimento de la respuesta y la exposición al EC solo
Evitación no discriminada (operante libre)

Demostraciones del aprendizaje de evitación de operante libre


La mayor parte de la investigación sobre el aprendizaje de evitación de operante libre ha utilizado ratas de
laboratorio como participantes y una descarga breve en las patas como estímulo aversivo.Sin embargo, también
se han realizado experimentos con participantes humanos y con estímulos aversivos “más naturales”.

La evitación de operante libre y la teoría de los dos procesos


La conducta de evitación de operante libre supone un desafío para la teoría de los dos procesos, ya que no hay
un EC explícito que provoque el miedo condicionado, y por ende no queda clara la manera en la cual la
respuesta de evitación reduce el miedo.
La suposición del condicionamiento temporal permite la aplicación de los mecanismos de la teoría de los dos
procesos a los procedimientos de evitación de operante libre. Dado que el paso del tiempo es un predictor
confiable de la siguiente descarga, las señales temporales pueden condicionarse para provocar miedo.

Explicaciones teóricas alternativas de la conducta de evitación


En la teoría de los dos procesos se supone que la disminución del miedo es lo que refuerza la respuesta de
evitación. Se trata de un caso de reforzamiento negativo en el cual el reforzamiento se debe a la eliminación de
un estímulo aversivo. Varios tratamientos teóricos posteriores han propuesto que los procedimientos de
evitación también proporcionan reforzamiento positivo a la respuesta de evitación, mientras que otros han
sugerido que en el aprendizaje de evitación no son importantes el reforzamiento negativo ni el reforzamiento
positivo.

Reforzamiento positivo a través de la inhibición condicionada del miedo o de las señales condicionadas de
seguridad

Reforzamiento de la evitación a través de la reducción de la frecuencia de la descarga

Evitación y reacciones de defensa específicas de la especie (RDEE)


La falta de interés por lo que hace un organismo en los primeros ensayos del condicionamiento de evitación es
un punto débil de cualquier teoría.

La inminencia depredadora y las conductas defensivas y de recuperación

El papel de los factores ecológicos y evolutivos fue desarrollado con mayor detalle por Fanselow y sus
colaboradores, quienes plantearon el concepto de un continuo de inminencia depredadora De acuerdo con el
continuo de inminencia depredadora, ocurren diferentes respuestas defensivas dependiendo del nivel de peligro
que enfrenta un animal.

CASTIGO

Como sociedad, usamos el castigo como una forma de retribución por actos delictivos atroces. También se
utiliza para promover la adhesión a códigos religiosos y civiles de conducta. Muchas instituciones y reglas
evolucionaron para asegurar la aplicación ética y justa del castigo. Lo que constituye un castigo aceptable en el
sistema de justicia criminal, en la crianza de los niños o en el tratamiento de individuos con capacidades
diferentes del desarrollo es materia de un debate continuo.
Análisis experimental del castigo
El procedimiento básico del castigo es sencillo: se presenta un estímulo aversivo después de una respuesta
instrumental objetivo. Si el procedimiento es eficaz, la respuesta objetivo es suprimida. Como el castigo implica
la supresión de la conducta, sólo puede observarse con respuestas que, en principio, tengan probabilidad de
ocurrir.

Características del estímulo aversivo y del método con que se introduce


En los experimentos sobre el castigo se ha empleado una gran variedad de estímulos aversivos, como descargas
eléctricas, una ráfaga repentina de aire, ruido fuerte, reprimendas verbales, una bofetada, un chorrito de jugo de
limón en la boca y una señal previamente condicionada con una descarga

El tiempo fuera se refiere a la eliminación de la oportunidad de obtener reforzamiento positivo;

Estimulación aversiva contingente a la respuesta o independiente de la respuesta Otra variable importante que
determina la eficacia del castigo es si el estímulo aversivo se presenta de manera contingente a la respuesta
objetivo o de manera independiente de la conducta.

Efectos de los programas de castigo


Así como el reforzamiento positivo no tiene que entregarse cada vez que ocurre la respuesta instrumental, el
castigo también puede aplicarse de manera intermitente, tal como vimos en el experimento de Goodall, en el
que el castigo se entregó de acuerdo a un programa
Estudios más sistemáticos han demostrado que el grado de supresión de la respuesta producido por el castigo
depende de la proporción de respuestas que son castigadas.

Tipos y programas de reforzamiento positivo

Disponibilidad de fuentes alternativas de reforzamiento positivo El castigo tiene resultados notablemente


diferentes dependiendo de si el sujeto puede obtener reforzamiento por medio de alguna otra actividad.

si se dispone de reforzamiento positivo por responder en presencia de un estímulo distintivo, pero el


reforzamiento no está disponible en su ausencia, el organismo aprenderá a responder sólo cuando esté presente
el estímulo. Los efectos supresivos del castigo también pueden ponerse bajo control del estímulo. Esto ocurre si
la respuesta es castigada en presencia de un estímulo discriminativo pero no se castiga en su ausencia. Dicho
procedimiento se denomina castigo discriminado. Con el entrenamiento del castigo discriminado los efectos
supresivos del castigo quedarán limitados a la presencia del estímulo discriminativo

El castigo como señal de la disponibilidad de reforzamiento positivo


En ciertas circunstancias la gente parece buscar el castigo. La evidencia empírica sugiere que los mecanismos
conductuales convencionales pueden dar lugar a la preferencia por el castigo. Es posible que se busque el
castigo si sólo se dispone de reforzamiento positivo cuando la respuesta instrumental también es castigada. En
tales circunstancias, el castigo puede convertirse en señal, o estímulo discriminativo, de la disponibilidad del
reforzamiento positivo. Si eso sucede, el castigo incrementará la respuesta en lugar de suprimirla.

Teorías del castigo


En contraste con el estudio de la conducta de evitación, las investigaciones sobre el castigo por lo general no
han sido motivadas por consideraciones teóricas. La mayor parte de la evidencia disponible sobre los efectos
del castigo ha sido producto de la curiosidad empírica.

La teoría de la respuesta emocional condicionada


Una de las primeras teorías del castigo fue propuesta por Estes y se basa en las observaciones de Estes y
Skinner de que un estímulo condicionado que es emparejado con una descarga suprimirá el desempeño de la
conducta instrumental reforzada con comida.

Cuando el castigo no funciona

La teoría de la respuesta emocional condicionada puede explicar muchos efectos del castigo. Por ejemplo, el
hecho de que las descargas más intensas y de mayor duración producen más supresión de la respuesta puede
explicarse suponiendo que los estímulos condicionados con esos eventos aversivos provocan respuestas
emocionales condicionadas más fuertes.

Teoría de la evitación del castigo


Una alternativa a la teoría de la respuesta emocional condicionada considera al castigo como una forma de
conducta de evitación. Esta teoría se vincula más es-trechamente con el trabajo de Dinsmoor,

El castigo y la ley negativa del efecto


La tercera y última explicación del castigo que describiremos también es la más antigua. Thorndike propuso
originalmente que el reforzamiento positivo y el castigo involucran procesos simétricamente opuestos. Así
como el reforzamiento positivo fortalece la conducta, el castigo la debilita.Más tarde abandonó la idea de que el
castigo debilita la conducta pero la creencia de que existe una versión negativa de la ley del efecto que es
comparable pero opuesta a la versión positiva de dicha ley ha sido conservada por otros investigadores
CAPITULO 11
COGNICIÓN COMPARADA I: MECANISMOS DE LA MEMORIA

¿QUÉ ES LA COGNICIÓN COMPARADA?


La palabra cognición proviene del término latín que significa conocimiento o pensamiento y suele emplearse
para referirse a los procesos de pensamiento.
En las conversaciones informales consideramos al pensamiento como la reflexión consciente, voluntaria y
deliberada sobre algún tema, que por lo regular involucra al lenguaje. Otra característica del pensamiento que es
importante para la cognición comparada es el hecho de que puede dar lugar a acciones que no logran ser
explicadas a partir de los estímulos externos que un individuo experimenta en ese momento.

En contraste con los etólogos cognoscitivos, los psicólogos experimentales utilizan el término cognición
comparada en un sentido más restringido. Siguen a H. S. Jennings quien argumentó hace un siglo que “la
evidencia objetiva no puede demostrar la existencia ni la inexistencia de la conciencia, ya que la conciencia es
justamente lo que no puede percibirse de manera objetiva”. Jennings dijo a continuación que “ninguna
afirmación relativa a la conciencia de los animales está abierta a la refutación por medio de la observación y el
experimento”

Los psicólogos experimentales contemporáneos relacionan estrechamente los mecanismos cognoscitivos con
las predicciones conductuales. Eso posibilita que las inferencias cognoscitivas sean refutadas por la evidencia
experimental. Los psicólogos experimentales hacen inferencias acerca de la maquinaria interna o cognoscitiva
que interviene en la conducta en los casos en que son insuficientes los mecanismos E-R o reflejos simples.

PARADIGMAS DE LA MEMORIA ANIMAL

En los estudios del aprendizaje, se enfatiza la fase de adquisición. Los experimentos de aprendizaje se ocupan
del tipo de información que adquirimos y las maneras en que la adquirimos. Por ende, los experimentos de
aprendizaje implican manipulaciones de las condiciones de adquisición. Por lo general en los experimentos de
aprendizaje no se manipula el intervalo de retención, el cual suele ser bastante largo (un día o más), pues los
cambios conductuales de corto plazo no se consideran ejemplos de aprendizaje. Por consiguiente si el énfasis se
centra en las condiciones de adquisición, también se mantienen constantes las condiciones de recuperación. Se
utilizan los mismos procedimientos para evaluar lo que aprendieron todos los participantes en un experimento
determinado.
En contraposición, los estudios sobre la memoria concentran la atención en las fases de retención y de
recuperación.
Los estudios de la memoria también se enfocan en las circunstancias de la recuperación.

Esas distintas formas de prueba implican diferentes condiciones de recuperación.


Los mecanismos de memoria han sido clasificados de distintas formas dependiendo de lo que se recuerda (los
contenidos de la memoria), la duración de la memoria (el intervalo de retención) y los mecanismos
involucrados en ella. Schachter y Tulving (1994) identificaron cinco tipos de aprendizaje y memoria en los
seres humanos: memoria procedimental, memoria perceptual, memoria semántica, memoria primaria o de
trabajo y memoria episódica o declarativa.

Memoria de trabajo y memoria de referencia


Una de las primeras investigaciones experimentales sobre la memoria animal fue la realizada por el psicólogo
estadounidense Walter S. Hunter (1913). Hunter sometió a ratas, perros y mapaches a una sencilla tarea de
memoria. El aparato consistía en un área de salida desde la cual el animal podía entrar a cualquiera de tres cajas
meta. En cada ensayo sólo una de las cajas metas contenía un poco de comida y al inicio del ensayo se encendía
una luz encima de esa caja meta para señalarla. Después que los animales aprendieron a elegir siempre la caja
meta, cuya luz había sido encendida
La memoria de trabajo está en efecto cuando la información sólo tiene que retenerse el tiempo suficiente para
terminar una tarea particular, después de lo cual es mejor descartar la información porque ya no se necesita o
porque puede interferir con la finalización exitosa del siguiente ensayo (como en el experimento de Hunter).

Igualación demorada a la muestra


El procedimiento de igualación demorada a la muestra es quizá la técnica más versátil de que se dispone para el
estudio de la memoria de trabajo. Representa una mejora considerable del procedimiento original de Hunter, ya
que en éste se expone al participante a una señal que identifica la respuesta correcta en un ensayo particular.
Luego se retira ese estímulo antes que se permita al animal realizar la conducta designada.

La igualación a la muestra también es útil para abordar preguntas que van más allá de los mecanismos de
memoria. Izumi y Kojima (2004)

Determinantes procedimentales de la igualación demorada a la muestra


Varios aspectos del procedimiento de igualación a la muestra resultan fundamentales para determinar la
precisión del desempeño. Uno de ellos es la naturaleza del estímulo que se utiliza como muestra. Algunos tipos
de estímulo son más eficaces que otros (Wilkie y Summers, 1982). Otros factores importantes son la duración
de la exposición al estímulo de muestra al inicio del ensayo y el intervalo de demora después de presentar la
muestra.

Según la hipótesis de decaimiento de la huella, el grado en que la memoria de un evento controla la conducta
depende de la fuerza de la huella del estímulo en ese momento. Entre más fuerte sea la huella, más fuerte es el
efecto del estímulo pasado sobre la conducta del organismo.
El incremento del intervalo de demora en el procedimiento de igualación a la muestra reduce la precisión del
desempeño, supuestamente a partir de que la huella del estímulo de muestra es más débil después de demoras
más largas.

Estrategias de respuesta en la igualación a la muestra


El procedimiento de igualación a la muestra se asemeja a un problema de discriminación en cuanto que el
participante tiene que responder ante el estímulo correcto y abstenerse de hacerlo ante el incorrecto para ser
reforzado. Como se describió en el capítulo 8 al examinar lo que se aprende en el entrenamiento discriminativo,
hay distintas formas de resolver esa tarea con dos alternativas. El participante puede hacer la elección correcta
si concentra la atención en el estímulo correcto, si inhibe la conducta ante el estímulo incorrecto o si utilizan
esas dos estrategias de respuesta. En el aprendizaje discriminativo (que establece una memoria de referencia)
los participantes parecen utilizar la estrategia de respuesta combinada. En contraste, quienes participan en la
igualación a la muestra parecen enfocarse, sobre todo, en la elección correcta.

Aprendizaje de reglas generales o específicas


La evidencia revisada indica que en los problemas de igualación a la muestra los animales concentran su
atención en la elección correcta. ¿Qué los lleva a identificar un estímulo como el correcto? Una posibilidad es
que aprendan una regla general del tipo igual a, esa regla podría ser “elige el estímulo que sea igual a la
muestra”. Otra posibilidad es que aprendan una serie de reglas o relaciones estímulo-respuesta específicas.

Las dos estrategias alternativas pueden evaluarse probando la transferencia del desempeño de igualación a
nuevos estímulos. Después del entrenamiento con un grupo de estímulos se presenta otro problema de
igualación con nuevos estímulos de muestra y elección. El aprendizaje de relaciones estímulo-respuesta
específicas no debería facilitar el desempeño con nuevos estímulos,

Memoria espacial en laberintos


El procedimiento de igualación a la muestra puede adaptarse para investigar la forma en que los animales y las
personas recuerdan diversos estímulos. Aunque la técnica que describiremos a continuación tiene una
aplicabilidad más limitada, enfoca la atención en un tipo de memoria muy importante: la memoria de lugares.
Una de las mayores frustraciones de encontrarse en un nuevo lugar es no saber dónde están las cosas. Nos
movemos con soltura en nuestra ciudad pues hemos aprendido cómo están trazadas las calles. Además, cuando
vamos de un lugar a otro podemos recordar dónde hemos estado y qué calles tenemos qué tomar para llegar a
nuestro destino.
El laberinto de agua de Morris
Un procedimiento común que se ha vuelto popular en la investigación neurocientífica de la memoria espacial es
el laberinto de agua de Morris, que lleva el nombre de su inventor (Morris, 1981; Vorhees y Williams, 2006).
El laberinto de agua, que por lo regular se emplea con ratas o ratones de laboratorio, consiste en un tanque
circular con un diámetro aproximado de uno a dos metros (más pequeño para los ratones), que se llena de agua
hasta una altura suficiente para obligar a los sujetos a nadar. En algún punto del tanque, justo por debajo de la
superficie del agua, se sumerge una plataforma. Ni a las ratas ni a los ratones les gusta nadar, de modo que
están motivados para encontrar la plataforma. El agua se tiñe (agregando leche o una pintura no tóxica), de
modo que la plataforma no pueda ser vista por los sujetos que nadan alrededor, esto los obliga a usar señales
espaciales.

El laberinto radial
El laberinto de agua de Morris ha resultado una técnica útil para el estudio de las bases neurales de la memoria
espacial, pero no es una tarea que las ratas o ratones suelan encontrar en su medio natural. Una rata o ratón que
de repente se encuentre en el agua aprenderá muy pronto a evitar una nueva caída en el agua.

En muchos experimentos, una vez que el alimento ha sido consumido en una ubicación, no vuelve a encontrarse
ahí por cierto tiempo hasta que se reabastezca. Por consiguiente, los animales tienen que recordar cuál fue el
último

MECANISMOS DE LA MEMORIA
los procesos de memoria implican tres fases: adquisición, retención y recuperación
Lo que recordamos y lo bien que lo hacemos depende de esas tres fases, a menudo en combinación entre sí.

Mapas cognoscitivos y otros códigos de navegación


Una posibilidad es que el animal haga una lista serial de los brazos del laberinto que visita y que agregue un
elemento a la lista con cada brazo visitado. Dado el excelente desempeño de las ratas en laberintos con 16
brazos o más esto podría implicar una lista más bien larga. El aprendizaje de semejante lista parece poco
probable, ya que incluso a los seres humanos nos resulta difícil mantener tantos elementos a la vez en la
memoria de trabajo. Otra posibilidad es que los animales formen un mapa o representación mental de la
distribución del laberinto y los comederos, y que usen luego este mapa cognoscitivo para decidir a qué brazo
del laberinto entrarán a continuación

La idea de que los animales forman un mapa cognoscitivo que luego orienta su navegación espacial ha sido una
hipótesis importante durante varios años, pero requiere mayor especificación. Los mapas pueden representar
diferentes tipos de información (distancia, altura o topografía, presencia de puntos de referencia particulares,
dirección de la brújula, etcétera).
Afirmar que los animales forman un mapa cognoscitivo no nos dice con precisión qué información contiene
dicho mapa y cómo la utilizan los animales.

El tema que domina en la investigación contemporánea sobre la codificación de la información espacial es la


manera en la cual la información de señales, puntos de referencia, características geométricas y gradientes
espaciales se integra en un mapa cognoscitivo coherente. Los investigadores están examinando la forma en que
el aprendizaje acerca de una característica influye en el aprendizaje sobre otras características espaciales

Codificación retrospectiva y prospectiva

La distinción entre la codificación retrospectiva y prospectiva se ha convertido en el foco de interés de la


cognición comparada por su relevancia para la cuestión del viaje en el tiempo en los animales
Las personas son claramente capaces de viajar en el tiempo en el sentido de que pueden volver a experimentar
hechos pasados o contemplar eventos futuros. De hecho, muchas veces es la reflexión sobre daños pasados y
posibles problemas futuros lo que nos ocasiona el mayor malestar. Tener en mente o recordar un plan para la
acción futura es la esencia de la codificación prospectiva.
El hecho de que la gente conserve esta capacidad cuando envejece o que empiece a mostrar síntomas de la
enfermedad de Alzheimer es de gran interés para la investigación sobre la memoria humana

La retención y el problema del repaso


La segunda fase de los procesos de memoria es la retención. En las tareas para la memoria de trabajo, un tema
importante que atañe a la retención es el repaso, que se refiere a mantener la información en un estado activo,
de fácil acceso para su uso.

Los procesos de repaso fueron investigados primero en la memoria animal, según su relación con el aprendizaje
de nuevas asociaciones. Los modelos de aprendizaje y de memoria por lo general suponen que se forman
asociaciones entre dos eventos (digamos, un EC y un EI) siempre que ambos eventos se repasen al mismo
tiempo

Las demostraciones del olvido dirigido son importantes, pues proporcionan evidencia de que la memoria es un
proceso activo que puede ponerse bajo control del estímulo. La investigación del olvido dirigido en seres
humanos suscitó el interés por encontrar efectos análogos en animales no humanos. ¿Cómo podríamos concebir
un procedimiento para estudiar el olvido dirigido en animales?

Los tres primeros tipos de ensayo permitieron establecer las funciones de la señal de recuerdo (R), la señal de
olvido (O) y la señal de recompensa gratuita.

Recuperación
En la tercera fase de los procesos de memoria, la recuperación, la información almacenada se recobra de modo
que pueda usarse para guiar la conducta. En tanto que los problemas de codificación y repaso se investigan
principalmente con paradigmas de la memoria de trabajo, la investigación sobre la recuperación se ha
concentrado en la memoria de referencia y, más en concreto, en la memoria de las asociaciones aprendidas.

Claves de recuperación y memoria de la conducta instrumental en bebés humanos


Las claves presentes durante la sesión de prueba variaron para diferentes grupos de infantes. Algunos de los
bebés fueron probados en una cuna con el mismo forro de tela que había estado presente en las sesiones de
entrenamiento (grupo igual). Otros fueron probados con el otro forro de tela que era nuevo para ellos (grupo
diferente). Para un tercer grupo, el forro de tela alternativo era familiar pero no había estado presente en los
ensayos de entrenamiento (grupo diferente-familiar). Por último, los bebés de un cuarto grupo fueron probados
sin el forro y podían ver el cuarto de juegos familiar (ninguno-familiar).

Claves contextuales y la recuperación de recuerdos conflictivos


El cambio en el diseño del forro del corralito cambió las claves contextuales del mismo. Por consiguiente, la
investigación de Borovsky y Rovee-Collier fue un estudio sobre el papel de las claves contextuales en la
recuperación de la memoria. En otras partes de esta obra se describieron otros ejemplos de las claves
contextuales en la recuperación de la memoria, por ejemplo, al revisar el tema del control del estímulo
contextual en el capítulo 8 y en relación con la extinción en el capítulo 9.

Las pruebas posteriores de generalización en cada contexto indicaron que la respuesta ante las líneas vertical y
horizontal dependía del contexto en que éstas fueron probadas. En un contexto, la línea vertical producía el
nivel más alto de respuesta; en el otro contexto la línea horizontal producía mayor respuesta. El estudio ilustra
que los organismos pueden retener recuerdos de tendencias de respuesta diametralmente opuestas, cada una
asociada con una clave de recuperación diferente.

La generalidad de los tratamientos recordatorios


Ahora sabemos mucho acerca de la facilitación de la recuperación de la memoria por medio de tratamientos
recordatorios
las claves contextuales son particularmente eficaces para estimular la recuperación de la memoria Además, se
ha encontrado que otros procedimientos recordatorios facilitan el recuerdo, como la exposición al estímulo
incondicionado
la exposición al estímulo condicionado reforzado (EC+) e incluso la exposición al estímulo condicionado no
reforzado (EC-) que estuvo presente durante el entrenamiento Además,los tratamientos recordatorios pueden
emplearse para revertir muchos casos de pérdida de memoria

Los tratamientos
recordatorios pueden contrarrestar los decrementos en la generalización del estímulo que ocurren cuando se
prueba la conducta aprendida en un nuevo contexto

Los genes y el aprendizaje


La biología molecular moderna nos ha proporcionado una gran cantidad de técnicas novedosas que permiten a
los investigadores descubrir los genes que participan en el aprendizaje. Esos estudios han revelado que diversos
mecanismos de aprendizaje dependen de la inducción de códigos genéticos comunes, genes que codifican
algunos universales biológicos que han sido bien conservados a lo largo de la evolución. De la misma manera
en la que los mecanismos que subyacen a la generación de una señal neuronal (el potencial de acción) se
conservan bien entre las especies, también lo hacen los mecanismos que están detrás de la plasticidad sináptica.

La genética moderna también nos ha dado nuevas herramientas para estudiar el papel de la expresión de los
genes en el aprendizaje. Podemos leer el código genético, identificar la posición de los genes relevantes y
manipular experimentalmente la forma en la que operan. Si creemos que una proteína particular desempeña un
papel esencial en el aprendizaje, podemos probar esa idea utilizando ratones en los que se ha eliminado el gen
relevante. Esto nos ofrece una oportunidad única para apreciar los mecanismos moleculares que subyacen al
aprendizaje

Un problema de los estudios con ratones modificados es el que su desarrollo puede no ser normal. Cuando falta
un gen, pueden participar otros mecanismos bioquímicos que ayuden al organismo a compensar esta
deficiencia. Esto podría dar lugar a un cerebro que difiera en varios sentidos de un cerebro normal. El ambiente
neural anormal

El Olvido
El olvido es la otra cara de la memoria. Se dice que mostramos olvido cuando la memoria falla y no podemos
responder de acuerdo con la experiencia y el aprendizaje previo. Sin embargo, como argumentaron Kraemer y
Golding (1997), no debe verse al olvido como la simple ausencia del recuerdo. Más bien, debería considerársele
como un fenómeno importante por derecho propio. El olvido puede ser adaptativo, ya que incrementa la
variabilidad conductual. Si bien dicha variabilidad no es una experiencia grata cuando no se puede recordar
algo en un examen, puede ser útil cuando uno se cambia a un nuevo trabajo o se muda a una nueva ciudad y
tiene que aprender nuevas habilidades. El olvido también puede disminuir la especificidad contextual del
aprendizaje y permitir por ende que la conducta aprendida ocurra en una gama más amplia de situaciones

Interferencia proactiva y retroactiva


Las fuentes más comunes de los problemas de memoria surgen de la exposición a estímulos destacados antes o
después del evento que uno trata de recordar. Por ejemplo, considere el hecho de conocer gente en una fiesta. Si
la única persona a quien conoce es Alicia, seguramente no le resultará difícil recordar su nombre, pero si le
presentan a varias personas antes y después de conocer a Alicia, le resultará mucho más difícil acordarse de su
nombre.

Se llama interferencia
Proactiva a la obstaculización de la memoria. En otros casos, el recuerdo de algo se ve dificultado por la
exposición posterior a una información que compite con dicho recuerdo. En esas situaciones, el estímulo que
interfiere actúa hacia atrás para entorpecer el recuerdo de un evento objetivo precedente, de ahí que se conozca
como interferencia retroactiva a la interrupción de la memoria.

Reconsolidación
El interés por la hipótesis de la consolidación ha sido reavivado por experimentos que muestran que cuando una
memoria bien establecida se reactiva, ésta se vuelve inestable y es de nuevo susceptible a alteraciones
provocadas por agentes amnésicos justo como las memorias recién aprendidas Esos resultados dan lugar a la
posibilidad de que las memorias tengan que ser reconsolidadas después de cada ocasión en que son activadas.
De ser así, eso permitiría que las memorias de largo plazo estuvieran expuestas a todo tipo de modificaciones.
CAPITULO 12
COGNICIÓN COMPARADA II: TEMAS ESPECIALES

ALMACENAMIENTO Y RECUPERACIÓN DE LA COMIDA

Empezamos la revisión de la cognición compleja con la investigación sobre el almacenamiento y recuperación


de la comida. Varias especies de aves y mamíferos almacenan comida en diversos lugares en los momentos de
abundancia y posteriormente visitan esos lugares para recuperar los alimentos almacenados

La conducta de almacenamiento varía considerablemente entre especies, así como dentro de diferentes
poblaciones de la misma especie y se relaciona con factores ecológicos. Por ejemplo, Pravosudov y Clayton
(2002) compararon el almacenamiento y recuperación de comida en dos poblaciones de carboneros de capucha
negra, una que vive en Colorado y otra que habita en Alaska. Si bien el invierno es severo en ambos lugares, el
clima de Alaska es más crudo. Se llevó al laboratorio a carboneros de ambas poblaciones y se les probó en
condiciones similares. Los carboneros de Alaska almacenaron más piezas de comida y mostraron más
eficiencia en su recuperación. También se desempeñaron mejor en una tarea de memoria espacial no
relacionada con el almacenamiento, pero no superaron a los carboneros de Colorado en una tarea de aprendizaje
no espacial.

El almacenamiento y la recuperación de comida implican factores distintos.Primero, es necesario decidir qué


piezas de comida almacenar. No es útil almacenar alimentos perecederos a menos que se vayan a recuperar
pronto. Los alimentos no perecederos no tienen que recuperarse con tanta rapidez. También deben tomar
decisiones para seleccionar dónde almacenar la comida, ya que la ubicación tiene que recordarse en el momento
de la recuperación.

Memoria espacial en el almacenamiento y recuperación de la comida

Los estudios realizados en el laboratorio sobre la recuperación de alijos por lo general se diseñan de modo que
puedan aislarse una o dos variables para permitir un examen detallado de la forma en la cual éstas contribuyen
al almacenamiento y recuperación de comida. Numerosos estudios se han enfocado en preguntas relacionadas
con la memoria y el aprendizaje espacial involucrados,
Antes de aceptar la conclusión de que está involucrada la memoria de ubicaciones espaciales específicas, es
necesario descartar otras posibilidades: una posibilidad es que los pájaros encuentren los alijos buscando al azar
entre posibles escondites. Otra es que almacenen comida sólo en determinados tipos de ubicaciones y que luego
recorran esos lugares preferidos para recuperar las piezas de comida sin recordar específicamente que la
pusieron ahí. También pueden marcar de algún modo los sitios en los que almacenan comida y luego buscar
esas marcas cuando llegue el momento de recuperar el alimento. Otra posibilidad es la de olfatear o ver la
comida almacenada e identificar de ese modo los escondites.

Memoria episódica en el almacenamiento y recuperación de la comida

La memoria episódica es la memoria para eventos o episodios específicos a diferencia de la memoria para
hechos generales o formas de hacer las cosas. Muchos de nosotros podemos recordar cuando pasamos al podio
durante la graduación o cuando asistimos a la boda de un amigo. También tenemos recuerdos de episodios más
comunes, como la vez que conocimos al compañero de cuarto en el dormitorio de la universidad o la primera
cita que tuvimos con alguien. Las memorias episódicas son ricas en detalles. Se puede recordar qué sucedió,
dónde sucedió y cuándo sucedió. Es como revivir la experiencia pasada pero con la conciencia de que fue en el
pasado y de que uno la está recordando.Este es el componente fenomenológico de la memoria episódica.

ESTIMACIÓN TEMPORAL

Los intervalos que son importantes para los sistemas biológicos varían mucho en escala. El ciclo día-noche de
24 horas es uno de los ciclos temporales más importantes para los sistemas biológicos. Otros intervalos
importantes operan en el orden de fracciones de segundo (por ejemplo, los distintos componentes del latido
cardiaco). En los procedimientos de condicionamiento son importantes intervalos en el rango de segundos (y en
ocasiones de minutos). Este tipo de estimación temporal, conocida como estimación de intervalos, ha acaparado
la atención de los investigadores del aprendizaje.

Técnicas para estudiar el control temporal de la conducta

Algunas tareas involucran la estimación de la duración, la cual consiste básicamente en un procedimiento de


discriminación en que el estímulo discriminativo es la duración de un evento. Una vez que la discriminación
temporal está bien establecida, es posible examinar los límites

En los años recientes se ha vuelto popular una variante del procedimiento de pico que implica menos
entrenamiento. En este procedimiento se entrega comida gratuita en un comedero en un tiempo fijo (digamos,
40 segundos) después del inicio de cada ensayo. El sujeto aprende este intervalo predecible y a medida que se
aproxima el momento de la siguiente entrega de comida revisa el comedero cada vez con mayor frecuencia. El
control temporal de la conducta se hace evidente en la frecuencia con que el sujeto mete la cabeza al comedero
más que en las presiones de palanca reforzadas con comida

Propiedades de la conducta controlada temporalmente

Una de ellas atañe a si los organismos responden a los intervalos en términos de sus duraciones absolutas o
relativas. Numerosos estudios han demostrado que los organismos responden a los valores relativos de los
intervalos. Por consecuencia, una discriminación entre tres y nueve segundos es equivalente a una
discriminación entre nueve y 27 segundos. Las tareas son equivalentes si se conserva el valor relativo de los
intervalos.

Modelos de estimación temporal

El tiempo no es una realidad física, es una invención humana que nos ayuda a describir ciertos aspectos de
nuestro entorno. No podemos ver un intervalo, sólo podemos ver los eventos que empiezan y terminan el
intervalo. Dado que el tiempo en sí es una abstracción conductual, los modelos de la estimación temporal
también suelen ser bastante abstractos.

Teoría de la expectativa escalar (TEE) La primera y más influyente explicación de la estimación temporal es un
modelo del procesamiento de la información propuesto por Gibbon y Church (1984) conocido como teoría de la
expectativa escalar (TEE) (Church, 2003). En la figura 12.7 se diagraman diferentes componentes del modelo,
pero dicho modelo está planteado en términos matemáticos más que conceptuales e incorpora la propiedad de
invarianza escalar.
el modelo considera que la conducta controlada temporalmente es resultado de tres procesos independientes: un
proceso de reloj, uno de memoria y otro de decisión.

Teoría conductual de la estimación temporal

La teoría conductual de la estimación temporal se basa en la observación de que en las situaciones en que la
base principal para la entrega de un reforzador es el paso del tiempo surgen conductas sistemáticas relacionadas
con el tiempo. Esas actividades son similares a lo que hace la gente cuando camina de un lado a otro o
tamborilea con los dedos en los periodos en que se ve obligada a esperar.

Osciladores en lugar de marcapasos

Un oscilador se parece más a un péndulo que a un reloj de arena; fluctúa a lo largo de una secuencia predecible
de eventos, una y otra vez. Pasa por ciclos repetidos que tienen un periodo fijo. Diferentes puntos temporales se
asocian con diferentes puntos en el ciclo. Los osciladores pueden operar sobre una escala temporal larga, como
las rotaciones de la Tierra alrededor de su eje, que tienen una periodicidad de 24 horas, o la trayectoria de ésta
alrededor del Sol, que tiene una periodicidad de un año. Los osciladores también pueden operar sobre una
escala temporal corta, como el rebote de un peso sobre un resorte, que puede tener una periodicidad del orden
de un segundo o menos.
APRENDIZAJE DE RELACIONES SERIALES

El tiempo es una característica que está presente en todos los eventos del ambiente; el orden serial es otra. Los
estímulos rara vez ocurren de manera azarosa o independiente uno del otro. Más bien, varios aspectos del
entorno involucran secuencias ordenadas de eventos. Una cosa lleva a la siguiente de una forma predecible. Los
estímulos están organizados en secuencias ordenadas cuando caminamos del extremo de una calle a la
siguiente, cuando tratamos de abrir un paquete o cuando cenamos, del aperitivo al postre. El orden de los
estímulos también es muy importante en el lenguaje.

Posibles bases de las listas seriales de conducta

Aunque una cadena de respuestas puede tener como resultado que se responda de manera apropiada a una serie
de estímulos, en realidad no requiere que se aprenda la secuencia de estímulos o que se forme una
representación mental del orden en que ocurren los estímulos o las respuestas. Las cadenas de respuestas no
necesitan mecanismos cognoscitivos más complejos que las asociaciones E-R. Una estrategia basada en la
cadena de respuestas funciona perfectamente en el campo usual de golf en miniatura, pues los hoyos sucesivos
están distribuidos de forma que uno se ve obligado a pasar por ellos en la secuencia correcta,

¿Qué tendríamos que aprender para responder en la secuencia correcta con una presentación simultánea de los
estímulos? En esta ocasión nos veríamos obligados a aprender algo acerca del orden de los estímulos.
Podríamos arreglárnoslas conociendo el orden de pares sucesivos de estímulos. Podríamos aprender que A es
seguido de B, B es seguido de C y así sucesivamente. Eso sería un con- junto de asociaciones E-E
independientes (A-B, B-C, C-D, etcétera). Este tipo de mecanismo se conoce como aprendizaje de pares
asociados. Una vez que conocemos los pares asociados correctos, sabemos que después de jugar el hoyo A
debemos seguir con B; que después de jugar B debemos continuar con C, y así sucesivamente hasta completar
la partida. Obviamente, aprender algo más que el solo orden de pares sucesivos de estímulos también nos
permitiría realizar la tarea con precisión.

Pruebas con subconjuntos después del entrenamiento con la presentación simultánea de los estímulos

El procedimiento de cadena simultánea resultó ser una técnica muy adecuada para el estudio de la cognición
compleja en organismos no verbales. Por ejemplo, Terrace, Son y Brannon (2003) enseñaron a monos a
responder a cuatro cadenas simultáneas de siete elementos, las cuales podrían ser representadas como
A1A2A3...A7, B1B2B3...B7, C1C2C3...C7 y D1D2D3...D7. Después que los monos estaban respondiendo con
altos niveles de precisión en cada serie de siete elementos, se realizaron pruebas con varios pares de estímulos.
Como era de esperar, el desempeño fue bastante preciso cuando los dos estímulos de un par provenían de la
misma lista (A3A5 o C2C6); lo notable es que los monos también respondían con una precisión de alrededor de
90% cuando los dos estímulos de un par de prueba provenían de listas diferentes.

El estudio del aprendizaje de relaciones seriales no sólo nos inform a sobre el aprendizaje y la memoria de listas
de elementos. También está abriendo la oportunidad de estudiar las bases cognoscitivas de la aritmética
El conocimiento aritmético se construye sobre un orden serial abstracto que pone al uno antes del dos, el cual
va antes de tres y así sucesivamente. Cuando los monos respondían a un icono específico como el quinto de una
serie, en esencia nos estaban diciendo que sabían el orden de los iconos.

CATEGORIZACIÓN Y APRENDIZAJE DE CONCEPTOS

Los estímulos que varían en sus propiedades físicas pueden ser agrupados por medio de la categorización o
aprendizaje de conceptos. Por ejemplo, considere su sillón favorito en la sala. Cada vez que lo ve, la entrada
sensorial que recibe varía dependiendo de la iluminación de la sala, de si lo ve desde la parte frontal o trasera y
de la distancia a la que se encuentre. Otras variaciones provienen de si está viéndolo o si está sentado en él y
experimente su firmeza y forma. En lugar de tratar cada visión única del sillón como una entidad separada,
formamos una categoría perceptual que incluye todas las distintas visiones y las tratamos como equivalentes en
la identificación de un sillón en particular.

Mecanismos del aprendizaje de conceptos perceptuales

El aprendizaje de conceptos perceptuales es un fenómeno bien establecido. Sin embargo, sigue siendo tema de
un acalorado debate la forma en la cual los animales lo consiguen (Lazareva y Wasserman, 2008). El tema es
difícil debido a la complejidad de los estímulos involucrados. Las ilustraciones que incluían un árbol o parte de
un árbol en el experimento de Herrnstein y sus colaboradores (1976) diferían en muchos aspectos. ¿Qué
aspectos de las fotografías de los árboles llevaron a las palomas a clasificarlas de manera diferente a las
fotografías que no contenían árboles? ¿Cuál era el elemento crucial, los colores, formas o texturas específicos
de las fotografías o la brillantez o nitidez general de las fotografías? Es difícil saberlo a partir del examen de las
ilustraciones.

De acuerdo con la teoría de los rasgos, los participantes usan características visuales comunes a los miembros
de una categoría para determinar con precisión un conjunto de imágenes complejas.
Esas características visuales pueden ser una pequeña parte de la imagen (una curva en una línea o una mancha
de color) o aspectos más globales de la escena (brillantez o contraste general).
Los primeros investigadores del aprendizaje de conceptos perceptuales rechazaron la teoría de los rasgos, ya
que les resultaba difícil identificar las características o combinaciones de características esenciales en las
fotografías de escenas naturales en que se basaban sus sujetos.Sin embargo, las teorías de los rasgos han
regresado alentadas por los resultados de experimentos en que se utilizan estímulos de prueba cuidadosamente
diseñados que incluyen propiedades estadísticas preestablecidas o características del estímulo que han sido
modificadas por medio de distorsiones, desvanecimiento u otras manipulaciones

Aprendizaje de conceptos de nivel superior

Hasta aquí hemos analizado las categorías perceptuales de nivel básico que corresponden a la nominación de
objetos como sillas y flores. Las sillas y las flores también pueden categorizarse en términos de un concepto de
nivel superior: artificial contra natural. Estudios realizados con palomas y otros animales han demostrado la
categorización de nivel superior (Roberts y Mazmanian, 1988).
De hecho, los animales pueden aprender a categorizar estímulos a nivel básico y supraordinado al mismo
tiempo.

Aprendizaje de conceptos abstractos

Las categorías supraordinadas como natural contra artificial son bastante abstractas, pero se refieren a objetos
del mundo real. También tenemos conceptos que son del todo cognoscitivos, es decir, sólo existen en nuestra
mente y no tienen referentes en el mundo físico. Por ejemplo, considere el concepto de igual contra diferente.
Esos no son atributos de objetos en el mundo real. Una silla no puede describirse como igual o diferente. Esos
términos se refieren a un juicio que hacemos al comparar dos objetos o imágenes.

Potrebbero piacerti anche