Sei sulla pagina 1di 84

Tema 2: Aprendizaje de un solo estmulo: Habituacin y sensibilizacin

LA NATURALEZA DE LA CONDUCTA ELICITADA


Todos los animales reaccionan a los eventos que tienen lugar en su entorno (comida en la boca= sabor, polvo en el ambiente = estornudo, superficie caliente = retirar la mano). Gran parte de la conducta tiene lugar como respuesta a los estmulos, es decir, ocurre de forma elicitada (se quiera o no) El concepto de reflejo Un reflejo conlleva un estmulo elicitante y su correspondiente respuesta. La especificidad de la relacin entre un estmulo y su respuesta refleja es una consecuencia de la organizacin del sistema nervioso. En los vertebrados, los reflejos simples suelen estar mediados por tres neuronas: 1. Neurona sensorial o aferente: la activa el estimulo ambiental y transmite el mensaje sensorial a la mdula espinal. 2. Neurona motora o eferente: el impulso neural se transmite a la neurona motora que activa el msculo involucrado en la respuesta refleja. 3. Interneurona: comunica los impulsos entre la neurona sensorial o aferente y la motora o eferente. La neurona sensorial y la motora rara vez se comunican directamente.

Determinadas neuronas sensoriales se conectan al conjunto correspondiente de neuronas motoras, este cableado hace que una respuesta refleja est elicitada nicamente por un conjunto limitado de estmulos. El conjunto formado por la neurona sensorial o aferente, la Interneurona y la neurona motora o eferente constituye el arco reflejo Arco reflejo: Estructura neural que consiste en una neurona aferente o sensorial, una Interneurona y una neurona eferente o motora y que permite que un estmulo pueda elicitar una respuesta refleja. En vertebrados el arco reflejo representa el nmero mnimo de conexiones neurales necesarias para que tenga lugar el acto reflejo, aunque puede haber ms estructuras.

Incluso los reflejos sencillos pueden estar influidos por el sistema nervioso superior. Los reflejos contribuyen al bienestar del organismo (supervivencia). Los reflejos constituyen la mayora de la conducta de los recin nacidos (reflejos de succin, reflejo de oclusin respiratoria (inclina la cabeza hacia atrs y si no funciona llora porque el llanto requiere una vigorosa expulsin de aire, el suficiente para eliminar la oclusin)) Pautas de accin modal Algunas formas de conducta elicitada tienen lugar nicamente en una especie o en un grupo de especies relacionadas (succin en mamferos, picoteo en gaviotas...) aunque ambas especies dependen de la alimentacin de sus padres lo hacen de modo distinto. A las secuencias de respuestas tpicas de especies particulares, como las que aparecen en las cras, se las llama pautas de accin modal o PAMs Pauta de accin modal: patrn de respuesta exhibido de forma similar por la mayora de los miembros de una misma especie. Las pautas de accin modal se utilizan como unidades bsicas de conducta en las investigaciones etolgicas del comportamiento. Una caracterstica importante de las pautas de accin modal es que el umbral de estimulacin necesario para que estas se pongan en marcha vara en funcin de las circunstancia. El mismo estmulo puede tener efectos diversos dependiendo del estado fisiolgico del animal y de las acciones que haya realizado recientemente. Las pautas de accin modal fueron originalmente identificadas por los etlogos (cientficos interesados en la evolucin del comportamiento). Los primeros etlogos como Lorenz o Tinbergen se refirieron a los patrones propios de cada especie como pautas de accin fija enfatizando as que dichas actividades tenan lugar de forma similar en todos los miembros de la especie. Observaciones posteriores indicaron que no se realizan siempre igual, debido a esa variabilidad ahora se utiliza el trmino pautas de accin modal Estmulos elicitantes de las pautas de accin modal Los estmulos elicitantes pueden identificarse fcilmente en los reflejos simples (sobresaltarse ante un ruido), pero es ms difcil de aislar en interacciones sociales complejas (el polluelo de gaviota arenquera ha de picotear el pico de su progenitor para que regurgite la comida, la respuesta a qu es lo que estimula ese picoteo del polluelo no puede determinarse por simple observacin ya que ese picoteo puede deberse a varias razones (color, forma, longitud, ruido...). Tinbergen y Perdeck (1950) estudiaron sobre esos motivos utilizando modelos artificiales y demostraron que un modelo artificial debe reunir diversas caractersticas para provocar la respuesta de picoteo. Esos rasgos especficos que se requieren para elicitar la conducta se llaman estmulo seal o estimulo desencadenante. Estimulo seal o desencadenante: Rasgo especfico de un objeto o animal que elicita una pauta de accin modal en otros organismos. Un estmulo seal o desencadenante es suficiente para elicitar una pauta de accin modal. Sin embargo, una determinada pauta de accin modal puede estar controlada por

varios rasgos del estmulo de forma aditiva. Adems, el estimulo que elicita con mayor efectividad la pauta de accin no tiene porque ser el que ocurra con mayor probabilidad en condiciones naturales (ver estudio de Baerends y Drent sobre la conducta de la recuperacin de huevos de la gaviota arenquera. Pgina 33 del manual). Cuando se identifican los rasgos que provocan la respuesta elicitada es posible combinarlos para fabricar un objeto que sea ms efectivo que el propio objeto natural como elicitador de la pauta de accin. Estos estmulos inusualmente efectivos reciben el nombre de estmulos supranormales Estmulo supranormal: Estmulo seal artificialmente agrandado o exagerado que elicita una respuesta inusualmente vigorosa. La organizacin secuencial de la conducta Las respuestas no tienen lugar aisladas unas de otras, sino que las acciones individuales se organizan en secuencias efectivas. Toda conducta motivada o dirigida a metas, ya sea buscar comida, encontrar pareja etc, involucra secuencias de acciones sistemticamente organizadas. Los etlogos llamaron conducta apetitiva a los primeros componentes de la secuencia de comportamiento y conducta consumatoria a los ltimos. Por ejemplo, masticar y tragar consuman la bsqueda de comida (consumacin, conclusin). Las respuestas consumatorias tienden a ser pautas de accin modal especficas de la especie. Las conductas apetitivas, por el contrario, son ms variables dependiendo del entorno (diferentes formas de cocinar de cada etnia: conducta apetitiva, todas mastican y tragan del mismo modo: conducta consumatoria) Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural de conducta y que sirve para poner al organismo en contacto con un estmulo desencadenante. Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia natural de conducta. Las respuestas consumatorias son, por lo general, patrones de accin modal especficos de la especie. Los tericos del aprendizaje estn tomando cada vez mayor conciencia de la importancia de considerar las secuencias de conducta naturales. Al estudiar cmo los animales obtienen comida, por ejemplo, es normal considerar que la secuencia de respuestas de bsqueda de comida comienza por un modo de bsqueda general (sin una localizacin espacial concreta), seguido de un modo de bsqueda focalizada (especificidad espacial) (se busca slo donde hay indicios que se encuentra la comida que se busca y se obvia lo dems), y termina con un modo de manipulacin del alimento (una vez encontrada la comida deseada se llega a la conducta consumatoria (masticar y tragar)) Modo de bsqueda general: Primer componente de la secuencia de conducta de alimentacin, en la que el organismo pone en marcha una conducta motora sin direccin fija. La bsqueda general es una forma de conducta apetitiva. Modo de bsqueda focalizada: Segundo componente de la secuencia de conducta de alimentacin, tras la bsqueda general, en el que el organismo pone en marcha una

conducta centrada en la localizacin de un estmulo particular que indica la presencia de alimento. La bsqueda focalizada es una forma de conducta apetitiva ms directamente relacionada con el alimento que la bsqueda general. Modo de manipulacin del alimento: ltimo componente de la secuencia de conducta de alimentacin en el que el organismo manipula y consume el alimento. Es similar a lo que los etlogos llaman conducta consumatoria.

EFECTOS DE LA ESTIMULACIN REPETIDA


Contrariamente a los presupuestos de Descartes (pensaba que una respuesta refleja ocurre del mismo modo siempre que se le presenta el estimulo elicitante), la conducta elicitada no es inmutable. Uno de los rasgos ms caractersticos de la conducta elicitada es su plasticidad. Ni siquiera las respuestas elicitadas simples ocurres de la misma manera en todas las ocasiones.

Atencin visual en los bebs humanos


Las claves visuales elicitan una respuesta de observacin, que puede medirse por el tiempo que los bebes mantienen sus ojos en un objeto antes de mirar a otra parte. La atencin visual provocada por un estmulo novedoso cambia a mediada que el beb se familiariza con el estmulo la naturaleza del cambio est determinada por la naturaleza del estmulo (en un patrn 4x4 de un tablero de ajedrez la atencin visual se reduce ms rpido que en uno de 12x12 donde la atencin primero se incremente y despus se reduce) La tarea de agudeza visual puede proporcionar informacin sobre la agudeza visual. El procedimiento tambin se ha adaptado para estudiar una amplia variedad de cuestiones complicadas sobre la cognicin infantil.

Salivacin y evaluacin del sabor en humanos


El sabor de la comida elicita la salivacin como respuesta refleja. Esto puede observarse tan claramente en las personas como en los perros de Pavlov. En un estudio, se midi la respuesta de salivacin de ocho mujeres ante el sabor del zumo de limn y del zumo de lima. A medida que el estmulo se repeta diez veces, perda eficacia para elicitar tanto las respuestas de salivacin como las hednicas. En el Ensayo 11, se cambi el sabor (a lima para los sujetos que previamente haban sido expuestos al limn y a limn para los sujetos que haban sido expuestos a lima). Esto produjo una impresionante recuperacin tanto del reflejo salival como de la evaluacin hednica. Curiosamente, esta recuperacin persisti en el Ensayo 12, en el que se presento el sabor original. Las personas encuentran el sabor de una comida especfica menos placentera cuanto ms la comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la valoracin hednica de una comida familiar. Estos hallazgos sugieren que la sobrealimentacin puede reducirse no variando los alimentos disponibles para su consumo

Respuesta de sobresalto en ratas


La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies, incluida la humana. Consiste en un salto repentino y una contraccin de los msculos de la parte superior del cuerpo, con frecuencia acompaado de una elevacin de los hombros. En las ratas, la respuesta de sobresalto puede medirse situando al animal en una cmara estabilimtrica (una pequea cmara descansa sobre unos sensores de presin. Estos sensores detectan los movimientos repentinos de la rata, que se registran en un ordenador). Cuando el animal se sobresalta, da un salto haciendo que la cmara se mueva. Los sensores de presin situados bajo la cmara miden con precisin estos movimientos, que se usan como indicadores de la intensidad de la reaccin de sobresalto. La reaccin de sobresalto puede elicitarse en ratas por medio de toda una variedad de estmulos, incluyendo tonos y luces breves. La presentacin repetida del estmulo elicitante no siempre produce la misma respuesta. En un estudio, las ratas expuestas a un ruido ambiental suave, las repeticiones del tono provocaron una reaccin de sobresalto cada vez ms dbil. Por el contrario, cuando el ruido era intenso, las repeticiones del tono provocaron reacciones de sobresalto cada vez ms vigorosas.

LOS CONCEPTOS DE HABITUACIN Y SENSIBILIZACIN


La presentacin repetida de un estmulo elicitante puede provocar tanto disminuciones como incrementos en la respuesta. Las disminuciones de la tendencia a responder producidas por la estimulacin repetida reciben el nombre tcnico de efecto de habituacin. Los incrementos de la tendencia a responder se llaman efecto de sensibilizacin. Efecto de habituacin: Disminucin progresiva en el vigor de la conducta elicitada que puede tener lugar con la presentacin repetida del estmulo elicitante. Efecto de sensibilizacin: Incremento en el vigor de la conducta elicitada que puede resultar de la presentacin repetida del estmulo elicitante o de la exposicin a un estmulo externo intenso. Los efectos de la habituacin y sensibilizacin son dos tipos bsicos de cambios conductuales que resultan de la experiencia previa. Son rasgos tan fundamentales del ajuste de los organismos al entorno que tiene lugar en todas las especies y en todos los sistemas de respuesta. Los efectos de habituacin y sensibilizacin pueden ocurrir en cualquier situacin que conlleve la exposicin repetida a un estimulo. La consideracin de estos efectos es crtica para los estudios de aprendizaje. Tambin juegan un papel importante en el condicionamiento operante.

Adaptabilidad y generalidad de la habituacin y la sensibilizacin Los fenmenos de habituacin y sensibilizacin son el producto final de procesos que ayudan a organizar y focalizar la conducta en el catico mundo de estmulos en el que los organismos viven. En la experiencia humana cotidiana existen numerosos ejemplos de habituacin y sensibilizacin, por ejemplo, cuando visitamos un lugar nuevo o conocemos a una persona, es probable que prestemos atencin a todo tipo de estmulos que normalmente ignoramos. Es probable que ignoremos estos detalles en los sitios o con las personas familiares. Diferencias entre habituacin, adaptacin sensorial y fatiga Para entender otras fuentes alternativas de disminuciones en la respuesta, volvamos al concepto de reflejo. Un reflejo consta de tres componentes: 1. Un estmulo activa uno de los rganos sensoriales, como los ojos o los odos. Esto genera impulsos neuronales que se envan al sistema nervioso central (medula espinal y cerebro). 2. Transmisin de los mensajes sensoriales a los nervios motores a travs de las interneuronas. 3. Los impulsos nerviosos de los nervios motores activan los msculos dando lugar a la respuesta observable. Dados estos tres componentes de un reflejo, existen varias razones por las cuales una respuesta elicitada puede no ocurrir (p.e quedar cegado temporalmente por una luz brillante).

Tales disminuciones en la sensibilidad reciben el nombre de adaptacin sensorial, que es distinta de la habituacin. La respuesta tampoco tendr lugar si los msculos involucrados quedan incapacitados por la fatiga. La adaptacin sensorial y la fatiga impiden la respuesta a nivel de los rganos sensoriales y de los msculos, sin la intervencin del sistema nervioso. Por tanto, pueden distinguirse de la habituacin. Adaptacin sensorial: Reduccin temporal en la sensibilidad de los rganos sensoriales provocada por la estimulacin repetida o excesiva. Fatiga: disminucin temporal de la conducta causada por el uso repetido o excesivo de los msculos involucrados en la conducta. Se asume que la habituacin y la sensibilizacin conllevan cambios neurofisiolgicos que dificultan o facilitan la transmisin de los impulsos neurales desde las neuronas sensoriales a las motoras. En la habituacin, el organismo deja de responder a un estmulo aunque mantiene la capacidad de percibirlo y de realizar los movimientos

musculares requeridos por la respuesta. La respuesta no tiene lugar debido a que los cambios en el sistema nervioso bloquean la transmisin del impulso nervioso a las neuronas motoras. En los estudios sobre habituacin, la adaptacin sensorial puede descartarse ya que existe evidencia de que la habituacin es especfica de la respuesta. Un organismo puede dejar de responder a n estmulo con un aspecto de su conducta, mientras que contina respondiendo al mismo de otras formas. La fatiga tambin puede descartarse como causa de la habituacin por medio de evidencia que muestra que la habituacin es especfica del estmulo. Una respuesta habituada se recupera rpidamente cuando se introduce un estmulo novedoso.

Teora del proceso dual de la habituacin y la sensibilizacin


Los efectos de habituacin y sensibilizacin son cambios en la conducta o en la ejecucin. La teora del proceso dual propuesta por Groves y Thompson (1970) contina siendo la principal teora sobre la habituacin y la sensibilizacin. La teora del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estmulo son producto de procesos neurales diferentes. Uno de estos procesos neurales es el proceso de habituacin, provoca una disminucin en la tendencia a responder. Otro, el proceso de sensibilizacin, produce un incremento en la tendencia a responder. Estos procesos no son mutuamente excluyentes, el resultado conductual depende de qu proceso sea mas fuerte.

Proceso de habituacin: mecanismo neural activado por la repeticin de un estmulo que reduce la magnitud de las respuestas elicitadas por ese estmulo.

Proceso de sensibilizacin: mecanismo neural que incrementa la magnitud de las respuestas elicitadas por un estmulo. El cambio observable en la respuesta elicitada representa siempre el efecto neto de los procesos de habituacin y sensibilizacin. Que el resultado neto sea un incremento o una disminucin en la conducta depende de cul de los procesos subyacentes sea ms fuerte en una situacin particular. La distincin entre efectos y procesos en la habituacin y la sensibilizacin es anloga a la distincin entre ejecucin y aprendizaje. Los efectos hacen referencia a la conducta observable, y los procesos se refieren a los mecanismos subyacentes. Basndose en la investigacin neuropsicolgica, Groves y Thompson (1970) sugirieron que los procesos de habituacin y sensibilizacin tienen lugar en diferentes partes del sistema nervioso. Se asume que los procesos de habituacin tienen lugar en el sistema E-R, que consiste en el camino neural ms corto que conecta los rganos sensoriales activados por el estmulo elicitante los msculos involucrados en la produccin de la respuesta elicitada. El sistema E-R puede ser concebido como el arco reflejo. Cada presentacin de un estmulo elicitante activa el sistema E-R y causa un incremento en la habituacin. Se asume que los procesos de sensibilizacin tienen lugar en el sistema de estado. Este sistema abarca otras partes del sistema nervioso que determinan el nivel general de disposicin o tendencia a responder de un organismo. A diferencia del sistema E-R, que se activa cada vez que se presenta el estmulo elicitante, el sistema de estado se activa nicamente con eventos excitadores. Por ejemplo, permanece relativamente inactivo durante el sueo. Las drogas pueden alterar el funcionamiento del sistema de estado y, por tanto, afectar a la tendencia a responder. El aumento de la reactividad que acompaa al miedo est causado por la activacin del sistema de estado. En resumen, el sistema de estado determina la tendencia general de un organismo a responder, mientras que el sistema E-R permite al animal dar la respuesta especfica al estmulo relevante. Los cambios en la conducta que tienen lugar por la repeticin de un estmulo reflejan la accin combinada de los sistemas E-R y de estado. Aplicaciones de la teora del proceso dual: los ejemplos de habituacin y sensibilizacin que se muestran en la evidencia anteriormente mencionada pueden ser fcilmente interpretados en trminos de la teora del proceso dual. La exposicin repetida al patrn de tablero de ajedrez 4x4 produjo una disminucin en la respuesta de orientacin visual de los bebs, posiblemente porque no provocaba mucha activacin. De hecho el estimulo 4x4 activ principalmente e sistema E-R y, por tanto, el proceso de habituacin. El patrn de tablero 12x12 produjo un mayor nivel de activacin.

Probablemente activ, no slo el sistema E-R, sino tambin el sistema d estado. La activacin del sistema de estado produjo un incremento en la atencin visual despus de la primera presentacin del patrn 12x12. Sin embargo, la activacin o el proceso de sensibilizacin no fue lo suficientemente fuerte para contrarrestar completamente los efectos de la habituacin. Como resultado, despus de unos cuantos ensayos, la atencin visual tambin declin en respuesta al estmulo 12x12. Los efectos de habituacin y sensibilizacin de la respuesta de sobresalto en ratas requieren una aplicacin diferente de la teora del proceso dual. Cuando se someti a prueba a las ratas con un ruido suave no haba nada que las activara. Por tanto podemos asumir que los procedimientos experimentales no produjeron cambios en el sistema de estado. La presentacin repetida del tono elicitador de sobresalto activaba tan solo el sistema E-R , lo que dio lugar a la habituacin de respuesta de sobresalto. El resultado contrario tuvo lugar cuando los animales fueron puestos a prueba en presencia de un rudo fuerte. Con las sucesivas presentaciones del tono aparecieron reacciones de sobresalto ms enrgicas. Dado que en ambos grupos se utiliz idntico tono, la diferencia en los resultados no puede ser atribuida al mismo debemos asumir que en segundo grupo el ruido ambiental intenso increment el nivel de activacin o la tendencia a responder. Esta sensibilizacin del sistema de estado fue probablemente la causa del incremento en la reaccin de sobresalto al tono en el segundo grupo.

HABLAR CON UN FETO O CON UN BEB


La habituacin y la sensibilizacin no requieren habilidades verbales. Estas formas de plasticidad conductual son, por tanto, muy tiles en los estudios sobre habilidades perceptivas y cognitivas de los fetos y de los bebes que an no han adquirido el lenguaje. Kaplan, Godstein, Huckeby y Cooper (1995) investigaron si los bebs de 4 meses podan percibir la diferencia entre el habla de la madre dirigida hacia el beb o hacia otros adultos. Como estmulo registraron a una madre diciendo una frase. En una de las grabaciones, las palabras estaban dirigidas hacia el beb. En la otra, se pidi a la madre que dijera las palabras como si estuviese hablando con otro adulto. Los resultados muestran que los bebes pueden comunicar la diferencia entro dos tipos de discurso hablado que encontraban ms estimulante el discurso dirigido al beb. Implicaciones de la teora del proceso dual: los sistemas de estado y E-R se activan de forma diferente por la presentacin repetida de un estmulo. El sistema E-R se activa siempre que un estmulo elicita una respuesta ya que es el circuito neural que lleva los impulsos desde la entrada sensorial hasta la salida conductual. Por el contrario, el sistema de estado solo interviene en circunstancias especiales. La teora del proceso dual de la habituacin y la sensibilizacin ha tenido una gran influencia en el estudio de la plasticidad de la conducta elicitada.

Una de las contribuciones ms importantes de la teora ha sido el presupuesto de que la conducta elicitada puede estar fuertemente influenciada por los eventos neuropsicolgicos que tienen lugar fuera del arco reflejo directamente involucrado en una respuesta elicitada particular. En la teora del procesamiento dual, se asume que el sistema de estado modula la actividad de los arcos reflejos.

CARACTERSTICAS DE LA HABITUACIN Y LA SENSIBILIZACIN


Aunque las caractersticas de la habituacin y la sensibilizacin no son perfectamente uniformes en todas las especies y sistemas de respuesta, hay muchos aspectos comunes. Curso temporal la mayor parte de los cambios conductuales que se describen en los captulos posteriores se mantienen durante periodos largos, una caracterstica definitoria de los fenmenos de aprendizaje, no todos los casos de habituacin y sensibilizacin pueden considerarse en rigor muestras de aprendizaje duradero. Curso temporal de la sensibilizacin: por lo general, los procesos de sensibilizacin tienen efectos temporales. Aunque en algunos casos la sensibilizacin persiste durante ms de una semana, el incremento en la tendencia a responder tiene normalmente una vida corta. En todos los sistemas de respuesta la duracin de los efectos de sensibilizacin est determinada por la intensidad del estmulo. Los estmulos ms intensos producen mayores incrementos en la tendencia a responder y una sensibilizacin ms persistente. Curso temporal de la habituacin: la persistencia de la habituacin tambin es variable. En el caso de la sensibilizacin las diferencias en el curso temporal del efecto se deben normalmente a diferencias cuantitativas. Pero el mecanismo subyacente es el mismo. Por el contrario, hay dos tipos de efecto de habituacin cualitativamente distintos: 1. La habituacin a corto plazo se parece a la mayora de los casos de sensibilizacin en que se disipa relativamente rpido (segundos o minutos) 2. La habituacin a largo plazo persiste durante muchos das. La recuperacin espontnea es la principal caracterstica del efecto de la habituacin a corto plazo. Recuperacin espontnea: recuperacin de una respuesta habituada o de una respuesta extinguida tras un periodo de descanso. La presentacin repetida de un estmulo no siempre da lugar conjuntamente a habituacin a corto y a largo plazo. La recuperacin espontnea nunca es completa en las situaciones que conllevan efectos de habituacin a largo plazo.

La habituacin a corto plazo suele tener lugar cuando el estmulo elicitante se presenta frecuentemente. La habituacin a largo plazo es ms probable cuando las presentaciones del estmulo estn ms separadas. La teora del proceso dual de la habituacin y la sensibilizacin se formul para explicar solo los efectos a corto plazo, y, por tanto, no puede explicar por qu la habituacin dura considerablemente ms en ciertas condiciones. La explicacin ms aceptada de la habituacin a largo plazo es la teora de la activacin de Wagner.

Especificidad del estmulo


Especificidad del estimulo en la habituacin: la habituacin es especfica del estmulo que ha sido presentado repetidamente. Una respuesta a un estmulo previamente habituada puede manifestarse plenamente alterando alguna caracterstica importante del estimulo (experimento de habituacin de la salivacin y de la evaluacin hednica en respuesta a un sabor) (despus que nos hemos habituado al repiqueteo de un reloj de pared, es probable que volvamos a prestar atencin al reloj si funciona mal y hace un sonido nuevo). Despus de que la respuesta de orientacin a un estmulo se ha habituado completamente, dicha respuesta se manifestara en su intensidad habitual si se presenta un estmulo suficientemente novedoso. La especificidad del estmulo se ha considerado como una de las caractersticas definitorias de la habituacin. Aunque la habituacin es especfica de un estmulo, puede darse cierta generalizacin, si nos hemos habituado a un determinado sonido del reloj, es posible que tampoco respondamos al sonido de otro reloj similar. Este fenmeno recibe el nombre de generalizacin del estimulo de la habituacin. Sin embargo, a pesar de la generalizacin del estmulo de la habituacin, a medida que los estmulos de prueba se hacen progresivamente diferentes del estmulo habituado, el organismo mostrar una menor habituacin o supresin de la respuesta ante dichos estmulos. Especificidad del estmulo en la sensibilizacin: a diferencia de la habituacin, la sensibilizacin no es muy especfica del estmulo. Si un animal se activa o sensibiliza por alguna razn, su reactividad se incrementar para toda una variedad de estmulos (el malestar gstrico y las nuseas incrementa la reactividad de las ratas a un amplio rango de nuevos sabores).

Efecto de un estmulo externo intenso


Un cambio en la naturaleza del estmulo elicitante puede dar lugar a la recuperacin de una respuesta habituada. Sin embargo, la respuesta habituada tambin puede restablecerse sensibilizando al organismo con la exposicin a un estmulo externo. Este fenmeno recibe el nombre de deshabituacin.

Deshabituacin: recuperacin de una respuesta habituada como resultado de la presentacin de un estimulo externo e intenso. Es importante tener presente que la deshabituacin hace referencia a la recuperacin de la respuesta al estmulo previamente habituado. La respuesta directa al tono utilizado para deshabituar o sensibilizar carece de inters.

APLICACIN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA


La exposicin de los cambios producidos por la repeticin de un estmulo elicitante pueden provocar emociones complejas (miedo, euforia...) Reacciones emocionales y sus efectos posteriores En su revisin de ejemplos de respuestas emocionales a varios estmulos, incluyendo drogas, Solomon y Corbit (1974) destacaron dos rasgos llamativos: 1. Las reacciones emocionales intensas a menudo constan de dos fases: una emocin tiene lugar durante la presentacin del estmulo elicitante, la opuesta se observa cuando el estmulo desaparece (efecto psicoactivo del alcohol: primero alegre y relajada, cuando los efectos desaparecen viene la resaca). La reaccin primaria y su postefecto dependen de la dosis de la droga. 2. Otra caracterstica comn de las reacciones emocionales es que cambian con la experiencia. La reaccin primaria se hace ms dbil y su postefecto se hace ms fuerte. La habituacin de la primera reaccin a la droga se llama tolerancia a la droga, lo que hace referencia a la disminucin en la efectividad de una droga con las exposiciones repetidas (una cantidad que podra emborrachar ligeramente a un bebedor ocasional puede no tener efecto alguno en un bebedor habitual) Tolerancia a la droga: reduccin en la efectividad de una droga como resultado del uso repetido de la droga. Debido al desarrollo de la tolerancia, los consumidores habituales de drogas a veces no disfrutan tanto de su consumo como los consumidores novatos. Solomon y Corbit (1974) destacaron que se producen patrones de reaccin emocional similares con otros estmulos emocionales como el amor y el apego (los recin casados suelen sentirse emocionados el uno con el otro, pero esta reaccin primaria se habita con el tiempo). Adems la habituacin de la reaccin emocional primaria va acompaada de un fortalecimiento des postefecto afectivo (las parejas que han estado juntas muchos aos sufren ms intensamente la separacin por muerte o enfermedad que los recin casados). Este postefecto afectivo es llamativo, ya que en esta fase de la relacin la pareja bien puede haber dejado de mostrar cualquier signo de afecto.

La teora del proceso oponente


Tres caractersticas comunes de las reacciones emocionales:

1. Las reacciones emocionales son bifsicas; a una reaccin primaria sigue un postefecto opuesto. 2. La reaccin primaria se debilita con la estimulacin repetida. 3. El debilitamiento de la reaccin primaria va acompaado por un fortalecimiento del postecto. La teora del proceso oponente de Solomon y Corbit se dise para explicar estos tres rasgos caractersticos de las emociones. La teora del proceso oponente asume que los mecanismos neurofisiolgicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional. As pues, la teora del proceso oponente es una teora homeosttica. Se basa en la premisa de que una funcin importante de los mecanismos que controlan la conducta emocional es minimizar las desviaciones con respecto a la neutralidad o estabilidad emocional. Mantener cualquier sistema estable o neutral requiere que las perturbaciones que mueven el sistema en una direccin se encuentren con una fuerza opuesta que compense la perturbacin. El concepto de fuerzas opuestas es central para la teora del proceso oponente. La teora asume que un estimulo emocional activador desva de la neutralidad el estado emocional de una persona. Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente que compensa el cambio. Los patrones de conducta emocional observados tanto inicialmente como despus de la experiencia repetida con un estmulo son el resultado neto de los procesos oponentes de los cambios en los mismos como resultado de la experiencia. La teora del proceso oponente asume que la presentacin de un estmulo emocional activador elicita inicialmente lo que se denomina el proceso primario, o proceso a que es el responsable de la naturaleza del estado emocional, (por ejemplo felicidad) que tiene lugar en presencia del estimulo. El proceso primario o proceso a elicita a su vez un proceso oponente o proceso b, que genera la reaccin emocional opuesta (por ejemplo tristeza). Se asume que los cambios emocionales observados cuando se presenta un estmulo y despus se retira reflejan el resultado neto de los procesos primario y oponente. La fuerza del proceso oponente se resta de la fuerza del proceso primario para dar lugar a las emociones que realmente ocurren. Por tanto, los procesos primario y oponente son mecanismos internos cuyos efectos son los cambios emocionales observados. (fig 2.12) Un presupuesto adicional bsico para la teora del proceso oponente es que el proceso oponente es ligeramente ineficiente. Al principio permanece a la zaga de la alteracin emocional primaria, y por tanto, no es lo suficientemente fuerte para compensar por completo la emocin primaria.

Sin embargo, el proceso oponente se hace ms rpido y potente con la prctica o con la experiencia repetida con el estmulo que activa la emocin. En cierto sentido, el proceso oponente se sensibiliza como resultado de la activacin repetida. Progresivamente se va haciendo lo suficientemente fuerte como para bloquear la mayor parte de la reaccin emocional primaria, momento en el cual produce tambin un postefecto muy fuerte al terminar el estmulo emocional activador. Mecanismos oponentes durante la exposicin inicial al estmulo Cuando el estmulo se presenta por primera vez, el proceso a tiene lugar sin la oposicin del proceso b. Esto permite que la reaccin emocional primaria alcance su nivel ms alto.

Despus se activa el proceso b y comienza a oponerse al proceso a. Sin embargo, en la primera presentacin del estmulo el proceso b no es lo suficiente mente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras est presente el estimulo elicitante. Cuando el estimulo se retira, el proceso a se detiene rpidamente, pero el proceso b permanece por algn tiempo. En este momento no hay nada que se oponga al proceso b, y la respuesta emocional caracterstica del proceso oponente se hace evidente por primera vez. Estas emociones son por lo general opuestas a las que se observan durante la presentacin del estmulo. Mecanismos oponentes tras la exposicin prolongada al estmulo:

Un estmulo familiar no elicita reacciones emocionales fuertes, pero el postefecto afectivo tiende a ser ms fuerte cuando termina un estimulo familiar. La teora del proceso oponente explica este resultado asumiendo que el proceso b se fortalece con la exposicin prolongada a estimulo, el fortalecimiento del proceso b se refleja en varias de sus caractersticas: se activa antes tras la aparicin del estimulo, su intensidad mxima se hace mayor y da ms tiempo en decaer tras la desaparicin del estmulo. Por el contrario, se asume que el proceso a permanece inalterado. Por tanto, tras la presentacin repetida de un estmulo, la respuesta emocional primaria queda compensada de forma ms efectiva por el proceso oponente.

Este fortalecimiento del proceso oponente reduce la intensidad de las respuestas emocionales primarias observadas durante la presentacin del estimulo emocional activador. Tambin d lugar a un postefecto emocional intenso cuando el estimulo se retira. Motivacin y postefecto oponente La teora del proceso oponente sugiere que lo adiccin a las drogas es principalmente un intento de reducir la aversin producida por el postefecto afectivo de las drogas. Hay dos formas de reducir los postefectos oponentes aversivos de las drogas:

1. Esperar el tiempo necesario para e se disipen. 2. O ms rpido: tomando de nuevo la droga. De acuerdo con la teora, los adictos quedan atrapados por la necesidad de tomar la droga para reducir los efectos de la retirada. Valoracin general de la teora del proceso oponente Aunque la teora no ha estimulado toda la investigacin que prometa, ha supuesto una importante contribucin al aplicar el concepto de regulacin homeosttica al anlisis de emociones y la motivacin. Variaciones en la conducta dirigida a metas Responder para escapar de la molestia producida por la retirada de un estmulo es slo uno de los tipos de conducta motivada o dirigida a metas. Un objeto meta gratificante recibe el nombre tcnico de reforzador. Reforzador: estmulo cuya administracin inmediatamente posterior a una respuesta incrementa la probabilidad futura de dicha respuesta. Las situaciones en las que los organismos responden repetidamente para obtener un reforzador muestran muchas de las propiedades comunes de la habituacin la sensibilizacin. (Escuchar una cancin particular, es menos probable que nos apetezca encender la radio para escuchar siempre lo mismo (habituacin), pero esta prdida de inters es especfica de esa cancin repetida (especificidad del estmulo), adems recuperaremos nuestro inters en la cancin si no la escuchamos en unos das (recuperacin espontnea), o tambin puede restablecerse nuestro inters por la exposicin a estmulos novedosos como que la escuchemos junto a un amigo (sensibilizacin)). La habituacin y la sensibilizacin son frecuentes con reforzadores sensoriales (como una pieza musical).

COMENTARIOS FINALES
La conducta elicitada representa una de las principales formas en las que el comportamiento de todos los animales -desde los organismos unicelulares hasta los humanos- se ajusta a los eventos del ambiente. La conducta elicitada toma muchas formas, desde reflejos simples mediados por tres neuronas a las reacciones emocionales complejas. Aunque la conducta elicitada tiene lugar como reaccin a un estmulo, no es rgida ni invariable. Uno de lo de sus rasgos ms llamativos es que la conducta elicitada cambia con la experiencia.

Si un estmulo elicitante no activa a organismo, la presentacin repetida del estmulo provocar respuestas cada vez mas dbiles (habituacin). Si el estimulo elicitante es intenso o significativo para el individuo, la presentacin repetida dar lugar a respuestas cada vez ms fuertes (sensibilizacin). El nivel resultante de respuesta refleja el resultado neto de los procesos de habituacin y sensibilizacin. Por lo tanto, si desconocemos las experiencias pasadas de un organismo, es imposible predecir con qu intensidad reaccionar ante la presentacin de un estmulo particular. La presentacin repetida de u estmulo elicitante produce cambios tanto en las respuestas simples como en reacciones emocionales ms complejas. Los organismos tienden a minimizar los cambios emocionales provocados por estmulos externos. De acuerdo con la teora del proceso oponente de la motivacin, el organismo compensa las respuestas emocionales estimuladas por un evento del entorno con n proceso oponente. Se asume que este proceso compensatorio, u oponente, se hace ms fuerte cada vez que se activa, lo que lleva a una reduccin de la respuesta emocional primaria. El fortalecimiento del estado emocional oponente como postefecto se hace evidente cuando el estmulo se retira. La habituacin, la sensibilizacin y los cambios en la fuerza de los procesos oponentes son los mecanismos ms sencillos mediante los qe los organismos ajustan sus reacciones a los eventos del entorno en funcin de la experiencia

PREGUNTAS DE PRUEBA
1. Compare y contraste la conducta apetitiva y consumatoria describa cmo se relacionan con la bsqueda general, focalizada y con la manipulacin del alimento. 2. Explique la distincin entre habituacin, adaptacin sensorial y fatiga. 3. Explique la diferencia entre los efectos de habituacin y sensibilizacin y los procesos de habituacin y sensibilizacin. 4. Describa los dos procesos de la teora del proceso dual de la habituacin y la sensibilizacin y las diferencias entre estos procesos. 5. Describa la teora del proceso oponente de la motivacin y cmo explica la habituacin y la sensibilizacin. 6. Explique por qu la habituacin y la sensibilizacin son relevantes en relacin a la conducta dirigida a metas.

Tema 3: Aprendizaje de relaciones entre estmulos. Fundamentos del condicionamiento clsico.


La investigacin sobre el condicionamiento clsico comenz con el trabajo de Pavlov, que estudi como aprendan los perros a anticipar la administracin de comida. Hay procedimientos del condicionamiento clsico que establecen una asociacin entre dos estmulos. Otros inhiben el funcionamiento de las asociaciones excitatorias. El condicionamiento clsico es el mecanismo ms simple por el cual los organismos pueden aprender a cerca de las relaciones entre estmulos y cambiar su conducta en conformidad con las mismas. Permite a los seres humanos y a los dems animales aprovecharse de la secuencia ordenada de eventos de su ambiente y aprender que estmulos tienden a ir con qu eventos. Sobre la base de este aprendizaje los organismos dan respuestas nuevas a los estmulos. Con el condicionamiento clsico, aprendemos a predecir cuando y que podemos comer. Tambin est involucrado en el aprendizaje de nuevas respuestas emocionales como el miedo y el placer a estmulos que inicialmente no elicitaban esas emociones.

LOS PRIMEROS AOS DEL CONDICIONAMIENTO CLSICO


Los primeros trabajos comienzan con Pavlov fisilogo ruso- .
En sus tesis doctoral Twitmyer (1974) presentada en la universidad de Pensilvania en 1902. Trat de condicionar el reflejo patelar de los estudiantes haciendo sonar una campana 0,5 segundos antes de golpear el tendn rotuliano situado bajo la rtula. Tras varios ensayos, slo con escuchar el sonido para elicitar este reflejo (es decir, la pierna de los estudiantes) al escuchar la campana se mova sin tener que da el golpecito con el martillo en su rodilla, pero sus hallazgos no despertaron inters. Los trabajos de Pavlov sobre el condicionamiento clsico fueron una extensin de su investigacin sobre el proceso de digestin. Desarroll tcnicas quirrgicas introduciendo a sus perros tubos y fstulas artificiales, para recoger jugos gstricos. Los tcnicos de su laboratorio descubrieron que los perros secretaban jugos gstricos en respuesta cuando vean la comida, o a la persona que les alimentaba. Los asistentes del laboratorio llamaban a estos jugos secreciones psquicas, durante muchos aos este fenmeno tuvo escaso inters cientfico.

Los descubrimientos de Vulfson y Snarskii


Estos estudiantes, se centraron en las glndulas salivares, que son las primeras glndulas involucradas en la descomposicin de la comida. Vulfson estudi la respuesta salival a varias sustancias situadas en la boca, como comida seca, comida hmeda, agua cida y

arena. Cuando los perros experimentaban la sensacin de estas sustancias en la boca, slo la visin de estas provocaba la salivacin. Mientras Vulfson utilizaba sustancias naturales en sus estudios, Snarskii lo haca con sustancias artificiales. Las sustancias tambin provocaban en la boca sensaciones de textura y sabor caractersticas. Estas sensaciones se denominan estmulos orofarngeos. La primera vez que se pona arena en la boca del perro, slo la sensacin de esta provocaba salivacin. Cuando se repiti varias veces el experimento, slo ver la arena provocaba salivacin, sin necesidad de introducirla en la boca. El perro aprendi a asociar las caractersticas visuales de la arena con las caractersticas orofarngeas. A este tipo de aprendizaje se le denomina Aprendizaje de objeto. Pues requiere asociar diferentes caractersticas de un mismo objeto. En los estudios posteriores sobre el condicionamiento Pavlov utiliz procedimientos en los que los estmulos a asociar provenan de diferentes fuentes. Actualmente se utilizan estos mtodos experimentales.

El paradigma del condicionamiento clsico


El procedimiento para estudiar la salivacin condicionada de Pavlov, conlleva dos estmulos: 1. Un tono de luz que no provoca salivacin al principio del experimento. 2. Un alimento o solucin cida situada en la boca. este si provoca salivacin fuerte la primera vez que se presenta. Pavlov se refiri al tono o a la luz como estmulo condicional pues la efectividad de este para provocar la salivacin dependa su emparejamiento repetido con la presentacin de la comida. Al estmulo de sabor cido lo denomin estmulo incondicional, pues su efectividad para provocar la salivacin era independiente del entrenamiento anterior. La salivacin provocada por el tono o la luz se denomin respuesta condicional, y la provocada por la comida y el sabor cido era la respuesta incondicional. Las respuestas y estmulos cuyas propiedades no dependan del entrenamiento previo se denominaron incondicionales, y las respuestas y estmulos que aparecan slo tras el entrenamiento previo eran las condicionales Las abreviaturas de estmulo condicionado y respuesta condicionada son EC y RC. Las abreviaturas de estmulo incondicionado y respuesta incondicionada son EI y RI.

SITUACIONES EXPERIMENTALES
Pavlov realiz la mayor parte de sus experimentos con perros utilizando la tcnica de la fstula salival. Actualmente se realizan con ratas, conejos y palomas con procedimientos desarrollados por cientficos de la segunda mitad del siglo XX.

Condicionamiento del miedo


Tras el trabajo de Watson y Rayner (1920) el condicionamiento de las reacciones emocionales ha sido uno de los principales centros de atencin del condicionamiento

pavloviano. Estos pensaban que al principio los nios estn limitados en su reactividad emocional y asumieron << debe haber algn procedimiento sencillo por medio del cual el rango de estmulos que pueden despertar las emociones y sus compuestos se ampla>>. Este procedimiento sencillo era el condicionamiento pavloviano. Watson y Rayner condicionaron la respuesta del miedo de un nio de 9 meses Albert a la presentacin de una rata blanca de laboratorio. Albert no tena miedo a casi nada, pero se dieron cuenta que cuando hacan sonar un ruido fuerte tras su cabeza si se asustaba. Utilizaron esta reaccin incondicionada para condicionar el miedo a la rata blanca. Cada ensayo de condicionamiento consista en presentar la rata a Albert y luego golpear la barra de hierro tras su cabeza. Al principio se acercaba a la rata cuando se le presentaba. Pero tras cinco ensayos mostr una reaccin de miedo intensa ante la rata. Lloriqueaba o sollozaba y se separaba de la rata todo lo posible e incluso a veces se caa y se escapaba gateando. Pero si se le presentaban sus juguetes no aparecan las respuestas de miedo. Pero el miedo condicionado se le generaliz a otros objetos peludos (un conejo, un abrigo de piel, algodn) El miedo y la ansiedad pueden producir serios problemas psicolgicos y conductuales. Desde el estudio de Watson y Rayner con Albert los investigadores han examinado el condicionamiento del miedo utilizando ratas de laboratorio. El estmulo incondicionado aversivos utilizado en estos estudios es una breve descarga elctrica en las patas del animal mediante una rejilla metlica en el suelo. La descarga utilizada como EI tiene una intensidad y duracin suficientemente baja para no producir dao. La descarga resulta aversiva por que es extraa. El EC puede ser un tono o una luz, poco antes de la descarga. Las ratas muestran su miedo quedndose quietas, esta paralizacin es una respuesta a la anticipacin de una estimulacin aversiva. Los investigadores miden el miedo condicionado indirectamente registrando como el estmulo condicionado altera la actividad del animal. Una tcnica popular para la medida indirecta del miedo condicionado es el procedimiento de respuesta emocional condicionada o supresin condicionada (REC). El procedimiento REC fue diseado por Estes y Skinner (1941) y se ha utilizado mucho en el estudio del condicionamiento pavloviano. Primero se ensea a las ratas a presionar una barra en una pequea cmara experimental para obtener comida como recompensa. Cuando se ha presionado la barra unas cuantas veces se administra la comida. Tras un entrenamiento las ratas presionan la barra a un ritmo regular. Despus comienza la fase de condicionamiento del miedo. En cada ensayo de condicionamiento se presenta el EC durante 1 o 2 minutos inmediatamente seguido una breve exposicin a la descarga. Hay una separacin de entre 15 y 30 minutos entre ensayos. Las ratas por el miedo no pueden presionar la palanca y esto hace que el procediendo REC sea til para medir la supresin de la respuesta inducida por el miedo. La adquisicin del miedo al estmulo condicionado provoca una interrupcin de la respuesta de presin de la palanca para obtener comida. Tras varios emparejamientos del EC con la descarga el animal suprime la respuesta cuando aparece el EC. La supresin condicionada puede ser completa y el animal no presione ms la barra en 3 o 5 ensayos de condicionamiento, sin embargo la supresin es especfica del EC. Cuando este desaparece las ratas vuelven a presionar la palanca para obtener comida.

Para medir cuantitativamente la supresin condicionada se calcula una razn de supresin. Esta razn compara el nmero de supresiones de la palanca que tiene lugar durante el EC con la que tiene lugar durante un perodo de lnea base comparable anterior a la presentacin del EC (perodo pre-EC) y la formula es: Respuesta durante el EC Razn de supresin= -------------------------------------------------------------------------------------------------Respuestas durante el EC + Respuestas durante el pre-EC

La razn de supresin adopta el nmero 0 si la rata deja de presionar la palanca completamente durante el EC, ya que en este caso el numerador de la frmula es 0. Si la rata no altera su ritmo de presiones de palanca cuando se presenta el EC, la razn tiene un valor de 0,5. Supongamos que el EC se presenta durante 2 minutos y que en un perodo pre-EC de 2m la rata da 30 respuestas. Si el EC no altera la conducta de presin de la palanca, el animal dar 30 respuestas durante el EC de forma que el numerador de la razn ser 30. El denominador ser igual a 30 (respuestas durante el EC) + (30 respuestas durante el pre-EC), es decir, 60. La razn ser 30/60 o 0.5. A medida que se baja de 0,5 a 0 los valores indican mayores niveles de supresin de la respuesta o de miedo condicionado. Por tanto la escala es la inversa. Los valores ms bajos de la razn de supresin indican mayor alteracin en la conducta de presin de la palanca. Hay que recordar que una razn de supresin que indica 0, quiere decir que no hay ninguna respuesta durante el EC, lo que representa la mayor supresin posible de respuesta. Cuanta ms pequea es la razn de supresin, ms paralizado est el animal porque el EC provoca ms miedo condicionado. En el procedimiento de supresin condicionada, la conducta de presin de la palanca para obtener comida proporciona la lnea base de la respuesta. En el procedimiento de supresin condicionada de lameteo la presentacin de un estmulo condicionado que provoca miedo da lugar a una supresin de la conducta de lameteo. En este procedimiento se requiere menos entrenamiento para hacer que las ratas beban del tubo del que se requiere para que presionen una palanca para obtener comida. En este procedimiento tambin se registra el tiempo que el animal tarda en completar un total de 5segundos de lameteo como medida de supresin de la respuesta.

Condicionamiento de parpadeo
El reflejo palpebral es un reflejo discreto, muy parecido al reflejo patelar. Es uno de los primeros componentes de la respuesta de sobresalto y se da en diversas especies. Al dar una palmada cerca de los ojos, o un soplo de aire cerca de ellos a travs de una pajita, podemos hacer que se parpadee. Pero si a este soplo de aire le precede un tono

breve, es posible que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplo de aire. Al comienzo del desarrollo de la teora del aprendizaje, el condicionamiento palpebral se utiliz principalmente en humanos, y an tiene inters en la investigacin, debido a los avances en nuestra comprensin de los sustratos neurobiolgicos de este tipo de aprendizaje. Steinmetz (1999) destac que <<el condicionamiento palpebral proporciona un medio excelente para la observacin directa de una conducta simple, y puede utilizarse para valorar procesos biolgicos y psicolgicos bsicos en seres humanos, tales como el aprendizaje y la memoria, el desarrollo, la conciencia, la atencin, la activacin y el envejecimiento natural>>. (Ver ejemplo del condicionamiento del parpadeo en pginas 66-67) Las investigaciones neurobiolgicas sobre el condicionamiento palpebral se han realizado con conejos domsticos principalmente. La preparacin del condicionamiento palpebral fue llevada a cabo por Gormezano. Los conejos domsticos son ideales para este tipo de investigacin debido a su disponibilidad, a que son sedentarios, a que toleran bien las restricciones del movimiento y que rara vez parpadean, en ausencia de aire o irritacin del ojo. El condicionamiento palpebral de los conejos es relativamente lento, requiere cientos de ensayos para obtener un nivel significativo de respuesta condicionada.

Seguimiento del signo


Los estudios de Pavlov, se centraron en la salivacin y en otras respuestas de carcter reflejo, y afianzaron la idea de que el condicionamiento clsico tena lugar nicamente en sistemas de respuesta reflejos, pero en los ltimos aos se ha abandonado esta visin restringida del condicionamiento pavloviano. Uno de los paradigmas que ha contribuido a la concepcin actual de este condicionamiento es el de seguimiento del signo o automoldeamiento. En el ambiente natural la disponibilidad de comida puede predecirse a partir de algunos aspectos de la propia comida, que se pueden percibir a distancia (como el aspecto de dicha comida). Para un halcn el ver un ratn en movimiento es una clave que indica alimento. El seguimiento del signo, se estudia en el laboratorio presentando un estmulo visual discreto y bien localizado justo antes de cada administracin de alimento. El primer experimento de este tipo se realiz con palomas y lo realizaron Brown y Jenkins (1968). Se ponan a los animales en una cmara experimental que tena una tecla circular que se poda iluminar y las palomas podan picotear. Las palomas peridicamente podan comer durante unos segundos. La tecla luminosa se encenda 8 segundos antes de cada administracin de comida.

Las palomas no tenan que hacer nada para que apareciera la comida, esta se administraba automticamente despus de la iluminacin de la tecla de respuesta, independientemente de lo que hicieran las aves. Como las aves estaban hambrientas lo lgico era pensar que iran a picotear la comida en cuanto se encendiera la luz, pero esto no fue as. En lugar de esperar a que se encendiera la luz para ir al comedero, fueron ellas a picotear la tecla. Este comportamiento result curioso porque no era necesario que hicieran nada para tener acceso a la comida. Despus de este experimento se han hecho otros con pollos, codornices, carpas Todos estos experimentos sobre el seguimiento del signo es una herramienta til para el estudio del aprendizaje asociativo. En estos experimentos con palomas, el EC es la iluminacin de la teclas de respuesta, y el EI la presentacin de la comida. El aprendizaje es rpido cuando el EC se presenta justo antes que EI. Se puede ver un ejemplo del seguimiento del signo con palomas en la pg 71. El seguimiento del signo slo es posible en situaciones en las que el EC tiene una localizacin precisa, por tanto, puede ser seguido. En un estudio se utilizaron como EC claves contextuales y espaciales difusas de las cmaras en las que las palomas reciban comida peridicamente, el aprendizaje de la asociacin se manifest en forma de un incremento de actividad ms que como una respuesta de aproximacin especfica. En otro se compararon una luz bien localizada y un sonido como EC para la comida. Slo la luz estimul la conducta condicionada de aproximacin o seguimiento del signo. El EC auditivo provocaba una aproximacin al comedero en lugar de a la fuente de sonido. Estos experimentos muestran que para que tenga lugar el seguimiento del signo el EC tiene que ser de una modalidad y configuracin apropiadas. Un factor tambin muy importante es la relacin entre la cantidad de tiempo que los sujetos pasan en el contexto experimental y la duracin de cada presentacin del EC. Se obtienen mayores niveles de seguimiento del signo con mayores exposiciones al contexto experimental en relacin a la duracin del EC.

Aprendizaje de aversin al sabor


El acto de comer da muchas oportunidades para el aprendizaje de asociaciones. Rozin y Zellner (1985) destacaron<< el condicionamiento pavloviano est plenamente activo en las asociaciones entres los sabores de los miles de millones de comidas que se ingieren cada da en las asociaciones entre comidas y objetos nocivos y entre las asociaciones de las comidas con algunas de sus consecuencias. La aversin al sabor puede aprenderse si la ingestin de un sabor nuevo va seguida de una enfermedad o de otras consecuencias nocivas. Las preferencias por un sabor pueden aprenderse si un sabor se asemeja con la sensacin de saciedad u otras consecuencias positivas. Una cantidad creciente de evidencia indica que muchas de las aversiones al sabor de los humanos son tambin el resultado de condicionamiento pavloviano. Gran parte de esta evidencia se han obtenido en estudios basados por cuestionarios. Todas las personas han adquirido aversin a una comida en su vida. El emparejamiento del sabor y la

enfermedad puede dar lugar a una aversin condicionada al alimento en un nico ensayo, y el aprendizaje puede tener lugar incluso si la enfermedad se manifiesta varias horas despus de la ingestin de la comida. El 20% de las personas estaban seguras de que la enfermedad no se la provoc la comida, pero adquirieron una aversin a esa comida. Lo que indica que el aprendizaje de aversin al sabor puede ser independiente de los procesos de pensamiento racional y que puede ser contrario a las conclusiones de una persona sobre la causa de su enfermedad. La quimioterapia puede provocar nauseas como efecto secundario. Los enfermos de cncer, nios y adultos adquieren aversiones a los alimentos ingeridos justo antes de su sesin de quimioterapia, esto puede contribuir a la falta de apetito observada entre estos pacientes. La aversin condicionada al sabor puede provocar una anorexia al suprimir la ingestin de alimentos. La anorexia que acompaa a la aparicin de algunos tumores puede ser el resultado de un aprendizaje de aversin al sabor. Este aprendizaje de aversin al sabor puede tambin contribuir a la aparicin de anorexia nerviosa, caracterizado por una perdida de peso fuerte y crnica. Incluso este aprendizaje de la aversin al sabor puede contribuir a la perdida de apetito en personas con depresiones severas. Muchos de estos conocimientos sobre aprendizaje de aversin al sabor se han descubierto con anormales de laboratorio. La aversin al sabor es el resultado del emparejamiento de un EC (el sabor) con un EI (una droga o exposicin a radiacin), de forma similar a otros ejemplos de condicionamiento clsico, y sigue las mismas leyes de aprendizaje en muchos aspectos. Tambin tiene caractersticas especiales. Primera caracterstica los estudios de laboratorio han demostrado que con un solo emparejamiento del sabor y la humedad, puede aprenderse una fuerte aversin al sabor. En el condicionamiento del miedo pasa lo mismo, pero no es tan fuerte, ni tan comn, si es que se da el condicionamiento palpebral, el salival o el seguimiento del signo. La segunda caracterstica nica del aprendizaje de aversin al sabor es que tiene lugar incluso si los animales no enferman has varias horas despus de la exposicin al sabor novedoso. Probablemente el aprendizaje demorado, de la aversin al sabor ha evolucionado para permitir a los animales (humanos y no humanos) evitar alimentos venenosos con efectos retardados. Un experimento de Smith y Roll (1967) es un ejemplo de aprendizaje demorado de aversin al sabor. Se someti a unas ratas de laboratorio a un programa de privacin de agua, de modo que estuvieran motivadas para beber cuando se pona un recipiente con agua en su caja experimental. El da del condicionamiento tuvieron acceso durante 20 minutos a una solucin de agua con sacarina al 0,1%. En diferentes momentos tras la presentacin de la sacarina en un rango de 0 a 24horas, diferentes grupos fueron expuestos a radiacin de una maquina de rayos X. Los grupos de control tambin fueron llevados a la mquina de rayos X pero no fueron irradiados. Se les llam grupo falsamente irradiados. Empezando al da siguiente del tratamiento de irradiacin, se dio

a cada rata la oportunidad de elegir entre beber la solucin de sacarina o agua normal durante dos das. En la figura se muestra la preferencia de cada grupo de animales por la solucin de sacarina. Loa animales expuestos a la radiacin 6h despus de probar la solucin de sacarina mostraron aversin a la sacarina en la prueba. Menos el 20% de su ingestin total de liquido corresponda al tubo de la sacarina. Los animales irradiados 12h despus de la exposicin a la sacarina mostraron una aversin mucho menor, y casi no se not aversin en las ratas irradiadas 24h despus de la exposicin al sabor. En contraste con este patrn de evitacin de la sacarina observado en el grupo de ratas irradiadas, todos los grupos falsamente irradiados prefirieron la solucin de sacarina. Ms del 70% de la ingestin total del lquido lo bebieron del tubo de la sacarina.

PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO


Hasta ahora todo lo que se ha visto son ejemplos de condicionamiento pavloviano excitatorios. En el condicionamiento excitatorio, los organismos aprenden una asociacin entre los estmulos condicionados e incondicionados. Como resultado de esta asociacin, la presentacin del estmulo condicionado activa la actividad conductual y neural relacionada con el EI, sin la presentacin real del EI. Los procesos relacionados con el EI son los que generan las respuestas condicionadas que se observan. De esta forma las palomas aprenden a aproximarse y picotear una tecla luminosa que va seguida de comida, las ratas aprenden a asustarse de un sonido que precede a una descarga elctrica, los conejos aprenden a parpadear en respuesta a un tono que precede un soplo de aire y las ratas aprenden a beber la sacarina que va seguida de malestar. En todos los casos el EC adquiere la capacidad de activar la conducta relacionada con el EI asociado.

Procedimientos tpicos de condicionamiento pavloviano


La ordenacin temporal del EC y el EI es uno de los factores crticos que determinan el curso del condicionamiento clsico. Variaciones aparentemente pequeas en la forma de emparejar el EC y el EI pueden tener importantes efectos en la intensidad de la respuesta condicionada. En esta figura se muestra cinco procedimientos tpicos de condicionamiento clsico. La distancia horizontal de cada diagrama representa el paso del tiempo; el desplazamiento vertical indica el momento en que cada estmulo aparece y desaparece. Cada configuracin del estmulo condicionado y el estmulo incondicionado, representa un nico ensayo de condicionamiento. En un experimento tpico de condicionamiento clsico los episodios de EC-EI se repiten varias veces en una sesin de entrenamiento. Al tiempo entre el final de un ensayo y el comienzo de otro se le llama, intervalo entre ensayos. El tiempo entre el comienzo entre el EC y el EI dentro del mismo ensayo del condicionamiento se llama intervalo entre estmulos o intervalo EC-EI.

Para que haya una respuesta condicionada, el intervalo entre estmulos tiene que ser ms corto que el intervalo entre ensayos. 1. Condicionamiento de demora corta consiste en demorar el comienzo del EI ligeramente tras el comienzo del EI ligeramente tras el comienzo del EC en cada ensayo. Su principal caracterstica es que cada ensayo comienza con el EC, y el EI se presenta tras una demora (menos de un minuto). El EC puede continuar durante el EI o terminar cuando empieza el mismo. 2. Condicionamiento de huella se parece al procedimiento de demora corta en el que el EC se presenta primero y le sigue el EI. Sin embargo en este condicionamiento el EI no se presenta hasta que ha transcurrido cierto tiempo desde la terminacin del EC. Esto deja un espacio temporal entre el EC y el EI. Este espacio se llama intervalo de huella. 3. Condicionamiento de demora larga tambin se parece al de demora corta en que el EC tambin empieza antes que el EI, pero en este el EI se demora durante ms tiempo (5-10 minutos) que en el procedimiento de demora corta. El procedimiento de demora larga no incluye un intervalo de huella. El EC dura hasta que el EI empieza. 4. Condicionamiento simultneo es quiz la forma ms obvia de exponer a los sujetos a un EC junto con un EI sea presentar ambos al mismo tiempo, por eso se llama simultneo. 5. Condicionamiento hacia atrs en este caso el EI ocurre poco antes que el EC, y se llama hacia atrs debido a que el EC y el EI se presentan en el orden contrario al de los otros procedimientos.

Medida de las respuestas condicionadas


Para poder comparar los diferentes procedimientos, los investigadores deben utilizar un mtodo para medir el condicionamiento que sea igualmente aplicable a todos los procedimientos. Eso normalmente se hace mediante un ensayo de prueba que consiste en la presentacin del EC aislado (sin el EI). As puede observarse la respuesta provocada por el EC sin la contaminacin de las respuestas provocadas por le EI. Estos ensayos se pueden introducir a lo largo del curso de entrenamiento para hacer un seguimiento del aprendizaje. La conducta que tiene lugar durante el EC se puede cuantificar:

Por la magnitud de las respuesta condicionada, que es la cantidad de conducta que tiene lugar. Por ejemplo Pavlov midi el nmero de gotas de saliva elicitadas por el EC, otro ejemplo puede ser la cantidad de supresin de la conducta que tiene lugar en el procedimiento REC. o Probabilidad de la respuesta frecuencia con la que el EC provoca una respuesta condicionada. Por ejemplo puede medirse el porcentaje de ensayos en los que el EC provoca una respuesta condicionada. Esta medida se puede utilizar en los estudios del condicionamiento palpebral. Por la latencia rapidez la respuesta condicionada tras la aparicin del EC y es la cantidad de tiempo que pasa entre el principio del EC y la aparicin de la respuesta condicionada. o En los procedimientos de demora y huella el EC aparece de forma aislada al principio de cada ensayo. Cualquier conducta condicionada

que tenga lugar al inicio del EC aislado no est contaminada por la conducta provocada por el EI y por tanto puede ser utilizada como medida del aprendizaje. En los ensayos de condicionamiento simultneo y hacia atrs la respuesta durante el EC puede reflejar la presencia del EI, por lo que los ensayos de prueba sern cruciales para evaluar el aprendizaje en el condicionamiento simultneo y hacia atrs.

Procedimientos de control en el condicionamiento clsico


Para estar seguros de que un procedimiento de condicionamiento es el causante de determinados cambios en la conducta, deben compararse esos cambios con los efectos de un procedimiento de control. Cual debera ser ese procedimiento de control? Se requieren procedimientos de control ms complicados que los utilizados en los estudios sobre habituacin y sensibilizacin, pues slo eran de inters los efectos de exposicin previa a un estmulo. En los estudios sobre el condicionamiento clsico, el inters se centra en la forma en como se asocian los estmulos condicionado e incondicionado. Una asociacin entre un EC y un EI implica que los dos eventos han quedado conectados de alguna forma. Despus de que la asociacin se ha establecido, el EC adquiere la capacidad de activar procesos relacionados con el EI. Para concluir que se ha establecido una asociacin, debemos asegurarnos de que el cambio conductual observado no podra haberse producido por la mera presentacin del EC o del EI por separado. La presentacin de un estmulo activador como la comida, en el caso de un animal hambriento, puede incrementar la conducta provocada por un estmulo menos efectivo, como un tono, sin que se haya establecido una asociacin entre los dos estmulos. Por lo que el incremento en la respuesta que se observa en el emparejamiento repetido el EC y EI, podra ser en realidad, el resultado de la mera exposicin al EI. Los casos en los que la mera exposicin al EI da lugar a respuestas similares recibe el nombre de pseudocondicionamiento. Para determinar si las respuestas que se dan ante el EC representan una asociacin entre EC y EI en lugar de un efecto de sensibilizacin debido a la exposicin a los estmulos condicionados e incondicionados, se requiere un procedimiento de control. Un procedimiento de control til, consiste en la presentacin de los estmulos condicionados e incondicionados en diferentes ensayos. A este procedimiento se le denomina control desemparejado explcito. En este procedimiento los estmulos condicionados e incondicionados se presentan separados para evitar que se asocien. La cantidad de tiempo que debe de pasar entre ellos dependen del sistema de respuesta. En el aprendizaje de aversin al sabor debe de pasar ms tiempo entre EC y EI que en otras formas de condicionamiento. Hay una variante del control desemparejado explcito en la que slo se presentan ECs durante la primera sesin y EIs en la segunda.

Eficacia de los procedimientos tpicos de condicionamiento


Hay gran inters por determinar cual de los procedimientos produce ms muestras de aprendizaje. Tradicionalmente los investigadores siguieren la direccin marcada por Pavlov, y se centraron en una nica medida directa de aprendizaje. Los laboratorios se adaptaron para realizar experimentos utilizando slo una de las preparaciones comunes

del condicionamiento (condicionamiento del miedo, palpebral, del seguimiento del signo o de aversin al sabor) y los equipos estaban diseados para registrar slo la respuesta de inters para ese laboratorio. Tras afirmarse en una medida especfica de aprendizaje, el investigador estaba preparado para examinar el aprendizaje en los procedimientos de demora, simultneo, huella y hacia atrs. Se supona que el condicionamiento pavloviano produca una asociacin EC-EI cuya fuerza quedara reflejada directamente en el vigor de la RC (respuesta condicionada). El resultado de los estudios realizados con los cinco procedimientos de la figura 3.7 se resume prestando atencin al intervalo temporal entre el principio de EC y el principio de EI (intervalo entre estmulos o intervalo EC-EI). En general se observa poco condicionamiento en los procedimientos de condicionamiento simultneo, en los que el intervalo EC-EI es cero. Una ligera demora de la presentacin del EI tras el EC facilita la respuesta condicionada. Sin embargo esta facilitacin estaba claramente limitada. Si el intervalo EC-EI se incrementa ms, la respuesta condicionada disminuir, en el procedimiento de aversin al sabor, en el que el aprendizaje es posible con intervalos EC-EI de 1 o 2 horas, la respuesta condicionada disminuye a medida que el intervalo EC-EI aumenta. (Figura 3.6). Los procedimientos de condicionamiento de huella son interesantes por que se mantiene el mismo intervalo EC-EI que los procedimientos de condicionamiento de demora. Sin embargo en el de huella el EC desaparece un poco antes que el EI. Tradicionalmente el condicionamiento de huella se ha considerado menos efectivo que el de demora. Al igual que en el condicionamiento de demora, se observa, menos condicionamiento con el procedimiento de huella cuando se incrementa el intervalo entre EC y EI. Estos descubrimientos realzaron la idea de que el condicionamiento es ms efectivo cuando el EC es una buena seal de que el EI pronto aparecer. El valor de la seal del estmulo condicionado es mejor en el procedimiento de demora corta, en el que el EI tiene lugar poco despus de la aparicin de EC. El valor de la seal del EC se reduce a medida que se incrementa el intervalo EC-EI. El EC tambin es un mal predictor del EI en los procedimientos simultneos y de huella. En el condicionamiento simultneo, el EI aparece a la vez que el EC, por tanto, no est sealado por el EC. En el condicionamiento de huella el EC va seguido por el intervalo de huella, en lugar de por el EI. El condicionamiento hacia atrs produce resultados ambiguos. Tait y Saladin (1986) encontraron efectos de condicionamiento tanto excitatorio como inhibitorio como resultado del mismo procedimiento de condicionamiento hacia atrs. Algunos estudios han demostrado que los procedimientos simultneo, de demora, de huella y hacia atrs, pueden producir un aprendizaje slido, y una respuesta condicionada fuerte, pero lo que los sujetos aprenden es diferente en cada procedimiento. El sujeto no slo aprende que el EC est asociado con el EI, sino tambin cuando ocurre el EI en relacin al EC. A esto se le denomina hiptesis de la codificacin temporal.

CONDICIONAMIENTO PAVLOVIANO INHIBITORIO


Hasta ahora se ha hablado del condicionamiento pavloviano en trminos de aprendizaje, para predecir cuando va a aparecer un evento significativo o condicionamiento incondicionado. Pero hay otro condicionamiento en el que los sujetos aprenden a

predecir la ausencia del estmulo incondicionado. Un ejemplo sera: los nios que son mal tratados en sus casas sus padres pueden pegarles o gritarles sin ninguna razn, sin aviso. La investigacin con animales demuestra que la exposicin a estmulos aversivos impredecibles, produce lceras de estmago y estrs. Otra fuente de estrs es el ataque de pnico, tiene unos sntomas fsicos, como taquicardias y sensacin de desastre inminente. Si estos ataques son muy seguidos y le produce una ansiedad considerable se dice que el sujeto padece trastornos de pnico. Los individuos con ataques de pnico a veces pueden predecirlos otras no. Graske, y DeCola (1995) en un estudio con sujetos que experimentaban ataques de pnico predecibles e impredecibles, midieron la ansiedad de cada sujeto antes y despus de cada ataque. Antes del ataque, los niveles de ansiedad eran similares independientemente de que el ataque fuera predecible o no. Sin embargo, la ansiedad se incrementaba significativamente tras un ataque de pnico imprevisto. Estos resultados indican que la ansiedad generada por la experiencia de pnico tiene lugar a causa de la imprevisibilidad de los ataques. Por qu son preferibles los estmulos aversivos predecibles a los eventos impredecibles? Una posibilidad sera que la capacidad de predecir la aparicin de un evento aversivos, tambin permite predecir la ausencia de estimulacin aversiva, y el hecho de predecir esa ausencia puede ser un factor crtico. Segn este razonamiento, las tcnicas efectivas para reducir el estrs (relajacin, meditacin) conlleva la creacin de un perodo de seguridad de que no tendrn lugar eventos aversivos. Los expertos en estrs dicen que es imposible eliminar los eventos aversivos de la vida de una persona para siempre; no es posible prevenir los accidentes, o que un nio no pegue a otro. Las seales que predicen la ausencia de un estmulo aversivo son estmulos condicionados inhibitorios. Pavlov descubri el condicionamiento inhibitorio a comienzos del siglo XX, pero no despert inters hasta dcadas despus. A diferencia del condicionamiento excitatorio, la inhibicin condicionada sigue siendo objeto de discusin.

Procedimientos de condicionamiento inhibitorio


La diferencia con el condicionamiento excitatorio es que este el excitatorio- puede proceder sin condiciones previas especiales, la inhibicin condicionada tiene un requisito importante. Para que la ausencia del EI sea significativa, este debe ocurrir peridicamente en la situacin. Hay seales de ausencia de eventos en nuestra vida diaria como las seales de fuera de servicio, cerrado. La misma seal despertara poco inters si no estuviera colocada en el sitio idneo.

Es decir, el condicionamiento inhibitorio y el control inhibitorio de la conducta slo tienen lugar si hay un contexto excitatorio para el EI en cuestin. El condicionamiento excitatorio no depende del mismo modo de un contexto especial.

Procedimiento estndar de inhibicin condicionada


El procedimiento que utiliz Pavlov requiere dos estmulos condicionados y dos tipos de ensayo de condicionamiento. Uno para el condicionamiento excitatorio y otro para el inhibitorio. El EI se presenta en los ensayos de condicionamiento excitatorio y siempre que aparece el EI va anunciado por el estmulo condicionado etiquetado como EC+( por ejemplo un tono) debido a los emparejamientos con el EI, el EC+ se convierte en una seal de EI y sirve para proporcionar el contexto excitatorio necesario para el desarrollo de la inhibicin condicionada. En los ensayos de condicionamiento inhibitorio, el EC+ se presenta junto con el segundo estmulo condicionado, El EC (por ejemplo una luz) y no se presenta el EI. Por tanto, el EC- se presenta en el contexto excitatorio proporcionado por el EC+ pero no se empareja con el EI. Esto convierte al EC- en un inhibidor condicionado. A lo largo del tratamiento los ensayos Ay B se alternan de forma aleatoria. El procedimiento estndar de inhibicin condicionada es anlogo a la situacin en la que se introduce algo que previene un resultado que de otra forma ocurrira. Un semforo rojo en un cruce transitado es una seal EC+ de un peligro potencial EI. Pero si un agente de polica nos indica que podemos cruzar a pesar de la luz roja, es poco probable que tengamos un accidente. No es probable que la luz roja EC+ junto con los gestos del agente EC- vayan seguidos de peligro. Los gestos actan como un EC- y que inhiben o bloquean nuestra negativa a cruzar la calle con la luz roja. Procedimiento estndar de inhibicin condicionada en algunos ensayos (tipo A) el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta junto con el EC- y se omite el EI. El procedimiento resulta efectivo para condicionar propiedades inhibitorias al EC-

Contingencia o correlacin negativa entre el EC y el EI


Una contingencia negativa indica que el EI es menos probable tras el EC que en otro momento. Por tanto el EC seala una reduccin en la probabilidad de que aparezca el EI. Imaginemos un nio con el que se meten los compaeros cuando el maestro est fuera del aula, esto es semejante a recibir peridicamente un estmulo aversivo o EI. Cuando el profesor vuelve el nio puede estar seguro de que no le molestaran. Por lo que el maestro funciona como EC- que seala un perodo libre de acoso, o la ausencia del estmulo incondicionado. La inhibicin condicionada se observa constantemente en procedimientos en los que el nico estmulo condicionado explcito est correlacionado negativamente con el EI. (Rescolda 1969).

En el procedimiento de contingencia negativa EC-EI, el EI puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequea. Es ms probable que el EI aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y el EI. Pero an en ausencia de EC, el momento exacto de presentacin del EI no se puede predecir. El EI tiene lugar de forma probabilstica, a diferencia del procedimiento estndar de inhibicin condicionada. En el procedimiento estndar el EI siempre aparece al final del EC+ y no aparece cuando se presenta el EC- junto con el EC+. El procedimiento estndar permite predecir la aparicin del EI tambin permite predecir cuando no aparece. Por tanto, el procedimiento estndar de inhibicin condicionada permite la codificacin temporal de la ausencia del EI.

Medicin de la inhibicin condicionada


Los estmulos condicionales excitatorios adquieren la capacidad de elicitar respuestas que no se observaban anteriormente. Los estmulos condicionados excitatorios consiguen provocar respuestas como salivacin, aproximacin, parpadeo, dependiendo del EI. Es de esperar que los estmulos condicionados inhibitorios eliciten reacciones opuestas a estas tales como supresin de la salivacin, de la aproximacin o de el parpadeo. Pero como pueden medirse estas respuestas opuestas? Procedimiento de contingencia negativa EC-EI para condicionar propiedades inhibitorias al EC. Se observa que el EC siempre va seguido de un perodo sin el EI.

Sistemas de respuestas bidireccionales


El ritmo cardaco, la respiracin y la temperatura corporal, pueden aumentar o disminuir con relacin a una lnea base. Ciertas respuestas conductuales son bidireccionales. Esto es muy caracterstico de muchas respuestas fisiolgicas. El procedimiento de seguimiento del signo se ha utilizado para proporcionar evidencia de condicionamiento inhibitorio mediante respuestas bidireccionales. Una paloma se acercar a una tecla luminosa asociada con la presentacin subsiguiente de comida. Pero cuando se utiliza un procedimiento de condicionamiento inhibitorio, la paloma se aleja del EC. Aunque los sntomas de respuesta bidireccionales pueden proporcionar evidencia de inhibicin condicionada, la tcnica resulta limitada y su uso no se ha extendido. Una limitacin es que este mtodo funciona slo con repuestas que pueden ir en direcciones opuestas. Otra limitacin menos obvia es que esta tcnica puede mostrar slo el efecto neto de la excitacin y la inhibicin.

La prueba del estmulo compuesto o sumacin


Cmo se puede medir la inhibicin cuando la conducta no es bidireccional?

Se pone como ejemplo la respuesta de parpadeo que se estudia con conejos. En ausencia de un estmulo elicitante, los conejos rara vez parpadean. Si se ha condicionado un estmulo para inhibir la respuesta de parpadeo, los investigadores tampoco observan parpadeo cuado se presenta este estmulo. Para concluir que un estmulo inhibe activamente el parpadeo, los investigadores deben utilizar procedimientos de prueba ms sofisticados. Uno de estos procedimientos es la prueba de sumacin o del estmulo compuesto. La prueba de estmulo compuesto o prueba de sumacin fue muy popular en la poca de Pavlov y se est convirtiendo en el mtodo ms aceptable para la medicin de la inhibicin condicionada, en los estudios actuales. La prueba de estmulo compuestos compensa las dificultades originadas por una baja lnea base presentando un estmulo condicionado excitatorio que provoca la respuesta condicionada. La inhibicin condicionada se mide a partir de la reduccin o inhibicin de esta respuesta condicionada. La prueba requiere observar los efectos de un EC inhibitorio, en compuesto con un EC+ excitatorio. El procedimiento tambin se puede entender como la observacin de la sumacin de los efectos del estmulo inhibitorio (EC-) y el estmulo excitatorio (EC+). Cole, Barnet y Miller (1997) presentaron una demostracin de inhibicin condicionada utilizando la prueba del estmulo compuesto o sumacin. El experimento se realiz usando el procedimiento de supresin de lameteo con ratas de laboratorio. Los sujetos recibieron un condicionamiento inhibitorio en el que la presentacin de una luz terminaba siempre con una breve descarga (A+) y la presentacin de una clave auditiva (X) que junto con la luz terminaba sin la descarga (AX-), se utiliz el procedimiento estndar de inhibicin condicionada. El condicionamiento inhibitorio se realiz en siete sesiones en los que el sujeto recibi un total de 28 ensayos A+ y 56 ensayos AX -. Recibieron tambin entrenamiento con otro estmulo auditivo (B) en una cmara experimental diferente y este estmulo terminaba con una breve descarga (B+). El objeto de este procedimiento era establecer una excitacin condicionada a dos estmulos diferentes, A y B, y una inhibicin condicionada al estmulo X. Cole y sus colegas luego se preguntaron si la clave presuntamente inhibitoria X suprimira la respuesta a los dos estmulos excitatorios Ay B. Los estmulos A y B se condicionaron como estmulos excitatorios mediante la presentacin de cada uno de ellos por separado junto con la descarga (A+ y B+). El estmulo X se condicion como inhibidor presentndolo junto con el estmulo A si la descarga (AX-). El estmulo Y era un estmulo de control que no haba intervenido en ningn condicionamiento excitatorio o inhibitorio. A era una luz brillante, B, X e Y eran claves auditivas (un clip, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a prueba en el contexto original del condicionamiento B, BX y BY se pusieron a prueba en un contexto diferente. Se midi el tiempo que los sujetos tardaron en beber agua durante cinco segundos de forma ininterrumpida. Cuando los estmulos A y B se presentaron de forma aislada, las ratas tardaron un tiempo considerable en completar el criterio de cinco segundos de ingestin. Pero cuando los estmulos excitatorios se presentaron junto con el inhibidor condicionado, tardaron menos en completar el criterio de cinco segundos de ingestin.

El hecho de presentar el estmulo X con A y B redujo la conducta de supresin de beber que tena lugar cuando A y B se presentaban por su cuenta. En otra condicin de prueba (que se incluye en la figura 3.12) el estmulo B se puso a prueba junto con otra clave auditiva Y. El estmulo Y no se condicion previamente como inhibidor y se present para asegurarse de que la introduccin de un estmulo novedoso junto con el estmulo B no dara lugar a una alteracin de la respuesta condicionada de miedo. Pero tal alteracin no tuvo lugar con el estmulo Y. Por lo que la inhibicin del miedo se limita al estmulo X. X fue capaz de inhibir el miedo condicionado no slo ante el excitador con el que fue entrenado A sino ante otro excitador B que nunca se present junto con X durante el entrenamiento. El procedimiento de prueba del estmulo compuesto para la inhibicin condicionada supone que la presentacin de un inhibidor condicionado o de una seal de seguridad puede reducir los efectos estresantes de una experiencia aversiva. Se invit a una serie de pacientes con ataques de pnico a acudir a los laboratorios acompaados de alguien con quien se sintieran seguros. Se les hizo inhalar una mezcla de gas con altos niveles de dixido de carbono, y posteriormente se les pidi que informaran de sus niveles de ansiedad percibida y de la ideacin catastrofista provocada por la exposicin al dixido de carbono. La manipulacin experimental fue la presencia de los acompaantes. A la mitad de los participantes se les permiti permanecer con sus acompaantes en la misma habitacin durante el experimento, y la otra mitad estuvieron solos durante el experimento. Los resultados demostraron que la presencia de la persona que inspiraba seguridad a los participantes reduca a la mitad la ansiedad y la ideacin catastrofista asociada al ataque de pnico. La prueba del retraso en la adquisicin. Si un estmulo inhibe de forma activa una respuesta particular, entonces debera ser difcil de condicionar ese estmulo para que provoque la conducta. Es decir, la velocidad de la adquisicin de una respuesta excitatoria debera disminuir si el EC es un inhibidor condicionado. Cole y colaboradores en (1997) hicieron un experimento muy similar al de la prueba de sumacin anterior. Tomaron el estmulo X (que haba sido condicionado como inhibidor) y el estmulo Y (que no haba sido utilizado con anterioridad en el procedimiento de condicionamiento) y realizaron una prueba de retraso en la adquisicin emparejando tres veces cada uno de estos estmulos con una descarga. Tras los tres ensayos de adquisicin, cada estmulo se someti a prueba para ver cual provocaba una mayor supresin de la conducta de beber. Efectos de una prueba de inhibicin en el retraso en la adquisicin en un experimento de supresin de lameteo tras el mismo tipo de condicionamiento inhibitorio empleado para predecir los resultados que se presentan en la figura 3.12. El estmulo X se haba condicionado previamente como estmulo inhibitorio, y el estmulo Y no haba recibido entrenamiento previo. El tiempo empleado en completar un total de cinco segundos de ingestin de agua fue mayor en presencia del estmulo de control Y que en presencia del estmulo X. Por lo que el entrenamiento inicial de X retras la adquisicin de propiedades excitatorias de miedo condicionado.

Rescolda, propuso (1969) la utilizacin tanto de la prueba del estmulo compuesto como la del retraso de la adquisicin.

PREDOMINIO DEL CONDICIONAMIENTO CLSICO


El condicionamiento clsico puede tener lugar siempre que un estmulo precede regularmente a otro, y con una demora corta entre el EC y el EI. Se estudia normalmente en laboratorio pero se da tambin en una gran variedad de situaciones fuera de l. Una investigacin interesante es como las personas llegan a considerar que un evento es la causa de otro. Los estudios sobre juicios causales humanos se parecen a los estudios sobre condicionamiento pavloviano en que ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en el grado que esos dos eventos estn relacionados. Lo que quiere decir que los mecanismos asociativos pavlovianos no se limitan a los perros de Pavlov sino que pueden tener un importante papel en los juicios de causalidad informales que realizamos en nuestra vida cotidiana. El condicionamiento pavloviano tambin interviene en las respuestas de los nios y de las madres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debe mantener al bebe en una posicin determinada que proporciona estmulos tctiles especiales tanto para la madre como para el nio. Los estmulos tctiles que percibe el beb pueden condicionarse y elicitar respuestas de orientacin y succin. Los experimentados por la madre pueden condicionarse para elicitar la respuesta de secrecin de la leche en anticipacin de la conducta de succin del beb. El condicionamiento pavloviano es importante tambin en el aprendizaje acerca de situaciones sexuales.

Tema 4: Aprendizaje de relaciones Pavlovianas: Mecanismos.


A QUE DEBEN SU EFICACIA LOS ESTIMULOS CONDICIONADOS E INCONDICIONADOS?
RESPUESTAS INICIALES A LOS ESTIMULOS
Segn pavlov el estimulo condicionado EC inicialmente no provoca la respuesta condicionada, pero acaba hacindolo por el desarrollo de una asociacin con el estimulo incondicionado. El EI elicita la respuesta solo sin entrenamiento. Estas respuestas son particulares debido a ello la identificacin de ECs y EIs potenciales requieren la comparacin entre las distintas respuestas antes del condicionamiento. La identificacin de los ECs y de los EIs es relativa: un suceso puede servir de EC respecto a un estimulo y de EI respecto a otro.

NOVEDAD DE EC Y DE EI
El efecto conductual de un estimulo depende de su novedad (estudios habituacin), tanto si el EC como el EI son familiares el aprendizaje es ms lento que si ambos son novedosos, estudios sobre la novedad se realizan en dos fases. 1. Exposicin repetida del estimulo de forma aislada 2. Ec se empareja con el EI mediante procedimiento estndar condicionamiento clsico La familiarizacin inicial con el estimulo retrasa el condicionamiento. Este fenmeno se denomina efecto de preexposicion al EC o efecto de inhibicin latente, similar a la funcin de habituacin, ambos limitan la cantidad de procesamiento y atencin a estmulos sin consecuencias, la habituacin sesga la conducta elicitada a favor de los Es (estmulos) novedosos, la inhibicin latente sesga el aprendizaje a favor de los Es novedosos. Los experimentos sobre la importancia de la novedad en el EI son parecidos a los experimentos de preexposicion al EC: EI aislado-Ei empareja con EC. Los sujetos familiarizados con el EI antes de su emparejamiento con el EC desarrollan el condicionamiento ms lentamente, este efecto se llama efecto de preexposicion al EI Aunque ninguna teora consigue explicar todos los datos, actualmente se acepta que son varios los mecanismos involucrados, uno de ellos conllevara cierta interferencia asociativa de acuerdo con esta teora las preexposiciones al EC o al EI disminuyen la capacidad de estos estmulos para participar en nuevas asociaciones. La segunda explicacin es la interferencia de memoria: la RC resulta alterada debido a que los participantes recuerdan lo que ocurre en ambas fases del experimento

INTENSIDAD Y SALIENCIA DEL EC I DEL EI


La RC es ms fuerte cuando se utilizan ECs y EIs ms intensos.

El trmino saliencia se corresponde con la significacin o perceptibilidad. Las teoras del aprendizaje suelen asumir que el aprendizaje ser ms rpido si se usan estmulos mas salientes: Un estimulo puede adquirir saliencia aumentando su intensidad tambin hacindolo ms relevante en relacin a las necesidades biolgicas del organismo o hacer que el EC del laboratorio se parezca ms al tipo de estmulos que el animal puede encontrar en su hbitat natural

RELEVANCIA O PERTINENCIA DEL EC-EI


Otra variable que afecta al ritmo de desarrollo del condicionamiento clsico es el grado en que el EC es relevante o pertinente con respecto al EI. Gracia y Koelling (1996) lo demostraron en un experimento ya clsico (ver libro pg. 94), este experimento ilustra el principio de relevancia. El aprendizaje tuvo lugar rpidamente solo si el EC se combinaba con el EI apropiado, el fenmeno parece reflejar una predisposicin gentica para la asociacin selectiva de ciertas combinaciones de estmulos condicionados e incondicionados. LoLordo y asociados tambin han documentado efectos de relevancia en palomas: las claves visuales son relevantes para la conducta de alimentacin y las claves auditivas son relevantes para la conducta defensiva. Tambin se observa conducta de relevancia en la adquisicin del miedo.

EL CONCEPTO DE FUERZA BIOLOGICA


Las respuestas ante el EC no son tan fuertes como las respuestas ante el EI antes del condicionamiento. Pavlov era consciente de esta diferencia en la fuerza biolgica de los estmulos y considero que esta diferencia era necesaria para que fueran efectivos como estmulos C e I, sugiri que para que un estimulo se condicionara deba tener una fuerza biolgica menor que la del estimulo incondicionado, inicialmente el EC deba elicitar menos respuestas y ms dbiles que el EI Condicionamiento de orden superior: Un estimulo puede hacer de EI tras haber sido fuertemente condicionado, ej. Tono- comida, el tono elicitara salivaciones como fuertes respuestas de orientacin y aproximacin, en este momento el tono debera ser efectivo a la hora de condicionar la salivacin a una luz, este efecto se observa con frecuencia y recibe el nombre de condicionamiento de orden superior, opera en diferentes niveles: tono-comida, condicionamiento de primer orden, luz tono, condicionamiento de segundo orden, si tras esto la luz se condicionara con otro estimulo, condicionamiento de tercer orden. Con pocos ensayos no reforzados se obtiene condicionamiento excitatorio de segundo orden. Con entrenamiento ms extenso, se desarrolla inhibicin condicionada. Con el condicionamiento de orden superior, el condicionamiento clsico puede ocurrir sin un estimulo incondicional primario, el nico requisito es que estn disponibles estmulos previamente condicionados Contracondicionamiento: Dos estmulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente respuestas intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese estimulo con un EI que provoca una reaccin opuesta

Precondicionamiento sensorial: Se pueden aprender asociaciones entre dos estmulos que tan solo elicitan una dbil respuesta de orientacin antes del condicionamiento, ej. : triangulo y cuadrado no EC, en la segunda fase del experimento se empareja triangulo con un estimulo incondicionado, descarga, triangulo=miedo, ahora tambin el cuadrado da miedo.

QUE DETERMINA LA NATURALEZA DE LA RESPUESTA INCONDICONADA?


EL MODELO DE SUSTITUCION DEL ESTIMULO
El EC adquiere la capacidad de funcionar como el EI, por tanto se asume que el EC activa los circuitos neuronales que antes activaba solo el EI y elicita respuestas similares a las del EI. Pavlov sugiri que el condicionamiento da lugar al establecimiento de nuevos enlaces neuronales entre los circuitos que previamente activaba el EC y los que, previamente, solo activaba el EI, una vez que esta conexin se ha establecido, la presentacin del EC da lugar a la activacin de los circuitos del EI que a su vez generan la respuesta incondicionada, por tanto el EC se convierte en un sustituto del EI El EI como factor determinante de la RC: Si el condicionamiento convierte al EC en sustituto del EI entonces los ECs condicionados con diferentes EIs deberan provocar diferentes tipos de respuestas condicionadas. La naturaleza de la RC depende del EI; Jenkins y Moore (1973) ver libro pag101: El EC condicionado con la comida provocaba los picoteos relacionados con la comida, y el EC condicionado con agua provocaba los picoteos relacionados con la bebida.

APRENDIZAJE Y HOMEOSTASIS. UN CASO ESPECIAL DE SUSTITUCION DEL ESTIMULO


Cannon introdujo el termino homeostasis para referirse a los mecanismo fisiolgicos que mantiene los aspectos crticos del cuerpo dentro de los niveles aceptables, estos mecanismo funcionaban por procesos de retroalimentacin negativa que servan para contrarrestar las alteraciones una vez que estas ya haban provocado una desviacin de los niveles ptimos, esto puede resultar ineficiente, especialmente si el proceso de compensacin o correccin tarda en activarse. Dworking (1993) sealo que las alteraciones en la homeostasis pueden compensarse ms activamente si pueden anticiparse mediante condicionamiento pavloviano Las respuestas homeostticas condicionadas se han examinado ms extensamente en relacin a la forma en que los organismos responden a la administracin de drogas, suelen provocar alteraciones fisiolgicas que afectan a la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian con la alteracin fisiolgica inducida por la droga pueden llegar a elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias. Tanto las medidas fisiolgicas como los autoinformes sobre el estado emocional proporcionaron pruebas de que los estmulos relacionados con la cocana elicitaban

respuestas condicionadas, incremento significativo del ritmo cardiaco especifico de los estmulos relacionados con la cocana El modelo de condicionamiento de tolerancia a las drogas: Se considera que se ha desarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismas tiene un efecto cada vez menor, tradicionalmente se ha considerado esta tolerancia como debida a procesos farmacolgicos, Siegel, en contraste ha propuesto un modelo basado en el condicionamiento clsico utilizando el concepto de homeostasis aprendida: los cambio fisiolgicos producidos por la droga constituyen el EI que pone en marcha ajustes compensatorios incondicionados RI,. Como resultado de la asociacin con la droga, las claves que acompaan a la administracin de esta adquieren la propiedad de elicitar las respuestas compensatorias que previamente se activaban como respuestas incondicionadas a las alteraciones homeostticas atenuando los efectos de la droga, en consecuencia una importante prediccin de esta teora es que la tolerancia se ver atenuada si los sujetos reciben la droga en condiciones novedosas o en ausencia de las claves que normalmente predicen su consumo. El modelo tambin predice que varios factores que atenan el desarrollo de las respuestas incondicionadas tambin deberan atenuar el desarrollo de la tolerancia a la droga, esto ha sido confirmado por Siegel y colegas El EC como determinante de la forma de la RC: La forma de la RC tambin est influenciada por la naturaleza del EC, Timberlake y Grant (1975) utilizaron comida como EI, el EC fue la presentacin de otra rata justo antes de la administracin de comida, el EC no provoc conductas de roer y morder, elicito respuestas de orientacin, aproximacin y olfateo, as como contactos de tipo social Conducta condicionada y sistemas de conducta: Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo tareas criticas, cada sistema consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estmulos y respuestas relevantes, dispuestos con determinado orden espacial y secuencial. La teora de los sistemas de conducta asume que la presentacin del EI en un procedimiento de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Una prediccin provocadora es que la forma de la RC depender del intervalo EC_EI que se utilice. Este intervalo determina el lugar en que se incorporara el EC dentro de la secuencia de respuestas del sistema de conducta. Ej. Akins 2000 pg. 107.Con un intervalo de ECEI 1 minuto el condicionamiento produjo bsqueda focalizada, con EC EI de 20 minutos bsqueda general. De acuerdo con la teora el EC no sustituye ni compensa al EI, sustituye a un estimulo en el punto del sistema de conducta determinado por el intervalo EC EI Aprendizaje E_R frente a aprendizaje E_E: Histricamente la conducta condicionada se vea como una conducta elicitada directamente por el EC de acuerdo con la teora del aprendizaje E_R, establece una nueva conexin estimulo respuesta entre el EC y la RC. La teora del aprendizaje E_E los sujetos aprenden una asociacin estimulo-estimulo entre el EC y el EI, los sujetos responden al EC, no porque este elicite directamente una

RC, sino porque el EC activa una representacin del EI. La presentacin del EC hace que el sujeto piense en el EI y esta es la causa de la conducta condicionada. Una tcnica de investigacin importante para decidir entre aprendizaje ER y EE es la de la devaluacin del EI, Holland y Rescolda Ver libro pg. 108

COMO SE ASOCIAN LOS ESTIMULOS CONDICIONADOS E INCONDICIONADOS?


El efecto de bloqueo: Conlleva una secuencia de sucesos similar.1-se asocia EC (estimulo a) y EI, una vez que el ECa est bien condicionado, se aade el segundo estimulo, estimulo b) al estimulo a y se presentan los dos juntos: el hallazgo bsico es que el condicionamiento previo de a bloquea el desarrollo de la RC al estimulo b. Este efecto se ha convertido en un fenmeno clave del condicionamiento clsico porque puso en duda el presupuesto de que la contigidad temporal es suficiente para el aprendizaje Kamin, su descubridor explico el efecto proponiendo que, para que se produzca aprendizaje de forma efectiva el EI deba ser sorprendente, los eventos inesperados activan procesos que llevan a un nuevo aprendizaje.

El modelo de Rescorla y Wagner


Mediante este modelo las implicaciones del concepto de sorpresividad del EI se extendieron a una amplia variedad de fenmenos de condicionamiento. Un EI inesperadamente grande es la base del condicionamiento excitatorio o del incremento de la fuerza asociativa, y un EI inesperadamente pequeo es la base del condicionamiento inhibitorio o de la disminucin de la fuerza asociativa. AV=k(lambda-V), donde k es una constante relacionada con la salienza del EC y del EI. Aplicacin del efecto de bloqueo: ver libro pag113 Prdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la importancia del modelo se debe a sus inusuales predicciones, una de tales predicciones es que en ciertas circunstancias, las propiedades condicionadas de los estmulos se reducirn a pesar de que siga habiendo emparejamientos con el EI el EI Problemas del modelo Rescorla Wagner: 1. Su anlisis de la extincin de la inhibicin es incorrecto. Algunos investigadores han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades inhibitorias 2. el modelo considera la extincin como lo opuesto a la excitacin, o a la vuelta a un valor asociativo 0, pero la extincin no debera verse como una mera inversin de la adquisicin. La extincin parece involucrar el aprendizaje de una nueva relacin entre el EC y el EI 3. En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias como inhibitorias, en el modelo no pueden ser ambos

4. El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversin al sabor y olor, En experimentos similares al de efecto de bloqueo, cabria esperar que la presencia del EC previamente condicionado interfiriera en el condicionamiento del EC aadido en la fase 2: se encontr el resultado opuesto: un efecto de aumento o de contrabloqueo.

Otros modelos de condicionamiento clsico


Modelos atencionales de condicionamiento Los britnicos se han aproximado a fenmenos como el bloqueo postulando cambios en la forma en que el EC capta la atencin del sujeto. Las teoras atencionales difieren en sus supuestos sobre qu es lo que determina la saliencia del EC en un ensayo. Pearce y Hall (1980) asumen que el grado de atencin depende del grado de atencin en el que el EI haya sido sorprendente en el ensayo anterior, esta es una diferencia importante con Rescorla Wagner que asumen que la sorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo. Factores temporales y respuesta condicionada Por encima de un punto ptimo los procedimientos con intervalos EC EI ms largos producen menos respuestas. Otra variable temporal importante es el intervalo entre ensayos, en general en ensayos mas separados entre s mayor respuesta condicionada. Ms interesante resulta que el intervalo entre ensayos y la duracin del EC interactan a la hora de determinar la respuesta. Numerosos ensayos han mostrado que el factor crtico es la duracin relativa de estas dos variables, ms que el valor absoluto de las mismas. Se han ofrecido varias interpretaciones sobre porque la respuesta condicionada esta tan fuertemente determinada por la razn IEE/DE:1Hipotesis de espera relativo: se supone que un EC proporciona informacin acerca de la aparicin del EI solo si el sujeto tiene que pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto experimental: cuando la Razn IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo de espera en el contexto: en este caso, el EC proporciona poca informacin adicional sobre el momento de aparicin del EI y no se desarrollara mucha respuesta condicionada. Cuando la razn IEE/ED es alta, el tiempo de espera ante el EC es mucho menor que el tiempo de espera en el contexto. Esto hace que el EC aporte informacin sobre el momento que aparece el EI, y la respuesta condicionada ser ms fuerte La hiptesis del comparador de R.Miller Se parece a la hiptesis del tiempo de espera relativo, en que asume que la RC depende no solo de la asociacin entre el EC y EI, sino tambin de todas las posibles asociaciones que puedan establecerse en claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante el entrenamiento con el EC crtico es especialmente importante. Otra restriccin del modelo del comparador es que solo permite asociaciones excitatorias con el EI. El modelo asume que el que la RC refleje excitacin o inhibicin eta determinado por la fuerza relativa de la excitacin

condicionada al EC en comparacin con la excitacin condicionada a las claves contextuales presentes durante el entrenamiento del EC Hace ms hincapi en las asociaciones que en el tiempo: asume que los sujetos aprenden tres asociaciones 1. Une el EC crtico (X) con el EI. (de forma directa) 2. Une el EC crtico con las claves contextuales de comparacin 3. Une los estmulos de comparacin y el EI (de forma indirecta) La hiptesis del comparador no indica cmo se establecen las asociaciones, se trata de una teora de ejecucin, no de aprendizaje. La comparacin entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba. Tambin se ha probado esta hiptesis en estudios sobre inhibicin condicionada. Atribuye la inhibicin condicionada a situaciones en las que la asociacin del EC crtico con el EI es ms dbil que la asociacin de las claves contextuales con el EI. (esto se entiende observando la balanza de la pgina 120, en el medio tenemos un medidor apuntando al 0 y dependiendo de lo que tenga ms valor se desplazar hacia la izquierda (inhibicin) o hacia la derecha (excitacin). Es la nica hiptesis que predice que la extincin de la inhibicin condicionada se puede lograr no presentando el EC- de forma aislada, sino extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-. El modelo predice tambin que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducir la respuesta condicionada del EC crtico. Otra contribucin ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecucin ms que en el aprendizaje. Cuando se presenta el Ec este activa la representacin del EI tanto directamente (asoc 1) como indirectamente (asoc 2 y 3). La comparacin de las activaciones directa e indirecta del Ei determina el grado de respuesta excitatoria o inhibitoria. No indica cmo se establecen las asociaciones, es una teora de la ejecucin. Un importante corolario es que la comparacin entre asociaciones EC-EI y el contextoEI se realiza en el momento de la prueba. Predice quela extincin de la asociacin contexto EI despus del entrenamiento del EC potenciara la respuesta al EC critico Principal contribucin ha sido su nfasis en que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecucin ms que en el aprendizaje, considera el efecto bloqueo como un fallo en la ejecucin, Predice que la extincin del estimulo bloqueador elevara la RC al EC bloqueado

Tema 5: Aprendizaje respuesta-consecuencia.


En este captulo se vuelve la vista al anlisis de las situaciones de aprendizaje en las cuales los estmulos a los que un organismo se enfrenta son el resultado directo de su conducta, descrita como dirigida a una meta. La conducta de sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias se denomina conducta instrumental.

Primeras investigaciones sobre el condicionamiento instrumental


Los anlisis tericos y de laboratorio del condicionamiento instrumental comenzaron formalmente con el trabajo de thorndike, su intencin original era estudiar la inteligencia animal. Estudio la cuestin planteada por Darwin sobre que capacidades intelectuales humanas estaban presentes en los animales mediante investigacin emprica, para ello invento una serie de cajas problema donde introduca un gato hambriento con algo de comida fuera de la vista del animal, su tarea era aprender a salir de la caja y obtener la comida. La cuidadosa aproximacin emprica de Thorndike fue un avance significativo en el estudio de la inteligencia animal. Otra contribucin importante fue la estricta evitacin de interpretaciones antropomrficas de la conducta observada, en lugar de ello interpreto los resultados de sus estudios como el reflejo del aprendizaje de una asociacin E-R .A medida que la asociacin o conexin entre las claves de la caja y la respuesta con xito se haca ms fuerte, el gato llegaba a realizar esta de forma ms rpida. La consecuencia de la respuesta exitosa fortaleca la asociacin entre los estmulos de la caja y esa respuesta. Sobre la base de eta investigacin, Thorndike formulo la ley del efecto: si una respuesta en presencia de un estimulo es seguida por un suceso satisfactorio, la asociacin E-R se fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje E-R.

Aproximaciones modernas al estudio del condicionamiento instrumental


Procedimientos de ensayo discreto
Similares al mtodo de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en las investigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra. Otro laberinto muy utilizado es el de forma de T, diseado para estudiar la conducta de eleccin La conducta en el laberinto puede cuantificarse midiendo la velocidad de carrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida comn es la latencia , tiempo que tarda el animal en abandonar la caja salida y empezar a desplazarse por el pasadizo, las latencias se hacen ms cortas a medida que progresa el entrenamiento.

Procedimientos de operante libre


Permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones, ideado por Skinner para estudiar la conducta de una manera ms continua. Estaba interesado en analizar en el laboratorio una forma de conducta que fuese representativa de toda la actividad en curso que ocurra de forma natural. La conducta no se divide como si fueran molculas, por eso propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado. Una respuesta operante se defina a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma operante. Entrenamiento y moldeamiento al comedero: Hay algunos pasos preliminares para establecer la conducta de presin de la palanca, 1 los animales tienen que aprender cuando est disponible la comida en el comedero, esto comprende un condicionamiento clsico, tras suficientes emparejamientos del sonido del dispensador con la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo, esta fase preliminar se llama entrenamiento al comedero. Despus, el organismo est preparado para aprender la respuesta instrumental requerida. Si la respuesta no es algo que el animal ya realiza, nunca suceder por si mima, para facilitar la adquisicin de una nueva respuesta operante, al principio la comida se entrega si el animal hace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que la respuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza la respuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre la palanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la rata presiona la palanca, esta secuencia de pasos se denomina moldeamiento, este incluye dos tcticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta requerida y no reforzamiento de las formas de respuesta ms tempranas. Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo la construccin o sntesis de una nueva unidad conductual a partir de componentes de respuesta preexistentes que ya se encuentran en el repertorio del sujeto. El condicionamiento instrumental puede tambin utilizarse para producir respuestas que no se parecen en nada a lo que el individuo es probable que haga sin entrenamiento. El moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, los procedimientos de moldeamiento no tendran xito. El moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo. La tasa de respuesta como medida de la conducta operante: los mtodos de operante libre permiten una observacin continua durante largos periodos, proporcionan una ocasin especial para observar cambios en la probabilidad de la conducta a lo largo del tiempo. Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente en procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso que la tasa de ocurrencia de una conducta operante (frecuencia por minuto por ej.)Se utilizase como medida de la probabilidad de respuesta.

Procedimientos de condicionamiento instrumental

Una consecuencia placentera se denomina tcnicamente estimulo apetitivo. Una consecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar el estimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuesta y su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar o eliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativo entre la respuesta y su consecuencia: Que el resultado de un procedimiento de condicionamiento sea un aumento o una disminucin de la tasa de respuesta depende tanto de la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia. Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce un estimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da la respuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre la respuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incremento en la tasa de respuesta. Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima un estimulo molesto o aversivo. Produce disminucin en la respuesta instrumental. Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene la presentacin de un suceso ambiental. Un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estimulo aversivo de denomina reforzamiento negativo. Hay dos tipos, escape y evitacin. En el escape, el estimulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental. La presencia de un estimulo aversivo establece la ocasin para la ocurrencia de la respuesta instrumental, entonces es reforzada por la terminacin del estimulo aversivo. La evitacin implica la programacin de un estimulo aversivo para ser presentado en algn momento del futuro. En este caso la respuesta instrumental previene la entrega del estimulo aversivo Entrenamiento de omisin: Incluye una contingencia negativa entre la respuesta instrumental y un suceso ambiental. En este caso la respuesta instrumental previene la presentacin de un estimulo apetitivo o placentero. A menudo es el preferido para disuadir la conducta humana (nio a su habitacin). Los procedimientos de entrenamiento de omisin se denominan en ocasiones reforzamiento diferencial de otras conductas o RDO. Este trmino refleja el hecho de que el individuo recibe un estimulo apetitivo peridicamente a condicin de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento, implica el reforzamiento de otras conductas. La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo

Elementos fundamentales del condicionamiento instrumental


La esencia de la conducta instrumental es que est controlada por sus consecuencias. El condicionamiento instrumental consta de tres elementos claves; una respuesta, una consecuencia (el reforzador) y una relacin o contingencia, entre la respuesta y la consecuencia. La respuesta instrumental

El resultado de los procedimientos del condicionamiento instrumental depende en parte de la naturaleza de la respuesta que se este condicionando. Algunas respuestas son ms fcilmente condicionables que otras. Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este nfasis alent la creencia de que los procedimientos de condicionamiento instrumental producan repeticiones de la misma respuesta- que producan uniformidad o estereotipia en la conducta- . Sin embargo, esto no significa que el condicionamiento instrumental no pueda verse tambin involucrado en la produccin de respuestas creativas o variables. Los organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer algo nuevo ej. Pg. 137. Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el trmino de pertinencia para explicar los fallos en el entrenamiento del rascado y del bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la historia evolutiva del animal. Los Breland denominaron deriva instintiva Al desarrollo de respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y competan con las respuestas que requera el investigador. Sistemas de conducta y limitaciones en el condicionamiento instrumental: Las limitaciones de respuesta que se han descrito son coherentes con la teora de los sistemas de conducta. La efectividad del procedimiento para el incremento de una respuesta instrumental depender de la compatibilidad de esa respuesta con la organizacin preexistente del sistema de alimentacin. Shettleworth (1975) encontr que la privacin de comida disminua la probabilidad de respuestas de autocuidado pero incrementaba la probabilidad de actividades dirigidas al ambiente como cavar etc. Este patrn de resultados es el que se ha observado en estudios de condicionamiento instrumental. Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizar un experimento de condicionamiento clsico; un EC llega a elicitar componentes del sistema de conducta activado por el EI: Si la deriva instintiva refleja las respuestas del sistema de conducta, las respuestas anlogas a la deriva instintiva deberas ser evidentes en un experimento de condicionamiento clsico. Timberlake y colaboradores comprobaron estas predicciones ratas utilizando una modificacin de los estudios de manipulacin de monedas de Brelands. El reforzador instrumental Cantidad y naturaleza del reforzador: En un estudio sistemtico, Hutt (1954) intento aislar los efectos de la cantidad y naturaleza del reforzador alimenticio liquido mediante la variacin sistemtica de ambos rasgos. Los incrementos en la calidad y cantidad produjeron mayor tasa de respuesta. Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la efectividad de un reforzador dependa no solo de sus propiedades sino tambin de cmo ese reforzador se compara con otros que el individuo haya experimentado. La

efectividad de un EI en el condicionamiento clsica depende de cmo se compare el EI con las expectativas del individuo basndose en la experiencia previa, esta es la idea fundamental del modelo Rescorla-Wagner, si el EI es mayor de lo esperado, producir condicionamiento excitatorio, si el EI es menor producir condicionamiento inhibitorio. La evidencia experimental confirma esta impresin, los efectos de una cantidad o tipo de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo ha experimentado previamente. Mellgren (1972) ver ejemplo libro pg. 144. Los resultados que obtuvo ilustran el fenmeno de contraste positivo; se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva y contraste negativo; se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. Los efectos de contraste tambin se dan si las condiciones de recompensa se modifican una y otra vez con una clave diferente sealando cada condicin de recompensa, estos efectos son ejemplo de contraste conductual simultaneo. Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situacin est determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. Por razones que no estn totalmente claras, el contraste negativo se ha obtenido de forma ms clara que el contraste positivo. La relacin respuesta reforzador La conducta instrumental eficiente requiere sensibilidad a la relacin respuesta reforzador. Existen dos tipos de relaciones entre una respuesta y un reforzador, una es la relacin temporal. Que se refiere al tiempo que transcurre entre la respuesta y el reforzador, un tipo especial de relacin temporal es la contigidad temporal, la cual se refiere a la entrega del reforzador inmediatamente despus de la respuesta. El segundo tipo de relacin es la relacin causal o contingencia respuesta reforzador, se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador. Los factores temporales y causales son independientes unos de otros. Efectos de contigidad temporal: El reforzamiento inmediato es preferible al reforzamiento demorado. Los psiclogos del aprendizaje han resaltado que el condicionamiento instrumental requiere proporcionar el reforzador inmediatamente despus de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizaje instrumental puede deteriorarse con demoras tan cortas como 0.5 seg. El hecho recurrente es que el aprendizaje instrumental se altera demorando el reforzador tras la ocurrencia de la respuesta instrumental. Hay varios factores que pueden contribuir a este deterioro, cuando el reforzamiento es demorado tras la realizacin de una respuesta, R1, el organismo no deja de hacer cosas, r2 r3 r4 etc. <si el reforzador se establece en r1 pero no se entrega hasta algn tiempo despus el reforzador puede ocurrir despus de alguna otra respuesta por ej. R5. Para asociar r1 con el reforzador, el organismo tiene que poder distinguir r1 de otras respuestas que realiza durante el intervalo de demora. Hay dos formas de resolver este problema. La primera tcnica, es proporcionar un reforzador secundario o condicionado inmediatamente despus de la respuesta instrumental, este es un estimulo condicionado que previamente ha sido asociado con el reforzador. Otra tcnica es marcar la respuesta

instrumental criterio de alguna manera para hacerla distinguible de otras actividades del organismo. La efectividad del procedimiento de marcado se demostr por primera vez por Lieberman, Mcintosh y Thomas (1979) La contingencia respuesta-reforzador: Los estudios de demora del reforzamiento muestran que no es suficiente una relacin causal perfecta entre la respuesta y el reforzador para producir una respuesta instrumental vigorosa: incluso con una relacin causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. Datos como estos alentaron pronto a los investigadores a concluir que la contigidad respuesta-reforzador ms que la contingencia era el factor crtico que produca el aprendizaje instrumental. No obstante esta visin ha resultado injustificada por la investigacin posterior. L a contingencia respuesta-reforzador es tambin importante. El experimento de supersticin Skinner: Fue un hito en el debate sobre el papel de la contigidad frente a la contingencia en el aprendizaje instrumental. Las palomas parecan estar respondiendo como si la conducta controlara la entrega del reforzador. La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio, se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador, un segundo emparejamiento accidental aumenta aun ms la probabilidad de la respuesta, de esta forma cada emparejamiento ayuda a estampar una respuesta particular. Reinterpretacion del experimento de supersticin: la afirmacin de Skinner ha sido puesta en duda por la evidencia emprica posterior. Stadon y Simmelhag (1971) realizaron observaciones ms extensas, definieron y midieron la ocurrencia de muchas respuestas, algunas respuesta ocurran de modo predominante hacia el final del intervalo entre reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del reforzador y disminuan a medida que se acercaba el tiempo de la siguiente comida; respuestas de interin. Las acciones que eran respuestas terminales y las que eran respuestas de interin no variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento accidental. La investigacin posterior ha proporcionado mucha evidencia adicional de que las presentaciones peridicas de un reforzador producen regularidades en la conducta. Explicacion de la periodicidad de las respuestas de interin y terminales. Staddon y Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie que reflejan la anticipacin de la comida a medida que en el tiempo se encuentra ms cerca de la prxima presentacin de comida. En contraste, entendieron las respuestas de interin como una manifestacin de otras fuentes de motivacin que eran ms importantes al comienzo del intervalo entre comidas, cuando la presentacin de comida era improbable. Los investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las respuestas terminales y de interin se consideran diferentes manifestaciones del mismo sistema motivacional. La teora mejor desarrollada es la teora de sistema de conducta: el sistema de alimentacin esta activado en animales privados de comida a los que se les proporciona peridicamente pequeas cantidades de comida. Justo despus de la entrega de comida se asume que el

organismo realiza respuestas de bsqueda focalizada poscomida, en medio del intervalo entre entregas ocurren respuestas de bsqueda general, en el momento de la prxima entrega de comida respuestas de bsqueda focalizada. La distribucin de las actividades que se desarrollan con la entrega peridica de un reforzador depende de la naturaleza de ese reforzador, se desarrollan diferentes sistemas de conducta, congruente con la teora de sistemas, segn sea agua o comida, debido a que activan diferentes patrones de forrajeo. Efectos de la controlabilidad de los reforzadores: Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Los estudios acerca de los efectos de control sobre reforzadores han proporcionado la evidencia ms amplia de la sensibilidad de la conducta a las contingencias respuesta-reforzador. La mayora de la investigacin se ha centrado en los efectos de control sobre la estimulacin aversiva, esa se origino con los estudios pioneros de Seligman, overmier y Maier, quienes investigaron los efectos de la exposicin a una descarga incontrolable en el aprendizaje posterior de escape-evitacin en perros. El hallazgo ms importante fue que la exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Efecto de indefensin aprendida. 1 Diseo tradico: los experimentos sobre indefensin aprendida se realizan normalmente utilizando este diseo, incluye dos fases; exposicin, un grupo de ratas (E escape) es expuesto a descargas peridicas que puede finalizar mediante la realizacin de un respuesta de escape. Cada sujeto del segundo grupo (a, acoplado) es acoplado a un animal del grupo E y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer grupo (C confinado), no recibe descargas durante la fase de exposicin pero est confinado en el aparato tanto tiempo como los otros grupos, Durante la fase de condicionamiento, los tres grupos reciben entrenamiento escapeevitacin. El hallazgo destacable es que los efectos de la estimulacin aversiva durante la fase de exposicin dependen de si la descarga es o no es escapable. La exposicin a una descarga incontrolable (grupo A) produce una severa interrupcin del aprendizaje posterior de escape-evitacin, esto indica que los animales son sensibles a las diferencias procedimentales entre la descarga escalable y la descarga inescapable. L principal diferencia procedimental entre los grupos E y A es la presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo A. 2- La hiptesis de la indefensin aprendida: la primera explicacin importante estaba basada en la conclusin de que los animales pueden percibir la contingencia entre su conducta y la entrega de un reforzador. La hiptesis de la indefensin aprendida asume que durante la exposicin a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta. Es ms, llegan a esperar que los reforzadores continuaran siendo independientes de su conducta. Esta expectativa de ausencia de control debilita su habilidad para aprender una nueva respuesta instrumental, esto ocurre por dos razones, primero, la expectativa de falta de control reduce la motivacin de los sujetos para realizar una respuesta instrumental. Segundo, incluso si realizan la respuesta y son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de falta de control hace ms difcil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento.

Es importante distinguir la hiptesis de indefensin aprendida del efecto de indefensin aprendida. El efecto de indefensin aprendida es el patrn de resultados obtenido con el diseo tradico, este ha sido reproducido en numerosos estudios y es un hallazgo bien establecido. En contraste, desde que se propuso, la hiptesis de indefensin aprendida ha sido una explicacin sugestiva y controvertida del efecto de indefensin aprendida. 3- Dficit de actividad: el dficit de aprendizaje observado en el grupo A era resultado de que aprendan a ser inactivos durante la fase de exposicin. Congruente con esta hiptesis, en algunas situaciones la descarga inescapable produce una disminucin en el movimiento motor, y a esto se deberan los posteriores dficits de actuacin. Hay tambin situaciones en las cuales los efectos del aprendizaje probablemente no son debidos a la supresin del movimiento causada por la descarga inescapable. Por tanto la hiptesis de la inactividad aprendida no puede explicar todos los ejemplos de efectos de indefensin aprendida. 4- dficit atencional: Que la descarga provoque que los animales presten menos atencin a sus acciones. Si un animal no presta atencin a su conducta, tendr dificultad para asociar sus acciones con los reforzadores en el escape-evitacin o en otras formas de condicionamiento instrumental. Maier, Jackson y Tomie (1987) probaron esta hiptesis de dficit atencional con ratas, razonaron que la atencin reducida a la conducta instrumental tambin poda ser aliviada mediante la introduccin de una clave externa de retroalimentacin de la respuesta o estimulo de marcado 5- relaciones estimulares en el condicionamiento de escape: Resulta evidente que el condicionamiento de escape resulta ms complejo de lo que se pensaba anteriormente. El rasgo definitorio d la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminacin de un estimulo aversivo. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentacin de la respuesta. Algunos de estos estmulos producidos por la respuesta son experimentados al comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan claves de retroalimentacin de la terminacin de la descarga. Otros estmulos producidos por la respuesta son experimentados cuando el animal completa la respuesta, justo despus de que la descarga se haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves de retroalimentacin de la seal de seguridad, estas son seguidas de forma fiable por el intervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estas claves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo y limitan o inhiben el miedo elicitado por las claves contextuales de la cmara experimental. Estas seales de seguridad no existen para los animales que estn acoplados a la descarga inescapable porque, para ellos, los periodos de descarga no descarga no son predecibles. Centrarse en los factores estimulares del condicionamiento de escapeen lugar de las contingencias respuesta-reforzador no ha permitido todava el desarrollo de una explicacin comprensiva de todos los resultados con el diseo tradico.

Tema 6: Programas de refuerzo y conducta de eleccin.

PROGRAMAS SIMPLES o razn fija o razn variable o intervalo fijo o intervalo variable PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA o RDA (reforzamiento diferencial tasas altas) o RDB (reforzamiento diferencial tasas bajas)

Hasta aqu incluyen UNA NICA RESPUESTA y el reforzamiento de esa respuesta no proporcionan una visin completa de la conducta.

ANLISIS DE LA CONDUCTA DE ELECCIN o programas concurrentes ELECCIN CON COMPROMISO o programas concurrentes encadenados

Un programa de reforzamiento: es un programa o regla que determina cmo y cundo la ocurrencia de una respuesta ir seguida de un reforzador. Estos programas se investigan normalmente en cajas de Skinner. Estudian muy bien LOS FACTORES que controlan el mantenimiento de la conducta y su realizacin continuada. Zeiler denomin a estos programas EL GIGANTE DURMIENTE del anlisis de la conducta

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE


En estos programas SIMPLES 1 solo factor determina qu ocurrencia de la respuesa instrumental se refuerza.

PROGRAMAS DE RAZN
El reforzamiento depende slo del nmero de respuestas que el organismo realiza. Se cuenta en n. de respuesta ocurridas y entregar el reforzador cada vez que se alcance el n. requerido. REFORZAMIENTO CONTINUO (RFC). Slo sucede en el laboratorio. REFORZAMIENTO PARCIAL O INTERMITENTE: las respuestas se refuerzan slo alguna vez. RAZN FIJA: predictible (nmero predecible de respuestas para cada refuerzo). Cuando cada 10 respuestas apretar una palanca por cada reforzador RF 10. (pagar por el nmero de piezas que montan), etc..Es decir, un programa de reforzamiento continuo es tambin un programa de razn fija. Es un programa de reformaziento continuo RFC (razn fija continua). Los organismos sueles responder a una tasa constante PERO moderada, slo se dan pausas breves e impredecibles. (una paloma, al principio picotear ms para conseguir comida y luego lo har ms lentamente a medida que sacie el apetito).Se da una tasa constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar. Esta caracteristica de la respuesta se puede

observar en un REGISTRO ACUMULATIVO DE LA CONDUCTA: representa la forma de repetirse una respuesta a lo largo del tiempo. (n. respuestas totales o acumuladas en un momento determinado de tiempo). La pendiente de la linea trazada por este registro representa la TASA DE RESPUESTA del sujeto. La tasa 0 de respuesta que se observa justo despus del reforzamiento se llama PAUSA POSREFORZAMIENTO. La longitud de esta pausa est controlada por el requerimiento de la razn subsiguiente . Por eso de llama tambin PAUSA PRERAZN LA CARRERA DE LA RAZN: es la tasa de respuesta ALTA y ESTABLE que completa cada requerimiento de la razn. Si el requerimiento de la razn se incremente un poco (de RF 120 a RF 150), la tasa de respuesta puede permanecer igual durante la carrera de razn, Con aumentos considerables ocurren pausas posreforzamiento ms largas. Este efecto se llama TENSIN DE LA RAZN por eso no hay que aumentar la razn requerida demasiado rpido, puede desistir por completo. Un programa intermitente de razn fija: se da un patrn de respuestas muy diferentes. No es probable pausas en medio de la accin de marcar un nmero de telfono, RAZN VARIABLE: IMPREDECIBLE mediante la variacin del nmero de respuestas requerido para el reforzamiento de una ocasin a la siguiente. Sigue siendo de razn porque el reforzamiento depende del n. de respuestas que realiza el organismo. Este RV ( aqui se utiliza el nmero MEDIO (la media) de respuestas requerido, al principio 13, luego 7, etc... por eso RV 10): Como es impredecible las pausas son menos probables con esos programas RV (hay una tasa claramente estable). Se pueden dar pausas posreforzamiento pero son menos intensas

PROGRAMAS DE INTERVALO
Tras cierta cantidad de TIEMPO INTERVALO FIJO (cantidad FIJA de tiempo) IF 4 minutos el tiempo establecido no varia de una ocasin a otra. El patrn de respuesta se llama FESTN DEL INTERVALO FIJO. Un IF 4 minutos no garantiza que el reforzador se proporcionar en algn momento a los largo del intervalo de tiempo. Se requieren respuestas como en RAZN. El intervalo determina slo cundo el reforzador est disponible, NO cundo se entrega (programacin de los exmenes se parecen al IF, al principio se dedica poco tiempo al estudio, se estudia ms una semana antes del exmen, la tasa se incremente cuando se aproxima el da de examen). INTERVALO VARIABLE TIEMPO IMPREDECIBLE IV tiempo impredecible para dispensar el reforzador . Es un intervalo MEDIO (la media) IV 2 minutos . Se tiene que realizar una respuesta. Los reforzadores no se dan gratis. No hay pausas con tasas de respuestas CONSTANTES.

PROGRAMAS DE INTERVALO Y ESPERA LIMITADA Son programas FUERA de laboratorio, el reforzador est disponible SLO durante PERIODOS LIMITADOS. (horario restaurantes). Este tipo de RESTRICCIN en cuanto al tiempo que permanece el reforzador disponible se llama ESPERA LIMITADA.Esta restriccin se puede aplicar tanto a IF como a IV.

COMPARACIN DE LOS PROGRAMAS DE RAZN Y DE INTERVALO


RF y IF: ambos producen una pausa posreforzamiento despus de de la administracin de cada reforzador. Ambos reciben altas tasas de respuesta JUSTO ANTES de la administracin del siguiente reforzador. RV y IV: mantienen tasas estables de respuestas SIN PAUSA PREDECIBLE. Los programas de razon y intervalo activan DIFERENTES CAMBIOS NEUROQUMICOS en el cerebro. Los programas de razn son capaces de producir tasas de respuesta MS ALTAS que los programas de intervalo. El factor crtico es el espaciamiento entre respuestas que se da justo antes del reforzamiento. Reforzamiento diferencial del tiempo interrespuesta: TIR Es el intervalo entre una respuesta y la siguiente TIR o tiempo interrespuesta. Si se refuerzan los TIRs cortos = el sujeto realiza TIRs cortos. Si se refuerzan TIRs largos = realiza TIRs largos. Con TIRs cortos = responder a una tasa ALTA. Sujeto que produce TIRs largos, responder a una tasa baja. Un programa de razn = favorece que no se espere mucho entre las respuestas.Favorece tiempos interrespuesta cortos Un programa de intervalo =no favorecen los TIRs cortos, sino una ejecucin con TIRs largos, que deriva en tasas de respuestas ms bajas que en razn.

PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA


Fuera del laboratorio, en situaciones que requiere tasas de respuesta particulares (deporte de velocidad , cadena de montaje) Ni razn e intervalo requieren una tasa especifica de respuesta para conseguir el reforzamiento. Los programas de tasas de respuesta requieren una tasa particular para obtener el reforzador. Depende aqu de cun pronto ocurra tras la respuesta precedente. Por ejem. Que una respuesta se refuerce slo si ocurre 5 segundos siguientes a la respuesta precedente.Entonces su tasa de respuesta ser de 12 por minuto o mayor RDA (Reforzamiento diferencial de tasas altas). Fomenta tasas altas de respuesta. En RDA una respueta se refuerza slo si ocurre ANTES de que haya transcurrido cierta cantidad de tiempo TRAS la respuesta precedente. EL reforzamiento diferencial de tasas bajas RDB fomentan que los sujetos respondan lentamente, pues se refuerza una respuesta SOLO si ocurre DESPUES de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa.

CONDUCTA DE ELECCIN: PROGRAMAS CONCURRENTES


( al mismo tiempo 2 ms programas) La situacin de eleccin ms simple = 2 respuestas alternativas, cada una de stas seguidas por un reforzador de acuerdo con su propio programa de reforzamiento. Se empez estudiando la conducta de eleccin utilizando LABERINTOS en T especialmente. Actualmente se utilizan cajas de Skinner equipadas con 2 manipulandos, como 2 teclas de picoteo. Los 2 programas ocurren al mismo tiempo (o concurrentemente) El sujeto es libre de cambiar de una tecla de respuesta a la otra PROGRAMA CONCURRENTE que permiten una medicin continua de la eleccin. Programa A (IV 60 seg.) Tecla A Programa B (RF 10) Tecla B

MEDIDAS DE LA CONDUCTA DE ELECCIN


Entre 2 respuesta alternativas. Hay 2 formas de medicin: 1.- calcular la TASA RELATIVA DE RESPUESTA de cada alternativa. Es decir de la tecla A se divide su tasa de respuesta por la tasa total de respuesta: RA/ (RA + RB) La forma de distribucin de la conducta entre las 2 alternativas de respuesta est muy influida por el programa de reforzamiento que funciona en cada respuesta. 2.- calcular la TASA RELATIVA DE REFORZAMIENTO conseguido para cada alternativa de rspuesta se calcula igual que la anterior: rA/ (rA + rB)

LA LEY DE LA IGUALACIN
La tasa relativa de respuesa y la tasa relativa de reforzamiento son iguales. Herrnstein establece esta relacin como una ley de conducta. La primera expresin matemtica: RA/(RA +RB) = rA/rA + rB) Como antes RA y RB = tasas de respuesta en las teclas A y B rA y rB = tasas de reforzamiento conseguidas en cada alternativa de respuesta. La segunda expresin matemtica: RA/RB = rA/rB

Representan el mismo principio bsico: Las tasas relativas de respuesta se IGUALAN con las tasas relativas de reforzamiento INFRAIGUALACIN, SUPRAIGUALACIN Y SESGO DE RESPUESTA La Ley de igualacin indica que las elecciones NO se hacen de forma caprichosa (son una funcin ordenada de las tasas de reforzamiento). Actualmente las tasas relativas de respuesta NO SIEMPRE se igualan exactamente con las tasas relativas de reforzamiento. Se aaden 2 parmetros b, s a la frmula RA/RB = b(rA/rB)elevado el parentesis a s) S= representa la SENSIBIIDAD de la conducta a la eleccin a las tasas relativas de reforzamiento. Cuando existe una igualacin perfecta s = 1, las tasas relativas de respuesta son una funcin DIRECTA de las tasas relativas de reforzamiento. INFRAIGUALACIN:un tipo de desviacin perfecta incluye una sensibilidad reducida de la conducta de eleccin a las tasas relativas de reforzamiento y se acomoda dando al exponente s un valor MENOR a 1. Se encuentra la infraigualacin ms a menudo que la supraigualacin. Hay muchas variables que influyen. Hacer ms difcil el cambio de una alternativa de respuesta a otra INCREMENTE el parmetro de sensibilidad. SUPRAIGUALACIN:se acomodan los resultados dotando al exponente de un valor MAYOR a 1. B= sesgo (en ingls bias). Estos sesgos influyen en las respuestas cuando las alternativas de respuesas son DIFERENTES . Una preferencia (o sesgo) por una respuesta o un reforzador sobre la otra influye en el parmetro del sesgo b. Si no hay sesgos b= 1. LA LEY DE LA IGUALACIN Y EL VALOR DEL REFORZADOR La relacin de igualacin se ha extendido a otros aspectos de los reforzadores distintos de su tasa de ocurrencia. La tasa relativa de respuesta es una funcin de la cantidad relativa de cada reforzador, y la demora relativa del reforzamiento. La tasas relativas de respuesta estn determinadas por la PALATABILIDAD de los reforzadores( Cualidad de ser grato al paladar un alimento.) Cuando mayores, ms sabrosos y ms inmediatos sean los reforzadores, mayor ser el valor. No se sabe cmo se combinan las diferentes caracteristicas para determinar su valor. LA LEY DE LA IGUALACIN Y LOS PROGRAMAS SIMPLES DE REFORZAMIENTO Incluso las situaciones de respuesta nica pueden involucrar una ELECCIN. La eleccin es realizar la respuesta especificada y ocuparse en otras posibles actividades . Esto permite la aplicacin de la ley de la igualacin a programas de reformaziento de respuesta nica. Aunque recientemente se pone en duda.

MECANISMOS DE LA LEY DE IGUALACIN

Es una ley DESCRIPTIVA de la naturaleza y no una ley mecanicista (no explica los mecanismos que son responsables de la distribucin de las respuestas). Esta ley ignora CUNDO se realizan las respuestas individuales. TEORIAS MOLARES: explican agregados de respuestas y se relacionan con la distribucin total de respuestas y reforzadores en las situaciones de eleccin, TEORIAS MOLECULARES se centran en lo que ocurre alnivel de las respuestas individuales y consideran la igualacin como el rsultado neto de estas elecciones individuales. TEORIAS DE MEJORAMIENTO: caracteristicas de la conducta que no son ni molares ni moleculares, sino algo intermedio entre ellas. IGUALACIN Y MAXIMIZACIN DE LAS TASAS DE REFORZAMIENTO La conducta de eleccin : se basan en la idea de que los organismos DISTRIBUYEN sus acciones entre las alternativas de respuestas para recibir la MXIMA cantidad de reforzamiento posible. Esta idea de que los organismos MAXIMIZAN el reforzamiento se utiliza para explicar la conducta de eleccin en los distintos anlsis: Los mecanismos son: 1. MAXIMIZACIN MOLECULAR: siempre se elige cualquier alternativa de respuesta con MEJORES PROBABILIDADES de que sea reforzada en ese momento. Se centran en las tasas GLOBALES de respuesta y reforzamiento, calculadas sobre la duracin total de una sesin experimental. 2. MAXIMIZACIN MOLAR: el organismo distribuye sus respuestas entre las VARIAS ALTERNATIVAS a fin de maximizar la cantidad de reforzamiento que consiguen a la LARGA. Se centran en agregados de conducta sobre algn periodo de TIEMPO ms que enlas respuestas de eleccin indivdual 3. MEJORAMIENTO operan en una escala TEMPORAL que est entre molar y molecular. Se refiere a hacer algo mejor. Es la meta ms modesta (o inocente) de slo hacer que la situacin sea mejor. (mejor de cmo esa situacin ha sido en el pasado reciente). Los resultados a una situacin limitada (no en su totalidad a largo plazo). Las tasas LOCALES se calculan sobre el periodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. Esta tasa es siempre MAYOR que su tasa global. La teoria de mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para MEJORAR la TASA LOCAL de reforzamiento que estn recibiendo. El mecanismo de mejoramiento da como resultado LA IGUALACIN.

ELECCIN CON COMPROMISO


Se die a la gente que carecce de AUTOCONTROL si elige una recompensa pequea a corto plazo en lugar de esperar para conseguir un beneficio mayor pero ms demorado PROGRAMAS CONCURRENTES ENCADENADOS Programa A (RV 10) Programa B (RF 10)

Eslabon terminal TECLA A reforzador primario)

Eslabn terminal TECLA B Eslabn de eleccin(no es el

Hay 2 fases o eslabones: Durante la primera fase el ESLABON DE ELECCIN elige entre 2 programas alternativos. Responder a este eslabon de eleccin NO PROPORCIONA RESULTADOS, slo cuando se encuentre en le ESLABON TERMINAL. Cuando se escoge A o B est comprometido hasta el final del eslabn terminal del programa por eso implican ELECCI CON COMPROMISO Se prefiere la alternativa de razn variable. RV . La variedad parece ser la SAL DE LA VIDA. El eslabn terminal se convierte en REFORZADOR CONDICIONADO, La conducta de eleccin est gobernada tanto por los programas de eslabn terminal como por cualquier programa que funcione en el enlace inicial. ESTUDIOS DE AUTOCONTROL Autocontrol: es elegir una recompensa grande demorada sobre una recompensa pequea inmediata. El autocontrol es ms fcil si la alternativa tentadora (un pastel) no est tan claramente disponible (en la carta hay pastel y verduras). Una propiedad general de la conducta de eleccin: Si las recompensas se entregan rpidamente tras una rspuesta de eleccin, los sujetos generalmente PREFIEREN una recompensa pequea inmediate ms que una recompensa grande demorada. Sin embargo, si se aade una demora CONSTANTE a la entrega de ambas recompensas, los sujetos muestran autocontrol y prefieren la recompensa grande demorada. EXPLICACIONES DEL AUTOCONTROL Principio general: el valor de un reforzador se REDUCE en funcin de cunto tiempo se tiene que esperar para obtenerlo. La frmula para esta reduccin en el valor se llama FUNCIN DESCONTADORA DEL VALOR. V= M/(1+ KD) FUNCIN DEL DECAIMIENTO HIPERBLICO M= magnitud de la recompensa D= demora de la recompensa K= parmetro de la tasa descontadora Cuando se entrega el reforzador sin demora D=0, el valor del reforzador est directamente relacionado con su magnitud (los reforzadores ms grandes tienen valores mayores).

Incrementar la demora de las recompensas grande y pequea hacce ms FCIL que se muestre autocontrol seleccionando el reforzador ms grande pero con ms demora. LAS FUNCIONES DESCONTADORAS Y LOS PROBLEMAS DE AUTOCONTROL EN LA ADICCIN A LA DROGA El abuso de sustancias frecuentemente REFLEJA una serie de elecciones IMPULSIVAS. Las funciones descontadoras de la recompensa era mucho ms acusada para los adictos a la herona, es decir, el valor del dinero DISMINUYO muy rpido si la recepcin del dinero iba a demorarse. Esta funcin acusada del descuento de la recompensa indica UNA FALTA DE CONTROL es decir, IMPULSIVIDAD. PUEDE ENTRENARSE EL AUTOCONTROL? S. Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener estos reforzadores. Siempre y cuando las tareas de entrenamiento implicasen BAJO ESFUERZO, el entrenamiento con la recompensa demorada INCREMENT la preferencia por la recompensa ms grande demorada. Por lo tanto, el entrenamiento con reforzamiento demorado produce AUTOCONTROL.

Tema 7: Mecanismos motivacionales.


Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con el trabajo de Skinner y se centra en como la conducta est regulada en vista de las limitaciones o restricciones creadas por los procedimientos de condicionamiento instrumental. Las teoras de la regulacin conductual describen los efectos del reforzamiento dentro del amplio contexto del repertorio conductual de un organismo utilizando conceptos de varias reas de investigacin, incluyendo la economa conductual y la ecologa conductual. La aproximacin asociacionista se centra en los mecanismos moleculares y no se preocupa de la meta a largo plazo o la funcin de la conducta instrumental. Por el contrario, la aproximacin de la regulacin conductual se centra n los aspectos molares de la conducta y considera los efectos del condicionamiento instrumental como manifestaciones de procesos de maximizacin u optimizacin. La motivacin de la respuesta instrumental ha sido considerada desde dos perspectivas radicalmente distintas. La primera se origino con Thorndike e incluye el anlisis de la estructura asociativa del condicionamiento instrumental, radica en el concepto de asociaciones y es compatible con la tradicin terica del condicionamiento pavloviano. Toma una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la aproximacin asociativa examina el aprendizaje instrumental en preparaciones conductuales aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nervioso, la aproximacin asociativa proporciona un marco conveniente para estudiar los mecanismos neurales del condicionamiento instrumental. La aproximacin alternativa a los procesos motivacionales en el aprendizaje instrumental es la regulacin conductual. Se desarrolla dentro de la tradicin skinneriana e incluye la consideracin del condicionamiento instrumental en el contexto ms amplio de las mltiples cosas que el organismo est haciendo. Est interesada en como un procedimiento de condicionamiento instrumental establece los lmites al flujo de actividades de un organismo y las consecuencias conductuales de estas restricciones: considera la motivacin de la conducta instrumental desde un punto de vista ms molar, considera las metas y como los organismos sacan provecho de la complejidad de su ambiente y de sus mltiples opciones conductuales para alcanzar sus metas. La aproximacin asociativa y de regulacin conductual casi se han desarrollado independientemente la una de la otra. Cada una ha identificado problemas importantes pero ninguna puede sostenerse sola

La estructura asociativa del condicionamiento instrumental


Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye algo ms que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia de estmulos particulares. Deben considerarse tres sucesos en el anlisis del

condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la consecuencia de la respuesta instrumental o reforzador (C). Skinner tambin suscribi la nocin de tres sucesos y describi el condicionamiento instrumental es trminos de una contingencia de tres trminos que inclua E R y C.

La asociacin E_R ya la ley del efecto


La asociacin E-R fue postulada por Thorndike como la clave del aprendizaje instrumental en su ley del efecto; el papel del reforzador o de la consecuencia de la respuesta es establecer o estampar una asociacin entre las claves contextuales E y la respuesta instrumental, pens que una vez establecida esta asociacin E-R seria, de forma nica, responsable de la ocurrencia de la respuesta instrumental. Por tanto, el mpetu bsico o motivacin para la respuesta instrumental era la activacin de la asociacin E-R mediante la exposicin del sujeto a los estmulos en presencia de los cuales la respuesta instrumental fue previamente reforzada. L ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, que el reforzador en s mismo no es una parte o no participa en esta asociacin. Esta presuncin es bastante contraintuitiva.

Expectativa de recompensa y la asociacin E-C


Cualesquiera que sean los estmulos, el reforzamiento de la respuesta instrumental producir inevitablemente un emparejamiento entre E y el reforzador o consecuencia de la respuesta (C). Estos emparejamientos proporcionan el potencial para el condicionamiento clsico y el establecimiento de una asociacin entre E y C. Una de las explicaciones ms tempranas e influyentes del papel del condicionamiento clsico en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y ms tarde elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental, la respuesta instrumental llega a ser instigada o motivada por dos factores. En primer lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacin con E-R. En segundo lugar, la actividad instrumental tambin llega a realizarse en respuesta a la expectativa de recompensa debido al establecimiento de una asociacin R-C: la forma concreta en que la asociacin R-C llega a motivar la conducta instrumental ha sido tema de considerable debate e investigacin experimental. Una formulacin especialmente influyente fue la teora moderna de los dos procesos /Rescorla y Salomon, 1967) La teora moderna de los dos procesos: Asume que hay dos tipos de distintos de aprendizaje, el condicionamiento pavloviano y el instrumental, adems asume que estos dos procesos estn relacionados de una forma especial, durante el curso de un condicionamiento instrumental, los estmulos (E)_ en presencia de los cuales se refuerza la respuesta instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a travs de condicionamiento pavloviano para establecer una asociacin E-C. A travs de la asociacin E-C, el estimulo E llega a motivar la conducta instrumental mediante la activacin de un estado emocional central. La naturaleza de ese estado emocional o motivacin depender de la naturaleza del reforzador, Si se refuerza con comida esta asociacin activa la expectativa de comida Mowrer (1960)= esperanza.

Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta instrumental, entonces la presentacin de un estimulo condicionado pavloviano debera alterar el curso de la respuesta instrumentalmente reforzada. La implicacin bsica de la teora moderna de los dos procesos es que la tasa de una respuesta instrumental ser modificada por la presentacin de un estimulo clsicamente condicionado. La presentacin de un EC+ clsicamente condicionado con comida durante la ejecucin de una respuesta reforzada con comida debera aumentar la esperanza que fue creada por la contingencia instrumental e incrementar la respuesta. Resultados consecuentes con la teora moderna de los dos procesos. Utiliza normalmente un diseo experimental llamado experimento de transferencia de control, consta de tres fases; la fase uno incluye un condicionamiento instrumental de una respuesta operante utilizando algn programa de reforzamiento positivo o negativo. En la fase dos se entrena a los participantes con un condicionamiento clsico, en el cual se asocia un EC explicito con la presencia o ausencia de un estimulo incondicionado. Es necesario que el procedimiento de condicionamiento instrumental no est en funcionamiento durante la fase de condicionamiento pavloviano. La fase tres es la fase de transferencia crtica. Aqu se permite e los participantes que realicen la respuesta instrumental, y se presenta peridicamente el EC de la fase dos para observar su efecto en la tasa de conducta instrumental. Ver ej. pg. libro 195. Interacciones de respuesta en los experimentos de transferencia de control. Los estmulos condicionados clsicamente elicitan no solamente estados emocionales, sino tambin respuestas abiertas, en consecuencia, un estimulo clsicamente condicionado puede influir sobre la conducta instrumental a travs de respuestas abiertas que elicita. No es necesaria la apelacin a estados emocionales centrales para explicar este resultado. La apelacin a estados centrales emocionales tambin es innecesaria si un estimulo condicionado clsicamente elicitase respuestas abiertas que fuesen similares a la conducta instrumental. En este caso, la presentacin del EC incrementara la respuesta porque las respuestas elicitada por el EC se aadiran a las respuestas que se estn realizando porque el animal recibe reforzamiento instrumental. Los investigadores han estado muy interesados en la posibilidad de que los resultados de los experimentos de transferencia de control sean debidos a que los ECs pavlovianos elicitan respuestas que interfieren en o facilitan la conducta requerida por el reforzamiento instrumental. Se han diseado barias estrategias experimentales para eliminar estas interacciones, en general han logrado mostrar que muchos efectos de transferencia de control no estn producidos por interacciones entre respuestas abiertas Estados emocionales centrales condicionados o expectativas especificas de recompensa? La teora moderna de los dos procesos asume que el condicionamiento clsico media la conducta instrumental a travs del condicionamiento de estados emocionales centrales como la esperanza (en el caso de reforzamiento positivo) o el medo (en el caso del reforzamiento negativo). Este estudio pg. 196, indican claramente que en ciertas circunstancias los animales adquieren expectativas especificas del reforzador en lugar de un estado emocional mas general de esperanza durante el condicionamiento instrumental y clsico. El aprendizaje de expectativa especfica de recompensa es una alternativa importante a la teora de los dos procesos para explicar ciertos tipos de

resultados, est basada en la asuncin de que el condicionamiento instrumental incluye aprendizaje de una asociacin E-C. Las asociaciones E-C parecen ser fundamentales para la motivacin de la conducta instrumental, Berridge (2001) apunto que la asociacin E-C,E llega a ser un estimulo de incentivo; E en si mismo llega a ser atractivo. Esta motivacin adquirida de incentivo contribuye significativamente a la motivacin de la respuesta instrumental.

Relaciones R-C y E(R-C) en el condicionamiento instrumental


La intuicin sugiere que la conducta instrumental involucra asociaciones R-C, estas no existen en el modelo de los dos procesos. Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida por las teoras de los dos procesos es que E supone que llega a estar asociado directamente con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de condicionamiento clsico. Los emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones pelvianas. El EC debe tambin proporcionar informacin acerca del EI, o estar de alguna manera relacionado con el EI. Esta condicionalidad en la relacin de E con C es desestimada en la teora de los dos procesos. Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el condicionamiento instrumental lleva el aprendizaje de asociaciones respuestaconsecuencia, se han obtenido evidencias varias en apoyo de esta posibilidad. La devaluacin del reforzador ha sido utilizada para determinar si la repuesta instrumental esta mediada por una asociacin entre la respuesta y la consecuencia reforzante, ver ej. pg. 197. La supresin selectiva de respuesta que se obtuvo es difcil de explicar a partir de las asociaciones E-C o E-R que se supone que son aprendidas de acuerdo con la teora de los dos procesos, la devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada separadamente con su propio reforzador. Evidencia del aprendizaje de una relacin jerrquica E-(R-C); La evidencia citada anteriormente muestra de forma clara que los organismos aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C no pueden actuar aisladamente para producir la repuesta instrumental. Mackintosh y Dickinson (1979) el hecho de que la respuesta instrumental activa una expectativa del reforzador no es suficiente para clarificar lo que produzca la respuesta. Se necesita un factor adicional para activar la asociacin R-C. Una posibilidad es que la asociacin RC sea activada por los estmulos E que estn presentes cuando la respuesta es reforzada, E no activa R directamente, sino que activa la asociacin R-C. El sujeto llega a pensar en la asociacin R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental. Skinner (1938) sugiri que E, R y C en el condicionamiento instrumental estn conectados a travs de una relacin condicional E-(R-C). Se ha acumulado evidencias que indican el aprendizaje de relaciones E-(R-C)

Regulacin conductual
Los anlisis de regulacin conductual estn basados en una visin del mundo completamente distinta. En lugar de considerar el condicionamiento instrumental en trminos del reforzamiento de una respuesta, los anlisis de la regulacin conductual se centran en como las contingencias instrumentales ponen limitaciones a las actividades de un organismo.

Antecedentes de la regulacin conductual


Los tericos estaban de acuerdo en que los reforzadores eran estmulos especiales que fortalecas la conducta instrumental durante medio siglo despus de la ley del efecto de Thorndike La teora de la respuesta consumatoria: E primer reto a esta idea vino de Fred Sheffield que formularon la teora de respuesta consumatoria, esta atribuye el reforzamiento a estas conductas tpicas de la especie. Se establece que las respuestas consumatorias tpicas de la especie son en s mismas el rasgo crtico de los reforzadores. Fue una innovacin radical debido a que traslado la investigacin de los reforzadores desde tipos especiales de estmulos a tipos especiales de respuestas. Se considero que las respuestas reforzadoras eran especiales porque involucraban la consumacin o el completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con su teora y sugiri que las respuestas reforzadoras son especiales solo debido a que es ms probable que ocurran que las respuestas instrumentales a las que siguen. El principio de Premack: Apunto que las respuestas incluidas en los reforzadores comnmente utilizados eran actividades que es altamente probable que realicen los animales. Las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad. Propuso que esta diferencia en las probabilidades de respuesta es crtica para el reforzamiento. Puede establecerse como sigue: dadas dos respuestas de diferente probabilidad A y B, la oportunidad para realizar la respuesta de alta probabilidad A despus de la respuesta de baja probabilidad B tendr como resultado el reforzamiento de la respuesta B. (B A refuerza B). La oportunidad para realizar la respuesta B de baja probabilidad despus de la respuesta A de alta probabilidad no dar como resultado el reforzamiento de la respuesta A. (A B no refuerza A). Se centra en la diferencia de en la probabilidad de las respuestas instrumental y reforzadora: en consecuencia tambin es denominado el principio de la probabilidad diferencial. Estimulo la consideracin de los reforzadores como respuestas ms que como estmulos. La hiptesis de la privacin de respuesta: En la mayora de los procedimientos de condicionamiento instrumental, la probabilidad momentnea de una respuesta reforzada se mantiene a un nivel alto mediante la restriccin al acceso a la respuesta reforzante. Premack (1965) reconoci la importancia de restringir el acceso a respuesta reforzadora para el condicionamiento instrumental. Caracterizo la privacin de respuesta no solo como una condicin necesaria para el reforzamiento sino como algo adjunto al principio

de probabilidad diferencial. La respuesta reforzadora todava tiene que ser una conducta ms probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974) abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la restriccin de la respuesta reforzadora era el factor crtico para el reforzamiento instrumental, esta propuesta es denominada Hiptesis de privacin de respuesta, hace explicita la idea radicalmente diferente de que un reforzador es producido por la contingencia instrumental en si misma. Posteriores desarrollos de las teoras de regulacin conductual han establecido como las contingencias instrumentales crean los reforzadores y los efectos del reforzamiento

Regulacin conductual y el punto de deleite conductual


Las teoras de la regulacin conductual asumen que existen mecanismos homeostticos anlogos respecto a la conducta: Se propone que los organismos tienen una distribucin de actividades preferida u ptima que luchan por mantener frente a los cambios o interrupciones. Se centran en el grado en que la contingencia instrumental respuestareforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribucin de actividades preferida u optima. El punto de deleite conductual: La teora de la regulacin conductual asume que si los organismos son libres para distribuir sus respuestas entre las alternativas disponibles, lo harn de la forma en que sea mas cmodo o en algn sentido optimo para ellos: Esta distribucin de respuestas define el punto de deleite conductual. El punto de deleite conductual puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una situacin sin restricciones. Imposicin de una contingencia instrumental. La teora de regulacin conductual establece que los organismos defendern el punto de deleite conductual contra los cambios. Lo interesante es que la lnea de base libre del punto de deleite conductual no siempre puede ser restablecida despus de que se haya introducido una contingencia instrumental. Este es a menudo el dilema que impone una contingencia instrumental. No permite volver al punto de deleite. El punto de deleite proporciona la motivacin para la conducta instrumental. La teora de regulacin conductual asume que para volver al punto conductual establecido continua siendo una meta en la distribucin de respuestas. Cuando esta meta no puede alcanzarse, la redistribucin de las respuestas entre las conductas instrumental y contingente llega a ser una cuestin de ajuste. La tasa de una respuesta se mantiene lo ms cerca posible del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido. Staddon propuso un modelo de desviacin mnima de regulacin conductual para resolver el dilema de las restricciones del programa, la introduccin de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviacin total de las dos respuestas con respecto al punto ptimo o de deleite. Explicacin los efectos de reforzamiento de: La regulacin conductual incluye la defensa de un punto de deleite conductual frente a restricciones de respuesta impuestas

por una contingencia respuesta-reforzador. El aumento en la respuesta instrumental / un efecto de reforzamiento) es el resultado de mecanismos reguladores de la conducta que funcionan para minimizar las desviaciones del puto de deleite conductual. Una visin sobre las contingencias de reforzamiento en un contexto conductual mas amplio: Las contingencias instrumentales no suceden en un vacio conductual ocurren en el contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto. Centrarse solo en la respuesta instrumental y sus estmulos antecedentes y consecuentes (esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto conductual ms amplio ya que puede influir de forma significativa en el resultado de los procedimientos particulares de condicionamiento instrumental.

Conceptos econmicos y distribucin de respuesta


En las situaciones de condicionamiento instrumental, las restricciones estn proporcionadas por el numero de respuestas que un organismo es capaz de realizar y el numero de respuestas requerido para obtener cada reforzador Demanda del consumidor: La relacin entre el precio de una comodidad y cuanto se obtiene se denomina curva de la demanda. El grado en el cual el precio influye en el consumo se denomina elasticidad de la demanda. El concepto de demanda del consumidor puede utilizarse para analizar el reforzamiento instrumental considerando el nmero de respuestas realizadas como anlogo al dinero. EL precio de un reforzador es el tiempo o numero de respuestas requeridas para obtener un reforzador. Por tanto, el precio del reforzador est determinado por el programa de reforzamiento. Madeen y Biekel (1999) ver ej., pg. 210 libro. Determinantes en la elasticidad de la demanda: Los conceptos econmicos han ayudado a identificar tres factores principales que influyen en como las restricciones de un programa moldean la redistribucin de la conducta. 1. Disponibilidad de sustitutos: Es el factor que ms influye en la elasticidad de la demanda. La disponibilidad de sustitutos aumenta la sensibilidad del artculo a los precios altos. o Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la sesin experimental. La parte de comida que no comen durante la sesin experimental se les da luego en la jaula hogar, esta situacin se denomina una economa abierta, Esto se contrapone con una economa cerrada, en la cual los sujetos no reciben alimentacin suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economa abierta que en economas cerradas. 2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos. 3. Nivel de ingresos: En estudios de condicionamiento instrumental, el nmero de respuestas o la cantidad de tiempo disponible para responder corresponde a los

ingresos. Cuantas ms respuestas o tiempo tengan disponibles los animales, menos estar su conducta influida por los aumentos en el coste del reforzador.

Problemas con las aproximaciones de regulacin conductual


El punto de deleite es una caracterstica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo del bloque temporal amplio. Un punto de deleite molar dado puede alcanzarse de varias formas, de acuerdo con esta aproximacin, las diferencias en las pautas de respuesta no deberan tener importancia. Pero la evidencia experimental indica que es importante como se alcanza el punto de deleite molar. En consecuencia una adecuada caracterizacin del deleite conductual requiere informacin sobre las pautas de eleccin moleculares. Otra dificultad, tal vez ms seria es que las respuestas durante un periodo de lnea base libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se requiere por una contingencia instrumental impuesta. Finalmente, debido a que las aproximaciones no comprenden procesos conductuales moleculares, no dicen nada de cmo los organismos defienden una combinacin favorita de bienes o actividades.

Contribuciones de la regulacin conductual


1. Nos alejo de la consideracin de los reforzadores como tipos especiales de respuestas. Los efectos del reforzamiento se ven como producidos por las restricciones del programa en el devenir de las actividades de un organismo. 2. Los procedimientos de condicionamiento instrumental ya no se considera que estampan o fortalecen la conducta instrumental: en su lugar el condicionamiento instrumental es visto como la creacin de una nueva distribucin, o asignacin de respuestas, la reasignacin de la conducta incluye un aumento en la respuesta instrumental y una disminucin de la respuesta reforzadora. 3. No existe una distincin fundamental entre las respuestas instrumentales y las reforzadoras, se distinguen solo por los papeles asignados a ellas mediante u n procedimiento de condicionamiento instrumental. 4. Aceptan la idea de que los organismos responden para maximizar sus beneficios. 5. Han proporcionado caminos nuevos y precisos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no puede ser estudiada en un vacio o en un tubo de ensayo conductual. Todas las opciones de respuesta del organismo que se dan en un momento dado deben ser consideradas como un sistema.

Comentarios finales
Las dos aproximacin parecen centrarse en asuntos completamente distintos, pero ambas han contribuido de forma significativa a la comprensin de la motivacin de la conducta instrumental.

Incluyen diferentes niveles de anlisis. La aproximacin asociacionista involucra un nivel molecular donde el objetivo son los estmulos especficos, las respuestas, y sus conexiones. La regulacin conductual opera a un nivel molar de agregados de conducta y el contexto conductual ms amplia en el que operan las contingencias instrumentales. Una se relaciona con procesos y la otra est ms relacionada con funciones o metas a largo plazo. La aproximacin asociacionista describe procesos especficos (asociaciones E-R, E-C, R-C y E-(R-C)) que sirven para generar y dirigir la conducta instrumental. Este es el punto de vista de la regulacin conductual y la economa conductual, que asumen que los organismos trabajan para defender una distribucin ptima de actividades. La defensa del punto de deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.

Tema 8: Control por el estmulo.


Es tan importante la adecuacin de una respuesta instrumental al contexto estimular en el que se realiza, que la falta de un apropiado control por el estimulo se considera a menudo anormal, desvestirse en privado es aceptable en publico motivo de arresto. El control de la conducta por el estimulo es un aspecto importante de la forma en que los organismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligro los animales tienen que comportarse de forma congruente con las circunstancias cambiantes.

Identificacin y medida del control por el estimulo


Cmo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos estmulos?

Respuesta diferencial y discriminacin de estmulos


El control por el estimulo de la conducta instrumental se demuestra mediante variaciones en la respuesta (respuesta diferencial) relacionadas con las variaciones en los estmulos. Si un organismo responde de una manera en presencia de un estimulo, y de forma diferente en presencia de otro, se puede decir que su conducta esta bajo el control de esos estmulos. Estas respuestas diferenciales resultan evidentes en el comportamiento de las dos palomas del experimento de Reynolds, ver ej. pg. 219 libro. La respuesta diferencial a dos estmulos tambin indica que las palomas estaban tratando cada estimulo de forma diferente. Esto se denomina discriminacin de estmulos: se dice que un organismo muestra discriminacin de estmulos si responde de forma diferente a dos o ms estmulos. La discriminacin de estmulos y el control por el estimulo constituyen dos maneras de considerar el mismo fenmeno: una no existe sin la otra. Si un organismo no discrimina entre dos estmulos, su conducta no est bajo el control de esas claves. Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pjaro estaba controlada por un estimulo diferente. En ausencia de procedimientos especiales, los investigadores no siempre pueden predecir cul de varios estmulos de aquellos que un organismo experimenta adquirir control sobre su conducta instrumental

Generalizacin de estmulos
Identificar y diferenciar varios estmulos no es algo tan simple. Los estmulos pueden definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se consideran ejemplos del mismo estimulo debido a que comparten la misma funcin. En otros casos, los estmulos se identifican y distinguen partiendo de rasgos fsicos precisos, como la longitud de onda.

Los anlisis experimentales del problema han dependido en su mayora del fenmeno de la generalizacin de estmulos, que es lo opuesto a la respuesta diferencial, o discriminacin de estmulos. Se dice que un organismo muestra generalizacin de estmulos si responde manera similar a dos o ms estmulos. Este fenmeno fue observado en primer lugar por Pavlov. En un experimento clsico Guttman y Kalish palomas programa IV picotear con luz amarillenta con longitud de onda 580 nanmetros, despus se observa que palomas tambin responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en funcin de la semejanza entre cada estimulo de prueba y el estimulo original de entrenamiento. Este resultado es un ejemplo de lo que se denomina gradiente de generalizacin de estimulo.

Los gradientes de generalizacin del estimulo como medidas del control por el estimulo
Se utilizan a menudo para medir el control por el estimulo porque facilitan informacin acerca del grado de sensibilidad de la conducta de un organismo ante la variacin de un aspecto particular del ambiente. Guttman y Kalish (1956) y el experimento hipottico con las palomas ciegas a los colores indica que lo acusado del gradiente de generalizacin de un estimulo proporciona una medida precisa del grado de control del estimulo. Se obtiene un gradiente de generalizacin plano si el organismo responde de forma similar a todos los estmulos de la prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estimulo que se varia en la prueba de generalizacin no controla la conducta instrumental. Por el contrario, se obtiene un gradiente de generalizacin acusado si el organismo responde en mayor medida a algunos de los estmulos de prueba que a otros. Esta respuesta diferencial evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del estimulo que vara entre los estmulos de prueba. Si se da una gran cantidad de generalizacin, se dar poca respuesta diferencial. Si la respuesta es altamente diferencial ante los estmulos, se obtendr una mnima generalizacin.

Factores del estimulo y la respuesta en el control por el estimulo.


La cuestin principal es la siguiente Qu es lo que determina que una de las muchas caractersticas de una situacin estimular adquiera control sobre la conducta instrumental?

Capacidad sensorial y orientacin


El factor que determina de forma ms evidente si una caracterstica particular del estimulo llega a controlar la respuesta es la capacidad sensorial y de orientacin del individuo. La presentacin de estmulos con ciertas caractersticas de inters para un organismo no garantiza que otro organismo responder a las mismas caractersticas. Los sucesos fuera del rango de lo que un organismo puede detectar con sus rganos sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o

sean transducidos a algo que el organismo pueda detectar. Las limitaciones en los estmulos que pueden llegar a controlar la conducta dependen tambin de si el individuo llega a tomar contacto con el estimulo. Facilidad relativa del condicionamiento de varios estmulos. La intensidad con que los organismos aprenden sobre un estimulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situacin. Este fenmeno se llama ensombrecimiento. Pavlov fue el primero en observar que si dos estmulos se presentan al mismo tiempo, la presencia del estimulo que se puede entrenar ms fcilmente puede ocultar el aprendizaje del otro. En general cuanto ms intenso sea el estimulo, mas rpido se condicionara y ensombrecer el aprendizaje del estimulo ms dbil. Pavlov encontr que el estimulo dbil poda llegar a condicionarse (algo ms lentamente) si se presentaba solo.

Tipo de reforzamiento
Es ms probable que ciertos tipos de estmulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. Ver ej. pg. 225 libro Estos hallazgos indican que el control por el estimulo de la conducta instrumental esta determinado en parte por el tipo de reforzamiento utilizado. Es ms probable que los estmulos visuales adquieran control sobre la conducta en situaciones apetitivas que las claves auditivas, mientras que es ms probable que estas adquieran control en situaciones aversivas, esto est probablemente relacionado con los sistemas de conducta que se activan en los dos casos, la activacin del sistema de alimentacin puede involucrar una sensibilidad incrementada a los estmulos visuales. En contraste los procedimientos de evitacin de la descarga activan el sistema de conducta defensiva. Responder a claves auditivas puede ser particularmente adaptativo para evitar el peligro.

Tipo de respuesta instrumental


Otro factor que puede determinar que rasgos de un estimulo compuesto obtendrn control sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento, ver ej. pg. 227 libro. Los resultados indican que las respuestas que se diferencian por la localizacin es ms probable que lleguen a estar bajo el control de la caracterstica espacial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es ms probable que lleguen a estar bajo el control de la naturaleza de las claves auditivas, Este fenmeno se denomina efecto de la naturaleza-localizacin. Este efecto es una forma de asociacin selectiva.

Elementos del estimulo frente a claves configuracionales en los estmulos compuestos


En el anlisis anterior sobre el control de la conducta por varios elementos del estimulo, se asumi que los organismos tratan a estos elementos del estimulo como rasgos distintivos y separados del ambiente. Esto se denomina aproximacin elemental del estimulo. Por tanto, en el efecto de naturaleza-localizacin, la naturaleza y la

localizacin de un estimulo auditivo se consideran caractersticas separables de las claves auditivas. Se supona que una caracterstica particular del estimulo (la naturaleza del sonido) se perciba de la misma manera independientemente del estatus de la otra caracterstica (la localizacin del sonido). Una alternativa terica importante presuma que los organismos tratan los estmulos complejos como un todo integral que no se divide en partes o elementos. Esto se denomina aproximacin de la clave configuracional. De acuerdo con la aproximacin de la clave configuracional, los individuos responden a un estimulo compuesto en funcin de la configuracin nica de sus elementos. Se asume que los elementos no se tratan como entidades separadas. Pueden incluso no ser identificables cuando se presenta el estimulo compuesto, los elementos del estimulo son importantes no en cuanto a su individualidad sino en funcin de cmo contribuyen a la configuracin total de la estimulacin proporcionada por el compuesto. El ensombrecimiento, segn esta teora, refleja diferentes grados de decremento de la generalizacin desde la fase de entrenamiento a la de prueba para los grupos de ensombrecimiento y de control, (Pearce, 1987): No hay decremento de la generalizacin para el grupo de control cuando se prueba el estimulo dbil a porque es el mismo estimulo que recibieron durante el condicionamiento. Por el contrario, se da un considerable decremento de la generalizacin cuando se prueba el estimulo a en el grupo de ensombrecimiento tras el condicionamiento con el compuesto ab. Para el grupo de ensombrecimiento, la respuesta se condiciona al compuesto ab, que es muy diferente de presentar solo a durante la generalizacin, este mayor decremento de la generalizacin es la causa del efecto de ensombrecimiento. En ciertas condiciones, los organismos claramente responden a los estmulos compuestos principalmente en trminos de la configuracin de los elementos que forman el compuesto. Esta teora es incompatible con varios ejemplos de asociaciones selectivas que se han descrito con anterioridad, no explica por qu el control por el estimulo est en funcin del tipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusin ms prudente es que los organismos responden a los compuestos estimulares tanto a partir de los elementos del estimulo que forman el compuesto como en funcin de configuraciones estimulares nicas creadas por los elementos del estimulo. En ciertas circunstancias predomina el control elemental, mientras que en otras condiciones predomina el control de las caractersticas configuracionales de los compuestos estimulares. La estructura de una teora unificada de este tipo ha sido descrita recientemente por Wagner y Brandon (2001), estmulos como el sonido de un tono contienen rasgos distintivos (tono, intensidad, localizacin). Cuando un estimulo se combina con otro se crean nuevos elementos estimulares configuracionales que son nicos para este nueva combinacin estimular. Adems, algunos de los rasgos individuales de los estmulos originales se pierden en la combinacin. Esto sesga el control por el estimulo a favor de los elementos configuracionales y produce resultados congruentes con la aproximacin de la clave configuracional

Factores de aprendizaje en el control por el estmulo

Los factores del estimulo y la respuesta son los puntos de arranque del control por el estimulo. El que ciertos estmulos lleguen a controlar la conducta a menudo depende de lo que el organismo ha aprendido acerca de esos estmulos. La sugerencia de que la experiencia con los estmulos puede determinar hasta qu punto estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el fenmeno de la generalizacin de estmulos. Pavlov sugiri que la generalizacin del estimulo se da porque el aprendizaje sobre el EC llega a transferirse a otros estmulos en funcin de la semejanza fsica de esos estmulos de prueba con el EC original. Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea de que la generalizacin del estimulo reflejase la transferencia del aprendizaje y argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la generalizacin del estimulo ocurre si los organismos no han aprendido a distinguir las diferencias entre los estmulos. Defendan que los animales tenan que aprender a tratar los estmulos como diferentes uno de otro. Consideraban la forma del gradiente de generalizacin del estimulo como determinada principalmente por las experiencias previas de aprendizaje del organismo ms que por las propiedades fsicas de los estmulos.

Entrenamiento en discriminacin de estmulos


Numerosos estudios han demostrado que el control por el estimulo puede alterarse de forma notable por las experiencias de aprendizaje. En un procedimiento de discriminacin de estmulos los participantes se exponen al menos a dos estmulos diferentes, pero el reforzamiento por realizar la respuesta instrumental est disponible solo en presencia de uno de los colores. Los procedimientos de discriminacin de estmulos establecen un control por los estmulos que sealan cuando esta o no disponible el reforzamiento. Cuando E+ y E- han adquirido control sobre la conducta del organismo, se denominan estmulos discriminativos. El E+ es un estimulo discriminativo para la realizacin de la respuesta instrumental, y el E- es un estimulo discriminativo para la supresin de la respuesta. Tambin pueden establecerse discriminaciones de estmulos utilizando procedimientos de condicionamiento clsico. Los procedimientos instrumentales de discriminacin de estmulos se diferencian de los procedimientos de condicionamiento clsico solo en que el reforzador se presenta de forma contingente a la respuesta durante el E+. En un programa mltiple de reforzamiento funcionan diferentes programas de reforzamiento en presencia de diferentes estimulo.

Efectos del entrenamiento en discriminaciones sobre el control por el estimulo


El entrenamiento en discriminacin sita la conducta instrumental bajo el control del E+ y el E-. Los investigadores deben tambin determinar lo acusado del gradiente de generalizacin cuando los participantes responden en presencia de estmulos que varan sistemticamente a partir del E+: Es mas debe determinarse que aspecto del

procedimiento del entrenamiento en discriminacin es responsable del tipo de gradiente de generalizacin del estimulo que se obtiene. Jenkins y Harrison (1960,1962) examinaron como los estmulos auditivos que diferan en el tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Un grupo de pjaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no reciba reforzamiento cuando el tono no se presentaba. El tono de 1000 hz serva como E+ y la ausencia de tono como E-. Para el segundo grupo, el tono de 1000 hz sirvi de nuevo como E+, pero el E- fue un tono de 950 hz. El tercer grupo de palomas sirvi como grupo de control y no recibi entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podan recibir reforzamiento por picotear cuando estaban en la cmara experimental. Despus de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteo en presencia de tonos de varia frecuencias para ver con que precisin controlaba el tono dicha conducta. El grupo control respondi de forma casi idntica en presencia de todos los estmulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de nosotros procedimientos de entrenamiento produjo un mayor nivel de control estimular por el tono. El gradiente de generalizacin ms acusado y por tanto el control por el estimulo ms fuerte se observo en los pjaros que haban sido entrenados con el tono de 1000 hz como E+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono) mostraron un grado intermedio de control. Este experimento aporto dos conclusiones importantes el entrenamiento en discriminacin aumenta el control por el estimulo de la conducta instrumental, y 2 una dimensin particular del estimulo (como la frecuencia tonal) es ms probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensin del estimulo.

Rango de posibles estmulos discriminativos


Los procedimientos de entrenamiento en discriminacin se emplean a menudo para evaluar la capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado para determinar los umbrales visuales y auditivos .Los investigadores tambin se han interesado por el estudio de si los animales son capaces de detectar las sensaciones internas creadas por una droga. Esta investigacin ha mostrado que los mecanismos de control por el estimulo con drogas son asombrosamente parecidos a los mecanismos identificados por Jenkins y Harrison para el control del picoteo de una tecla por claves visuales en las palomas. El gradiente de generalizacin fue mucho ms acusado, lo que indica un control por las drogas mucho ms fuerte.

Qu se aprende en el entrenamiento de discriminacin?


Teora de Spence del aprendizaje de discriminacin: Esta basada en la idea de que lo que se aprende tanto el significado del E+ como del E-, e sea aprender tanto a responder al E+ como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo que sirve para suprimir la conducta instrumental. Se asume que la respuesta

diferencial al E+ y al E- refleja tanto la excitacin por responder ante el E+ como la inhibicin por responder ante el E-Comprobar esta requiere pruebas sofisticadas. una posibilidad es utilizar los gradientes de generalizacin del estimulo; Debe observarse un gradiente de generalizacin acusado, con la mayor cantidad de respuesta ante el E+, un resultado como este se llama gradiente de generalizacin del estimulo excitatorio, Por el contrario, si se ha condicionado una tendencia inhibitoria al E-, entonces los estmulos que difieran progresivamente del E- deberan ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado se llama gradiente de generalizacin del estimulo inhibitorio. Las pruebas conductuales llevadas a cabo dcadas despus comprobaron que las ideas de Spence eran sustancialmente correctas. En un experimento clsico honig, Boneau, Burstein y pennypacker, 1963. Un grupo de palomas es reforzado cuando la tecla estaba iluminada con luz blanca y una lnea vertical negra (E+) sin la lnea vertical no refuerzo (E-). 2 Grupo el E+ y E- intercambiados, despus de que los dos grupos aprenden a responder al E+, se llevaron a cabo las pruebas de generalizacin del estimulo para averiguar el grado de control de la barra vertical negra sobre la conducta; en el grupo 1, mayor tasa de respuesta ante la raya vertical y progresivamente descendiendo, esto ilustra un gradiente de generalizacin del estimulo excitatorio. En el grupo 2los estmulos que eran cada vez mas diferentes del original E- producan progresivamente menos inhibicin en la conducta, ilustrando un gradiente de generalizacin del estimulo inhibitorio. Este experimento muestra que el entrenamiento en discriminacin puede producir tanto condicionamiento excitatorio al E* como condicionamiento inhibitorio al E-. El hecho de que los gradientes de excitacin e inhibicin puedan ocurrir alrededor del E+ y del Eproporciona un fuete apoyo a la teora de Spence del aprendizaje de discriminacin. Se obtienen diferentes resultados si los estmulos E+ y E- difieren cuantitativamente en una caracterstica en lugar de cualitativamente (incluyendo muchas caractersticas.)

Interacciones entre el E+ y el E-: desplazamiento del mximo


Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E. Esta suposicin es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la respuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y el E- se relacionan de alguna manera. Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantes excepto por un rasgo o atributo. Un procedimiento de entrenamiento en que solo difieren por el valor de una caracterstica del estimulo se llama discriminacin intradimensional: son de particular inters debido a que estn relacionadas con el problema de la ejecucin experta, esta implica normalmente realizar distinciones sutiles. Distinguir los estmulos que difieren en una nica caracterstica es ms difcil que distinguir entre estmulos que difieren en muchos aspectos. La discriminacin intradimensional requiere la deteccin de un nico rasgo diferenciador entre el E+ y el E- y, en consecuencia, es una forma de ejecucin experta. Una caracterstica importante de la discriminacin intradimesional es que a veces dan como resultado una interesante interaccin entre las respuestas al E+ y al E-, en un

experimento clsico Hanson (1959) examinaba el grado en que varios colores controlaban la conducta de picoteo en paloma. Todos los sujetos fueron reforzados con una luz de 550nn, el E+ era el mismo para todos los grupos, diferan en lo similar que era el E- al E+. Un grupo recibi un E- de 590nn, para otro grupo el E- era de 555nm, y u n grupo de control que no recibi entrenamiento en discriminacin pero que tambin fue reforzado por picotear en presencia del estimulo de 550 nm. El grupo de control mostr un gradiente de generalizacin del estimulo excitatorio normal centrado alrededor del E+, el grupo en que el E- fue de 590nm mostr un desplazamiento del mximo del gradiente de generalizacin desde el E+ llamativo porque la respuesta nunca se reforz en 540 o 530donde se obtuvieron las tasas ms altas de respuesta, estos estmulos nunca haban sido presentados durante el entrenamiento original. El desplazamiento del mximo del gradiente de generalizacin alejado del E+ original se denomina efecto del desplazamiento del mximo, este puede ocurrir en cualquier discriminacin intradimensional. Explicacin de Spence del desplazamiento del mximo. El efecto de desplazamiento de mximo es importante porque muestra que el nico estimulo en cuya presencia se refuerza la respuesta (e+) no es necesariamente es estimulo que evoca la tasa de respuesta ms alta, Spence sugiri que los gradientes excitatorio e inhibitorio pueden producir el fenmeno de desplazamiento del mximo, asumi que el entrenamiento en discriminacin intradimensional produce gradientes de generalizacin excitatorios e inhibitorios centrados en el E+ y el E-, sin embargo, debido a que el E* y el E_ son semejantes en las tareas de discriminacin intradimensional, los gradientes de generalizacin de la inhibicin y excitacin se superpondrn. Es ms, el grado de superposicin depender del grado de semejanza entre el E+ y el E-. La inhibicin generalizada del E- suprimir la respuesta al E+, dando como resultado un efecto de desplazamiento del mximo. Explicaciones alternativas del desplazamiento del mximo: Una cuestin importante es si vemos los estmulos en funcin de sus propiedades individuales y absolutas, o en funcin de su relacin con otros estmulos que experimentamos, existe evidencia consistente con cada una de estas aproximaciones, que sugiere que ambos tipos de mecanismos estn implicados en la forma de responder de los organismos. El modelo de Spence es un modelo de aprendizaje absoluto del estimulo. Predice la conducta basada en las propiedades excitatorias netas de los estmulos individuales. Una aproximacin alternativa asume que los organismos aprenden a responder a un estimulo basndose en la relacin de ese estimulo con otras claves de la situacin. Una prediccin interesante de esta aproximacin es que la forma de un gradiente de generalizacin cambiara en funcin del rango de los estmulos de prueba que se presenten durante la sesin de generalizacin. Estas y oras predicciones de la teora relacional han sido confirmadas.

Entrenamiento de equivalencia de estmulos


De la misma forma que el entrenamiento en discriminacin potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estmulos.

Se dispone de varias aproximaciones para promover la generalizacin en lugar de la discriminacin, 1 (Herrnstein, Loveland y Cable 1976, la estrategia bsica de entrenamiento es reforzar la misma respuesta en presencia de varias imgenes que contiene agua, una vez que aprenden la discriminacin agua/no agua, su conducta se generalizo a nuevas fotografa. Los investigadores tambin han explorado la posibilidad de que la equivalencia funcional entre dos estmulos diferentes podra establecerse enlazando cada una de las distintas claves con un tercer estimulo comn Ej. Honey y Hall (1989) un grupo ruido y click con comida, grupo control ruido y click, solo el click con comida despus ambos recibe ruido con descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo condicionado se generalizara al clik, se dio significativamente ms generalizacin en los animales entrenados en equivalencia que en el grupo de control. El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estmulos, con la consecuencia de que una respuesta condicionada a uno de ellos se generalizara a los oros. Una definicin ms formal de clase de equivalencia ha sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si sus miembros poseen propiedades matemticas 1 reflexividad o igualdad, 2 simetras 3 transitividad. La reflexividad o igualdad se refiere a la relacin A=A: la simetra existe si una relacin es bidireccional, la transitividad se refiere a la integracin de dos relaciones en una tercera.

Claves contextuales y relaciones condicionales


Un estimulo se dice que es discreto si se presenta durante un breve periodo y tiene un comienzo y un final claros. Un anlisis ms comprensivo de los estmulos que los organismos experimentan durante el curso del condicionamiento instrumental indica que los estmulos discriminativos discretos suceden en presencia de un fondo de claves contextuales. Estas pueden ser visuales, auditivas o claves olfatoria de la habitacin. La investigacin reciente indica que las claves contextuales pueden proporcionar una importante fuente adicional de control de la conducta aprendida

Control por claves contextuales


Ver libro pgs. 243 y 244

Control por las relaciones condicionales


En captulos anteriores se han destacado las relaciones que involucran solo dos eventos, un Ec y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman relaciones binarias. En ciertas circunstancias, la naturaleza de una relacin binaria est determinada por un tercer suceso, llamado modulador, la relacin de un modulador con la relacin binaria que seala se denomina una relacin condicional. Numerosos experimentos han indicado que los animales pueden aprender a utilizar moduladores para decir cuando est en funcionamiento una relacin binaria particular. Un procedimiento en el que un organismo es reforzado por responder en presencia del E+ pero no es reforzado en presencia del E-, los estmulos discriminativos E+ y E- son moduladores que sealan la relacin entre la respuesta y el reforzador. Existe una

relacin respuesta-reforzador durante el E+ y una relacin diferente durante el E-, por tanto los procedimientos de discriminacin instrumental incluyen el control condicional de la relacin entre la respuesta y el reforzador. Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento seala la relacin entre otros dos eventos. Habitualmente se concibe el condicionamiento clsico como una relacin binaria entre un estimulo condicionado y uno incondicionado. Establecer una relacin condicional requiere introducir un tercer suceso (el modulador), ver ej. pg. 246 En los procedimientos de discriminacin instrumental, los moduladores (E+ y E-) se denominan estmulos discriminitativos, en el condicionamiento pavloviano, algunos investigadores han denominado al control condicional de la respuesta facilitacin debido a que el modulador facilita la respuesta, el modulador se llama facilitador. Ms comn, el control condicional en el condicionamiento clsico se llama establecimiento de la ocasin porque el modulador establece la ocasin para los emparejamientos del EC con el EI, en esta terminologa el modulador se llama establecedor de la ocasin. Distincin entre la excitacin y la modulacin: El establecimiento de la ocasin es un aspecto importante del condicionamiento clsico porque parece involucrar mecanismos de aprendizaje diferentes. En varios estudios, los intentos de obtener evidencia de las propiedades excitatorias condicionadas de los moduladores han fracasado, estos experimentos indican que un estimulo puede establecer la ocasin para la respuesta condicionada elicitada por otra clave sin elicitar por s mismo una respuesta condicionada visible. Otros estudios han mostrado que condicionar las propiedades excitatorias simples a un estimulo no hace que este funcione como un modulador. La evidencia adicional para mantener la distincin entre modulacin y excitacin condicionada se basa en los efectos de los procedimientos de extincin. La extincin es un procedimiento en el cual un estimulo previamente condicionado se presenta repetidamente pero se omite el EI. Un estimulo condicionado excitatorio seala la prxima presentacin del Ei. La ausencia del EI despus de la presentacin del EC durante la extincin es una violacin de esa expectativa. Por tanto, el valor como seal del EC tiene que reajustarse en la extincin para estar en consonancia con la nueva realidad. Un reajuste como este no se requiere en un procedimiento de extincin de un establecedor de la ocasin Un establecedor de la ocasin seala una relacin entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasin por si solo durante la extincin no significa que la relacin entre el EC y el EI haya cambiado. La informacin sealada por un establecedor de la ocasin no se prueba que sea incorrecta mediante la presentacin del modulador por si mismo durante la extincin. En consecuencia, la habilidad del modulador para promover la respuesta elicitada se reduce si se altera la relacin EC-EI sealada por el modulador. Otra evidencia que apoya la conclusin de que el establecedor de la ocasin es distinto de la excitacin convencional se ha obtenido en las pruebas de transferencia, estas fueron llevadas a cabo para determinar si un estimulo que haba sido condicionado para establecer la ocasin de responder a un EC critico particular tambin incrementara la

respuesta a orto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de un modulador a un nuevo EC crtico, los efectos de transferencia son ms probables si los nuevos estmulos crticos han servido previamente como estmulos crticos de otros estmulos moduladores. Las limitaciones en la transferencia proporcionan evidencia adicional de que los moduladores tienen sus efectos mediante algn mecanismo distinto de la excitacin. Modulacin frente a condicionamiento configuracional: Los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares, Los investigadores han presentado los elementos uno tras otro ms que simultneamente, en lo que se llama compuesto serial. En los ensayos reforzados, el establecedor de la ocasin es presentado normalmente primero, seguido por el EC crtico y el reforzamiento. Holland y colaboradores han encontrado que los organismos responden a las discriminaciones condicionales que incluyen compuestos seriales en trminos de relaciones condicionales. En contraste, la utilizacin de compuestos simultneos en la discriminacin condicional a menudo no produce efectos modulatorios.

Tema 9: Extincin.
La extincin puede llevarse a cabo slo despus de que haya sido establecida una respuesta o una asociacin utilizando condicionamiento pavloviano o instrumental. El objetivo es revertir los efectos de la adquisicin, pero raramente se alcanza y en la mayora resultan imposible. Fenmenos como la recuperacin espontnea, la renovacin y el restablecimiento muestran que la extincin no elimina lo que se aprendi de forma original. Los estudios sobre devaluacin del reforzador sugieren que la extincin no tiene virtualmente ningn impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo aprendizaje de una asociacin E-R inhibitoria que se superpone a lo que se aprendi con anterioridad. La inhibicin surge de los efectos de la frustacin y esta falta inesperada de recompensa es responsable de una serie de efectos paradjicos de la recompensa, incluyendo el efecto del reforzamiento parcial en la extincin. El reforzamiento parcial o intermitente permite a los organismos aprender sobre la falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la extincin, como demuestra los estudios acerca del momento conductual. La extincin implica la omisin del EI o reforzador. Por tanto, la extincin en condicionamiento clsico incluye presentaciones repetidas del estimulo condicionado por solo; la extincin en el condicionamiento instrumental implica no volver a presentar reforzador como una consecuencia de la respuesta instrumental. El resultado es que respuesta condicionada disminuye. La extincin no es lo contrario de la adquisicin. La extincin se produce por la omisin del EI que sigue a las presentaciones del EC o la omisin del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario, es una disminucin de la respuesta condicionada que se da por la ausencia prolongada de experiencia con el estimulo condicionado o con la respuesta instrumental. La extincin no siempre funciona en la terapia de conducta, los avances sugieren que los fallos en la extincin reflejan las limitaciones normales de la misma. La extincin no revierte los efectos de la adquisicin, en lugar de ello, implica el aprendizaje de algo nuevo que se superpone sobre lo que se aprendi antes (sin la perdida de lo que se aprendi anteriormente).

Efectos de los procedimientos de extincin


La extincin disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta. Si un organismo est acostumbrado a recibir reforzamiento por una respuesta particular, puede trastornarse cuando no vuelve a entregar los reforzadores. Las reaccin emocional inducida por la falta de un reforzador esperado se denomina frustacin. La ausencia frustrante de recompensa proporciona energa a la conducta que en ocasiones puede ser lo suficietemente severa como para implicar reacciones agresivas.

Extincin y aprendizaje original


Aunque la extincin produce importantes efectos conductuales y emocionales, no revierte los efectos de la adquisicin. La evidencia de que la extincin no elimina lo que se aprendi originalmente se ha obtenido a travs de estudios sobre la renovacin espontanea, la renovacin, el restablecimiento y los efectos de la devaluacin del reforzador.

Recuperacin espontanea
La recuperacin espontanea tras el condicionamiento pavloviano: La extincin se disipa con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse si el sujeto se pone a prueba tras una demora que siga al procedimiento de extincin. Recuperacin espontanea tras el condicionamiento instrumental: La recuperacin espontnea es un fenmeno notable en la extincin tras el condicionamiento instrumental. La introduccin de un periodo de descanso tras la extincin produce una recuperacin sustancial en la respuesta.

Renovacin del condicionamiento excitatorio original


La renovacin se refiere a la recuperacin de la ejecucin propia de la adquisicin que se da cuando se cambian las claves contextuales que estaban presentes durante la extincin. El cambio puede consistir en una vuelta al contexto de la adquisicin original o a un cambio a un contexto neutral. El efecto de la renovacin no slo se ha observaldo en el condicionamiento pavloviano del miedo, sino tambin en el condicionamiento apetitivo del miedo, la inhibicin condicionada y en varias situaciones de condicionamiento instrumental. El fenmeno se evidencia no slo con claves externas contextuales sino con claves contextuales creadas por estados provocados por drogas. Tambin puede darse si el sujeto se retira del contexto de adquisicin a uno alternativo que no es el de la adquisicin original. Este tipo de renovacin no es tan slido como cuando se reinstaura en el contexto original de adquisicin. La mayor parte de la evidencia indica que el efecto de renovacin se produce porque la memoria de la extincin es especfica de las claves que estaban presentes durante la fase de extincin. En consecuencia, un cambio en el contexto de la extincin dificulta la recuperacin de la memoria de extincin, con el resultado de que se pierde la ejecucin propia de la extincin. Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la ambigedad del significado de un estimulo condicionado. Un EC que adquiere condicionamiento excitatorio y luego se extingue tambin tiene un significado ambiguo, en el sentido de que podra indicar la cercana del EI (adquisicin) o su ausencia (extincin). Esta ambigedad permite al EC ponerse bajo el control contextual de manera ms fcil. Tras el entrenamiento de adquisicin por s solo, el EC no es ambiguo porque solo significa una cosa (la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control contextual.

Los investigadores han explorado la forma de reducir el efecto de renovacin. Un procedimiento que se muestra prometedor es llevar a cabo la extincin en distintos contextos. Otras tcnicas para reducir el efecto de renovacin implican entrenamiento en inhibicin condicionada, condicionamiento diferencial, y la presentacin del EC explcitamente emparejado con el EI.

Restauracin de la ejecucin propia de la extincin


El efecto de renovacin representa reactivar una conducta aprendida previamente mediante el cambio del contexto a condiciones ms aproximadas a las presentes cuando la conducta se adquiri con anterioridad. Esta estrategia puede aplicarse a la extincin, es decir, la ejecucin propia de la extincin puede restaurarse introduciendo claves contextuales que reactiven la memoria de extincin. La recuperacin espontanea implica la recuperacin de la conducta condicionada originalmente que sigue a la extincin si transcurre un periodo suficiente de tiempo tras la fase de extincin. La conducta propia de la extincin puede restaurarse (contrarrestando la recuperacin espontaneas) presentando las claves que estaban presentes durante la fase de extincin. La recuperacin expontnea se debe a un eterioro de las claves contextuales de la extincin que se da con el paso del tiempo.

Restablecimiento de la excitacin condicionada


El restablecimiento se refiere a la recuperacin de la respuesta excitatoria a un estimulo extinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que se extinguen con xito, pueden recuperarse si el individuo se enfrenta de nuevo con el estmulo incondicionado. Investigaciones durante los ltimos 20 aos sobre el efecto del restablecimiento, han indicado que el condicionamiento contextual es importante, pero no porque permita la suma de la extincin sino por suprimir la ambigedad del significado de un estimulo que tiene una historia mezclada de condicionamiento y extincin. El contexto tiene poco efecto en los estmuos con una historia slo de condicionamiento. Bouton considera el restablecimiento como una forma de renovacin. Las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta el EC por si solo durante la extincin.

Sensibilidad a la devaluacin del reforzador


La persistencia del aprendizaje original a pesar de la extincin puede tambin investigarse analizando los efectos de la devaluacin del reforzador. Rescorla ha utilizado la tcnica de devaluacin del EI para determinar si la asociacin EC-EI establecida a travs de condicionamiento pavloviano persiste a lo largo de la extincin. Los hallazgos han fortalecido la conclusin de que la extincin no elimina las asociaciones R-C y E-C que se aprende durante el condicionamiento instrumental.

Qu se pretende con la extincin?

Si como hemos visto la extincin no implica desaprendizaje y deja intacta las asociaciones R-C y E-C, por qu disminuye las respuestas en los procedimientos de extincin?

Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han llegado a la conclusin de que la falta de reforzamiento produce una asociacin E-R inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estmulo especfico, produce una asociacin E-R inhibitoria que sirve para suprimir esa respuesta siempre y cuando el E est presente. Esta hiptesis, predice que los efectos de la extincin sern altamente especficos del contexto en el que la respuesta fue extinguida. La omisin de una recompensa esperada genera desilusin o frustracin. Estos efectos emocionales se presume que desempean un papel crtico en la disminucin conductual que se da en la extincin. La ausencia de recompensa esperada desencadena una reaccin frustante aversiva incondicionada que sirve para que se deje de responder durante el curso de la extincin mediante el establecimiento de una asociacin inhibitoria. La afirmacin de que la extincin implica el aprendizaje de una asociacin inhibitoria resulta controvertida frente a las teoras convencionales que consideraban la inhibicin condicionada y la extincin como fenmenos diferentes.

Efectos paradjicos de la recompensa


Efecto de sobreentrenamiento en la extincin. Cuanto ms entrenamiento con reforzamiento se proporciona ms fuerte es la expectativa de recompensa, y ms fuerte la frustracin cuando se introduce la extincin. La disminucin en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento ms extenso produce una extincin ms rpida. Especialmente evidente cuando el entrenamiento incluye reforzamiento continuo. Ejemplo: Podriamos pensar que un entrenamiento ms extenso creara una respuesta ms fuerte, que sera ms resistente a la extincin, pero sucede lo contrario. Efecto de magnitud del reforzamiento en la extincin: se refiere al hecho de que la respuesta disminuye ms rpido durante la extincin que sigue a un reforzamiento con un reforzador mayor. Es ms evidente cuando el entrenamiento incluye reforzamiento continuo. Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100 al mes; en la otra, 20 al mes. Si se deja de percibir la cantidad, es ms aversiva si nos hemos acostumbramos a 100 que a 20. Efecto del reforzamiento parcial en la extincin: Es el efecto paradjico ms estudiado.

Un factor crtico que determina la magnitud de los efectos tanto conductuales como emocionales de un procedimiento de extincin es el programa de reforzamiento que opera antes de que se introduzca el procedimiento de extincin. Pero la caracterstica dominante del programa que determina los efectos de la extincin es si la respuesta instrumental se reforz cada vez que ocurra (reforzamiento continuo) o slo algunas veces (reforzamiento intermitente o parcial). La extincin es mucho ms lenta y produce menos reacciones de frustracin si estaba en activo un programa de reforzamiento parcial antes de la introduccin del procedimiento de extincin. Este fenmeno se denomina el efecto de reforzamiento parcial en la extincin o ERPE,

Mecanismos del efecto del reforzamiento parcial en la extincin


La explicacin ms evidente del ERPE es que la introduccin de la extincin es ms fcil de detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de reforzamiento es presumiblemente mucho ms fcil de detectar tras el reforzamiento continuo. Esta explicacin del efecto del reforzamiento parcial en la extincin se llama hiptesis de la discriminacin. El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia de reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes. Una explicacin seria la teora de la frustracin, basada en que los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. La otra explicacin, la teora secuencial, est basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa. Teora de la frustracin: Desarrollada por Abram Amsel, la persistencia en la extincin es resultado del aprendizaje de algo paradjico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable experiencia con reforzamiento intermitente. El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce el aprendizaje de expectativas tanto de recompensa como de no recompensa. La expectativa de recompensa alienta a los sujetos a responder, y la anticipacin de la ausencia de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a favor de responder. La resolucin del conflicto ocurre debido a que el reforzamiento no es predecible en el tpico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la teora de la frustracin, esta es la clave de la persistencia en responder durante la extincin. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reaccin a la expectativa de ausencia de recompensa. Por el contrario no existe nada en la experiencia

del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extincin. Teora secuencial; Capaldi, est formulada en trminos de memoria. Asume que los sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados. Se asume adems que durante el entrenamiento en reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser una clave para la realizacin de la respuesta instrumental, esto produce persistencia en le extincin. Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la extincin. Desde que la dos teoras fueron propuestas se ha obtenido gran evidencia en apoyo de cada teora. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede influir sobre la respuesta durante la extincin. Los mecanismos de memoria pueden contribuir en mayor medida cuando los ensayos de entrenamiento no estn separados por largos intervalos entre ensayos. El aprendizaje emocional descrito por la teora de la frustracin es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una mejor explicacin del ERPE cuando se utilizan ensayos ampliamente espaciados.

Resistencia a la extincin y momento conductual


Otra forma de considerar la persistencia de la respuesta en la extincin es que representa la resistencia al cambio en las contingencias de reforzamiento que sucede cuando se introduce la extincin. Nevin y colaboradores han estudiado la resistencia al cambio de forma ms general y han propuesto el concepto de momentos conductual para caracterizar la susceptibilidad de la conducta a las interrupciones. Est basada en el concepto de momento de la fsica newtoniana. Predice que la conducta que posee un momento elevado tambin ser difcil de parar o interrumpir por las manipulaciones. Un experimento en el que particip HCB, una chica de 17 aos y una edad mental de 3. Los resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de momento conductual. La primera es que el momento conductual est directamente relacionado con la tasa de reforzamiento. Una tasa ms alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupcin; otro hallazgo es que el momento conductual no est relacionado con la tasa de respuesta. Dos conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de respuesta como el determinante fundamental del momento conductual. Esta conclusin est confirmada por otros estudios que demuestran que los

programas que proporcionan tasas similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o resistencias al cambio. La primaca de la tasa de reforzamiento sobre la tasa de respuesta como determinante del momento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductual principalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exacta en que estas asociaciones promueven el momento conductual no se han averiguado todava. El reto principal a la proposicin bsica de que el momento conductual est directamente relacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que la resistencia a la extincin es mayor despus de una baja tasa o probabilidad de reforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que la extincin es menos discriminable tras el reforzamiento intermitente que tras el continuo

Comentarios finales
Los estudios sobre extincin ilustran la naturaleza duradera de ciertos temas en la teora de la conducta. Los primeros estudios sobre la extincin se centraron en los efectos del reforzamiento parcial enla extincin y otros efectos paradjicos de la recompensa, y se llevaron a cabo dentro de la tradicin hulliana que daba preeminencia al aprendizaje E-R. Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de la revolucin cognitiva que se introdujo en la psicologa en el ltimo cuarto de siglo XX. sta proporcion una mejor compresin de la recuperacin espontnea y llev al descubrimiento de nuevos fenmenos como la renovacin y el restablecimiento. Sin embargo, estos fenmenos representas los fallos de la extincin ms que la exticnin en s misma. Como se ha descrito, la compresin de la extincin en s misma ha requerido la vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los investigadores sigun interesados en qu es lo que hace que conducta sea resistente al cambio. Esta resistencia o momento conductual plantea especiales desafos para la terapia de conducta.