Sei sulla pagina 1di 6

Elementos Fundamentales del Condicionamiento Instrumental:

El anlisis del condicionamiento instrumental incluye numerosos factores y


variables. La esencia de la conducta instrumental es que est controlada por su
consecuencia. El condicionamiento instrumental consta de 3 elementos clave:
Una respuesta, una consecuencia (el reforzador) y una relacin entre la
respuesta y la consecuencia.

La Respuesta Instrumental:

El resultado de los procedimientos de condicionamiento instrumental depende


en parte de la naturaleza de la respuesta que se est condicionando. Algunas
respuestas son ms modificables que otras.

Variabilidad conductual versus estereotipia:

Tanto Thorndike como Skinner enfatizaron que el reforzamiento incrementa la


probabilidad de que la respuesta instrumental se repita en el futuro. Este
nfasis alent la creencia de que los procedimientos de condicionamiento
instrumental producan uniformidad o estereotipia en la conducta. Se
desarrollan respuesta estereotipadas crecientes si este se permite o se
requiere por el procedimiento de condicionamiento instrumental. Esto no
significa que el condicionamiento instrumental no pueda tambin verse
involucrado en la produccin de respuestas creativas o variables.

La variabilidad de la respuesta puede ser la base para el reforzamiento


instrumental.

En un estudio sobre el condicionamiento instrumental de la variabilidad de


respuesta (Page y Neuringer, 1985), las palomas tenan que picotear dos teclas
de respuesta ocho veces para obtener comida. Los ocho picotazos podan
distribuirse de cualquier forma entre las dos teclas. Este estudio ilustra dos
hechos interesantes acerca del condicionamiento instrumental. En primer lugar,
que la variabilidad de la respuesta puede mantenerse e incrementarse por
reforzamiento. Por tanto, la variabilidad de la respuesta puede establecerse
como una operante. Los resultados tambin muestran que en ausencia de
reforzamiento explcito de la variabilidad, la respuesta llega a ser mas
estereotipada con un condicionamientos instrumental continuado. Por tanto, el
resultado tpico del reforzamiento instrumental es una disminucin en la
variabilidad de la respuesta.

-Relevancia o Pertinencia en el condicionamiento instrumental:

En el condicionamiento instrumental tiene lugar relaciones anlogas de


pertinencia o relevancia.
Thordike fue el primero en observar diferencia en la facilidad de
condicionamiento de varias respuestas. Los gatos podan aprender a realizar
estas respuestas, pero, curiosamente, la forma de las respuestas cambi a
medida que el entrenamiento progresaba. Thorndike propuso el concepto de
pertinencia para explicar los fallos en el entrenamiento del rascado y el
bostezo. De acuerdo con este concepto, ciertas respuesta se correspondan de
forma natural con el reforzador debido a la historia evolutiva del animal. Por
contra, rascar y bostezar no ayudan normalmente a los animales a escapar del
confinamiento y, en consecuencia, no se corresponden con escapar de una
caja problema.

El concepto de pertinencia en el condicionamiento instrumental esta bien


ilustrado en un estudio ms reciente con un pez pequeo.

K. Breland y M. Breland, tambin observaron varias limitaciones en el


condicionamiento instrumental al intentar condicionar respuestas
instrumentales con reforzamiento de comida en varias especies. Los Breland
tuvieron dificultados parecidas con otras especies. Llamaron Deriva instintiva
al desarrollo de respuestas como la de hozar en los cerdos y frotar monedas en
los mapaches. Como el termino implica, las respuestas extras que
desarrollaban en estas situaciones de reforzamiento con comida, eran
actividades que los animales realizaban instintivamente cuando obtenan
comida. Los cerdos hozaban por el suelo en conexin con la alimentacin y los
mapaches frotan y lavan objetos relacionados con la comida. Los Breland
pusieron de relieve que estas tendencia de respuestas instintivas deban
tenerse en cuenta en el anlisis del comportamiento.

Sistemas de Conducta y Limitaciones en el Condicionamiento


Instrumental:

De acuerdo con la teora de los sistemas de conducta, cuando un animal esta


privado de comida y se encuentra en una situacin donde podra encontrarla,
su sistema de alimentacin se activa, y se dedica al forrajeo y otras actividades
relacionadas con la comida. Sobre este sistema de conducta se superpone un
procedimiento de condicionamiento instrumental. La efectividad del
procedimiento para el incremento de una respuesta instrumental depender de
la compatibilidad de esa respuesta con la organizacin preexistente del sistema
de alimentacin. La naturaleza de otras respuestas que emergen durante el
curso de entrenamiento ( o deriva Instintiva) depender de los componentes
conductuales del sistema de alimentacin que se activen debido al
procedimiento de condicionamiento instrumental.

La teora de los sistemas de conducta predice que el reforzamiento de comida


podra producir incrementos en actividades como cavar, escarbar y erguirse,
pero no en actividades como lavarse la cara y rascarse.
Por tanto, La deriva Instintiva representa la intrusin de respuestas
apropiadas al sistema de conducta activado durante el desarrollo del
condicionamiento instrumental.

El Reforzado Instrumental:

Varios aspectos del reforzador determinan sus efectos sobre el aprendizaje y la


ejecucin de la conducta instrumental.

Cantidad y Naturaleza del Reforzador: La cantidad y la Naturaleza del


reforzador son lgicamente caractersticas diferentes. Un cambio en la cantidad
del reforzado puede tambin hacer al reforzador cualitativamente distinto. En
situaciones de Operante Libre, no obstante, los efectos de la magnitud del
reforzador son ms complejos y dependen del programa de reforzamiento
utilizado y de otros factores.

Cambios en la naturaleza y la cantidad del reforzador:

Si el Ei es mayor (o ms intenso de lo esperado), producir condicionamiento


excitatorio. Por el contrario, si el Ei es menor (o ms dbil ) de los esperado,
producir condicionamiento inhibitorio. Si se ha estado trabajando por 9,50
euros la hora durante los 6 ltimos meses, conseguir ese mismo salario no
resultar muy emocionante. Sin embargo, si se ha estado trabajando por 7,50
euros la hora, un aumento hasta 9,50 euros la hora resultar especialmente
atractivo. La evidencia experimental confirma esta impresin. Numerosos
estudios han mostrado que los efectos de una cantidad y tipo de reforzador
particular dependen de la cantidad y naturaleza de los reforzadores que el
individuo ha experimentado previamente. Una recompensa favorable se trata
como especialmente buena tras el reforzamiento con una recompensa mala, y
una recompensa desfavorable se trata como especialmente mala despus de
una buena recompensa.

Los efectos de un cambio en la cantidad de recompensas fueron descritos,


primero por Crespi en 1942, y ms recientemente por Mellgren en 1972, en el
que se utiliz un corredor con 4 grupos de ratas. El hallazgo ms significativo
fue que despus de un cambio en la magnitud de la recompensa, la velocidad
de la carrera no estaba totalmente determinada por la nueva magnitud de la
recompensa. Los efectos de la nueva recompensa aumentaron por la
experiencia previa con una recompensa contrastada.

Los resultado que obtuvo Mellgren ilustran el fenmeno del contraste sucesivo
positivo y negativo. El Contraste Positivo se refiere a una elevada respuesta
por una recompensa favorable resultado de una experiencia anterior con una
consecuencia menos atractiva. El Contraste Negativo se refiere a una
respuesta disminuida por una recompensa desfavorable debido a una
experiencia anterior con una consecuencia mejor. En el estudio de Mellgren se
presentaron dos condiciones de recompensas en diferentes fases del
experimento. Los resultados se denominan contraste sucesivo positivo o
negativo. Los efectos de contraste tambin se dan si las condiciones de
recompensa se modifican una y otra vez, con una clave diferente sealando
cada condicin de recompensa. Estos efectos son ejemplos de contraste
conductual simultneo

Los diferentes efectos de contraste estn mediados por diferentes


mecanismos. Todos los efectos de contraste ilustran que la efectividad de un
reforzador en una situacin est determinada en parte por las experiencias del
organismo con reforzadores en otras situaciones. El contraste negativo se ha
obtenido de forma ms clara que el contraste positivo. El encuentro inicial con
la recompensa inesperadamente pequea activa respuestas exploratorias y de
bsqueda que podran conducir al encuentro de una mejor fuente de comida. El
desencanto emocional se establece cuando las respuestas de bsqueda no
tienen xito y el sujeto tiene que conformarse con la recompensa pequea.

La relacin Respuesta-Reforzador:

En algunos casos, hay una fuerte relacin entre lo que una persona hace y la
consecuencia que sigue. En otros casos no hay relacin entre la conducta y la
consecuencia. La relacin entre la conducta y sus consecuencia pueden ser
tambin probabilsticas.

Los seres humanos y otros animales realizan un continuo flujo de respuestas y


experimentan todo tipo de eventos ambientales. Para ser eficiente, se tiene que
saber cundo se debe hacer algo para obtener un reforzador y cuando el
reforzador es probable que sea entregado independientemente de cualquier
accin. La conducta instrumental eficiente requiere sensibilidad a la relacin
respuesta-reforzador.

Existen 2 tipos de relaciones entre una respuesta y un reforzador. Una es la


relacion temporal, que se refiere al tiempo que transcurre entre la respuesta y
el reforzador. Un tipo especial de relacin temporal es la contigidad
temporal, la cual se refiere a la entrega del reforzador inmediatamente
despus de la respuesta. El segundo tipo de relacin entre una respuesta y el
reforzador es la relacin causal o la contingencia respuesta-reforzador. La
contingencia respuesta reforzadora se refiere al hecho de que la respuesta
instrumental es necesaria y suficiente para la ocurrencia del reforzador. Los
factores temporales y causales son independientes unos de otros.

Efectos de la contigidad temporal:

El reforzamiento inmediato es preferible al demorado segn los psiclogos


Mcdevitt y Williams (2001). El condicionamiento instrumental requiere
proporcionar el reforzador inmediatamente despus de la ocurrencia de la
respuesta instrumental. El aprendizaje instrumental se altera demorando el
reforzador tras la ocurrencia de la respuesta instrumental.

Los resultados indican que la respuesta decae bastante rpido con incrementos
en la demora del reforzamiento.

Porque es el reforzamiento instrumental tan sensible a la demora del


reforzamiento? Hay varios factores que pueden contribuir. Para asociar R1 con
el reforzador, el organismo tiene que poder distinguir de alguna forma R1 de
otras respuestas que realiza durante el intervalo de demora. Hay 2 formas de
resolver este problema: La primera tcnica, es proporcionar un reforzador
secundario o condicionado inmediatamente despus de la respuesta
instrumental. Un reforzador condicionado o secundario es un estmulo
condicionado que ha sido previamente asociado con el reforzador. Las
confirmaciones verbales en el adiestramiento, como bueno y eso es, son
reforzadores condicionados.

Otra tcnica que facilita el aprendizaje con reforzamiento demorado es marcar


la respuesta instrumental criterio de alguna manera para hacerla distinguible
de otras actividades del organismo. la efectividad de un procedimiento de
marcado se demostr por primera vez por los psiclogos Lieberman, McIntosh
y Thomas en 1979. Se utilizaron ratas e el experimento, y el aparato fue un tipo
especial de laberinto. Se probaron 2 grupos de animales, que se diferenciaron
por lo que les haba ocurrido inmediatamente despus de realizar la eleccin
correcta. Las ratas del grupo marcado fueron recogidas por el experimentador
y situadas en la caja de demora. Por el contrario, los animales del grupo no
marcado no fueron retirados. Despus de que hicieran la respuesta correcta,
se les abra la puerta del final del corredor de eleccin y se les permita caminar
hacia el sitio de demora sin ser manipuladas. Sesenta segundos despus de la
respuesta instrumental, ambos grupos fueron situados en la caja de meta para
obtener el reforzador. Cuando las ratas realizaban una respuesta incorrecta, no
eran reforzadas al final del intervalo de demora. Tena lugar el mismo estmulo
de marca (manipulacin) tanto en los ensayos reforzados como en lo no
reforzados. Debido a esto, el estmulo de marca no estaba especficamente
relacionado con el reforzamiento.

Los resultado del reforzamiento reflejan, que las ratas del grupo marcado
aprendieron la respuesta instrumental con la demora en el reforzamiento de 60
segundos mucho mejor que los animales del grupo no marcado.

Tanto el reforzamiento secundario como los procedimientos de marcado se


centran en conectar mejor la respuesta instrumental crtica con el reforzador
demorado. Hay que considerar tambin, que cuando se presenta un reforzador
independientemente de la conducta, el sujeto no puede facilmente decir cundo
ser reforzado.
Otra consecuencia del reforzamiento independiente de la respuesta es el
condicionamiento de claves contextuales. Dichinson, Watt y Varga (1996)
encontraron que los procedimientos que interrumpen el condicionamiento de
claves contextuales ayudan a neutralizar los efectos perjudiciales del
reforzamiento demorado en el condicionamiento instrumental.

Potrebbero piacerti anche