Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PRINCIPIOS DE
APRENDIZAJE Y CONDUCTA
Antecedentes histricos
-
Definicin de aprendizaje:
-
1
Descargado del campus, http://campus.felizmente.info
Antecedentes Histricos
Las aproximaciones tericas al estudio del aprendizaje tienen
sus races en la filosofa de Ren Descartes. Antes de
Descartes, se pensaba que el comportamiento humano estaba
enteramente determinado por la intencin consciente y por el
libre albedro. Descartes reconoci que muchas cosas que
hacen las personas son respuestas automticas a estmulos
externos, aunque no abandon por completo la idea del libre
albedro y del control consciente. Por tanto, formul la visin
dualista del comportamiento humano conocida como dualismo
cartesiano: conducta voluntaria controlada por la mente y
conducta involuntaria controlada por mecanismos reflejos.
rganos
sensoriales
Cerebro
Accin
voluntaria
o involuntaria
Glndula
pineal
Mente
(causa de la
accin
voluntaria)
Msculos
Diagrama de dualismo cartesiano. Los rganos sensoriales detectan los eventos del mundo fsico. Desde aqu la
informacin se trasmite al cerebro. El cerebro est conectado a la mente por medio de la Glndula pineal. La accin
involuntaria se realiza por un arco reflejo que enva mensajes en primer lugar a los rganos sensoriales al cerebro y
despus del cerebro a los msculos. La accin voluntaria se inicia en la mente, que enva mensajes al cerebro y despus a
los msculos.
Descartes asume que los estmulos del ambiente externo son la causa de toda conducta
involuntaria. Estos estimulos producen respuestas involuntarias por medio de un circuito
neuronal que incluye al cerebro. Sin embargo, crea que los mismos nervios transmitan la
informacin de los rganos de los sentidos al cerebro y del cerebro a los msculos. Este
circuito permita reacciones rpidas a estmulos exteros ( ejemplo: retirar rpidamente un
dedo del fogn caliente).
Descartes crea que los animales carecan del libre albedro y eran incapaces de acciones
voluntarias y conscientes, frente a los seres humanos que se les atribua una mente o alma.
La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glndula pineal,
cerca del cerebro, por lo que poda tener conciencia de la conducta involuntaria e iniciar las
3
Descargado del campus, http://campus.felizmente.info
acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, sta poda
tener lugar independientemente de la estimulacin externa.
El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones
intelectuales, base del estudio del aprendizaje moderno:
1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente.
2.- La reflexologa, del mecanismo de la conducta involuntaria.
4
Descargado del campus, http://campus.felizmente.info
Leyes de asociacin. Los empiristas britnicos aceptaron dos conjuntos de leyes para el
establecimiento de asociaciones:
5
Descargado del campus, http://campus.felizmente.info
de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes se
consider las respuestas reflejas como innatas y fijadas de antemano por las conexiones del
sistema nervioso y por tanto un estmulo dado elicitara la misma respuesta a lo largo de
toda la vida del individuo.
Pavlov demostr experimentalmente que no todos los reflejos
son innatos. Mediante mecanismos asociativos se pueden
establecer nuevos reflejos para los estmulos. Trabaj desde
la tradicin fisiolgica de la reflexologa tratanto de
determinar las leyes de la asociacin mediante la investigacin
experimental .
7
Descargado del campus, http://campus.felizmente.info
Neurologa Funcional.
De acuerdo con el principio del nervismo, las principales funciones fisiolgicas estn
gobernadas por el sistema nervioso (SN). Ivan Pavlov dedic su vida a investigarlo y gran
parte a la identificacin de los mecanismos neurales de la digestin. El descubrimiento por
parte de los britanicos Bayliss y Starling evidenciando el control parcial del pncreas por
factores hormonal y no por factores neurales, hizo que abandonara el estudio de la
fisiologa del sistema digestivo para investigar los reflejos condicionados. La afirmacin de
Pavlov segn la cual los estudios de aprendizaje revelan cmo opera el sistema nervioso es
ampliamente aceptada por los neurocientficos contemporaneos. Kandel, por ejemplo, ha
comentado que "el principio central de las modernas neurociencias es que todo
comportamiento es un reflejo del funcionamiento del cerebro".
El psiclogo del comportamiento es como un conductor que trata de descubrir el
funcionamiento de un vehculo experimental probandolo, en lugar de estudiando el motor.
Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinaria
del sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistema
nervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismo
por el cual persisten las respuestas aprendidas y de las circunstancias en las cuales la
informacin aprendida es o no accesible. Al detallar las funciones del sistema nervioso, los
estudios conductuales del aprendizaje definen los rasgos u operaciones que deben ser
explicados por investigaciones de tipo neurofisiolgico.
8
Descargado del campus, http://campus.felizmente.info
9
Descargado del campus, http://campus.felizmente.info
Definicin De Aprendizaje.
No hay una definicin de aprendizaje universalmente aceptada. Sien embargo, muchos
aspectos quedan recogidos en las siguiente afirmacin:
El aprendizaje es un cambio duradero en los mecanismos de conducta que implica
estmulos y/o respuestas especficas y que es resultado de la experiencia previa con
esos estmulos y respuestas o con otros similares.
13
Descargado del campus, http://campus.felizmente.info
Obtener informacin sobre las bases evolutivas y biolgicas del aprendizaje, o cmo
evoluciona la cognicin y la inteligencia requieren el apoyo o la utilizacin de animales de
investigacin.
Igualmente el conocimiento de las bases biolgicas del aprendizaje necesitan el apoyo de los
animales de laboratorio para desenmaraar cmo aprende y recuerda el sistema nervioso.
Los estudios conductuales de aprendizaje realizados con animales son un requisito necesario
para cualquier intento de investigar las bases biolgicas del aprendizaje con animales. La
neurociencia tiene que fundamentarse en la ciencia del comportamiento.
Estudiar los procesos de aprendizaje en animales criados en condiciones de control de
laboratorio es ms simples que hacerlo en personas cuyos ambientes son mucho ms
variados y difciles de describir. El comportamiento de los animales no se ve complicado por
los procesos lingsticos que juegan un papel tan importante en determinados tipos de
conducta humana. Otra ventaja importante es que en la investigacin con animales no es
necesario hacer peticiones explcitas a los sujetos. En la investigacin con humanos se debe
asegurar que los participantes no estn influenciados por el deseo de complacer al
investigador.
14
Descargado del campus, http://campus.felizmente.info
7.764.200.000
303.604.000
301.251.000
59.801.000
104.301.000
6.691.000
8.539.848.000
75.429
26.091
56.381
217.079
309.322
159.742
7.452.186
150.987
8.452.186
*Datos de 1997 de EEUU.
Porcentaje del total empleado en investigacin = 0.099%
15
Descargado del campus, http://campus.felizmente.info
TERMINOS CLAVE
Aprendizaje Cambio duradero en los mecanismos de
conducta que implica estmulos y/o respuestas
especficos y que es resultado de la experiencia
previa con esos estmulos y respuestas o con otros
similares.
de
un
la cual las
categoras:
la mente y
mecanismos
organismo
en
un
Reflejo Mecanismo que permite que un evento
especfico del ambiente elicite una respuesta
especfica.
El concepto de reflejo.
Pautas de accin modal.
Estmulos elicitantes de las pautas de accin modal.
La organizacin secuencial de la conducta.
Curso temporal.
Especificidad del estmulo.
Efecto de un estmulo externo intenso.
17
(pg. 29)
Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de la
conducta tiene lugar como respuesta a los estmulos; es decir, ocurre de forma elicitada.
El concepto de reflejo.
Un reflejo conlleva dos elementos ntimamente relacionados, un estmulo elicitante y su
correspondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estmulo.
Estmulo y respuesta es una consecuencia de la organizacin del sistema nervioso.
reflejos simples suelen estar mediados por tres neuronas:
-
Los
Organizacin neuronal de los reflejos simples. Los estmulos del entorno activan una neurona sensorial,
que trasmite el mensaje sensorial a la mdula espinal. En este lugar, el impulso neuronal pasa a una
interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo
involucrado en el movimiento.
Los circuitos neuronales estn dispuestos de tal modo que determinadas neuronas
sensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una
19
21
Patrn de tablero 4 x 4
Patrn de tablero 12 x 12
Los resultados muestran que la atencin visual provocada por un estmulo novedoso cambia a
medida que el beb se familiariza con el estmulo. Con el patron 4x4 relativamente sencillo,
la atencin visual se reduce progresivamente. Con el patrn 12x12 ms complejo, la atencin
se increment en el segundo ensayo, pero despus se redujo tambin.
22
23
24
activ, no slo el sistema E-R, sino tambin el sistema estado. Produjo un incremento en la
atencin visual despus del primera presentacin. Sin embargo, el proceso de sensibilizacin
no fue lo suficientemente fuerte para contrarestar completamente los efectos de la
habituacin. Como resultado, despues de varios ensayos, la atencin visual tambien declino
en respuesta al estimulo 12x12.
La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicacin
diferente de la teora del proceso dual. Cuando se someti a prueba con ruido ambiental
relativamente suave (60 dB), no haba nada que las activara. Por tanto, podemos asumir que
los procedimientos experimentales no produjeron cambios en el sistema estado. La
presentacin repetida de tono elicitador activaba tan slo el sistema E-R, lo que dio lugar a
la habituacin de la respuesta de sobresalto.
El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.
Sucesivas presentaciones del tono aparecieron reacciones de sobresalto ms enrgicas.
Dado que en ambos grupos se utiliz el mismo tono, la diferencia en los resultados no puede
ser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intenso
increment el nivel de activacin o la tendencia a respuesta. Esta sensibilizacin del sistema
de estado fue la causa del incremento en la reaccin de sobresalto al tono en el segundo
grupo.
Implicaciones de la teora del proceso dual. El sistema E-R se activa siempre que un
estmulo elicita una respuesta, mientras que el sistema de estado slo interviene en
circunstancias especiales.
26
27
Reaccin emocional
"positiva": Euforia y
relajacin.
Reaccin emocional
"negativa": Irritabilidad,
agresividad.
29
30
31
TERMINOS CLAVE
Adaptacin sensorial Reduccin temporal en la
sensibilidad de los rganos sensoriales provocada
por la estimulacin repetida o excesiva.
32
Reforzador
Estmulo
cuya
administracin
inmediatamente posterior a una respuesa
incrementa la probabilidad futura de dicha
respuesta.
Sistema de estado Estructuras neurales que
determinan el nivel general de responsividad o
tendencia a responder del organismo.
33
Situaciones experimentales
-
35
Comenzaron con el trabajo del fisilogo ruso Ivan P. Pavlov. Los descubrimientos de Edwin
B. Twitmyer sobre el condicionamiento clsico, que realiz en su tesis doctoral, en el que no
investig sistemticamente las implicaciones y sus hallazgos no despertaron gran atencin.
Como una estensin ms de los estudios que Pavlov realiz sobre la digestin, su equipo
tnico descubri que los perro secretaban jugos gstricos en respuesta de la mera visin de
la comida o la persona que normalmente se las suministraba. Sus tcnicos del laboratorio lo
llamaban "secreciones psqicas" .
38
Situaciones experimentales
Respuesta durante EC
Respuesta durante el EC + Respuesta durante el pre EC
La razn de supresin adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el
numerador de la frmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el
EC, la razn tiene un valor de 0,5.
39
40
-J.W.Grau
42
Otro factor importante es la relacin entre la cantidad de tiempo que el sujeto pasa en el
contexto experimental y la duracin de cada presentacin del EC. Se obtienen mayores
niveles de seguimiento del signo con mayores exposiciones al contexto experimental en
relacin a la duracin EC.
Segundo, puede darse despus de varias horas de la exposicin al nuevo sabor. Probablemente sea un aprendizaje
demorado de la aversin al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con
efecto retardado.
43
Tiempo
Condicionamiento
de demora corta
Condicionamiento
de huella
Condicionamiento
de demora larga
Condicionamiento
simultaneo
Condicionamiento
hacia atrs
Inicio
Final
EC
EI
Procedimiento de condicionamiento
clsico en el que el estmulo
incondicionado se presenta poco
despus de que haya terminado el
estmulo condicionado.
EC
EI
Similar
al
procedimiento
de
condicionamiento de demora corta,
en que el EC comienza antes que el
EI, sin embargo, EI se demora ms
tiempo (5-10 minutos).
EC
EI
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado y el incondicionado
se presenta simultneamente en
cada ensayo condicionado.
EC
EI
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado se presenta en todos
los ensayos despus del estmulo
incondicionado.
EC
EI
44
Procedimiento de condicionamiento
clsico en el que el estmulo
condicionado aparece poco antes
del estmulo incondicionado en
cada ensayo de condicionamiento.
45
que el cambio conductual observado no podra haberse producido por la mera presentacin
de EC o del EI por separado.
El incremento en la respuesta podra resultar de la sensibilizacin y no por un proceso
asociativo. La presentacin de un estmulo activador, como la comida a un animal
hambriento, puede incrementar la conducta provocada por un estmulo menos efectivo, tal
como un tono, sin que se haya establecido ninguna asociacin entre los dos estmulos. Por
tanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC y
el EI podra ser, en realidad, el resultado de una mera exposicin al EI. Los casos en los que
la mera exposicin al EI da lugar a respuestas similares a la respuesta condicionada reciben
el nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante el
EC representa una asociacin entre EC-EI, en lugar de sensibilizacin debido a la exposicin
a los EC y EI, se requieren procedimientos de control.
Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en el
que los estmulos condicionado e incondicionado se pesentan en momentos aleatorios uno
respecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizaje
asociado.
Un procedimiento ms til es el denominado control desemparejado explcito, que consiste
en la presentacin de los estmulos condicionados e incondicionado en diferentes ensayos,
pero con el suficiente espacio temporal para evitar que se asocien.
46
47
de
El EC seala una reduccin en la probabilidad de que aparezca el EI. Como por ejemplo, Los
nios que se meten con un compaero en clase y dejan de hacerlo en presencia del profesor.
El profesor funciona como EC- que seala un perodo libre de acoso, o ausencia EI.
En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez en
cuando tras el EC, pero con una probabilidad pequea. Es mucho ms probable que el EI
aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y
el EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentacin del EI no
puede predecirse. El EI tiene lugar de forma probabilstica, a diferencia del procedimiento
estndar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presenta
el EC- junto con el EC+. As podemos predecir el momento preciso de la aparicin del EI, y
tambin permite predecir cundo no va a aparecer, posibilitando la codificacin temporal de
la ausencia del EI.
Medicin de la inhibicin.
Los estmulos inhibitorios elicitan reacciones opuestas a los estmulos condicionados
excitatorios. Si los estmulos condicionados excitatorios provocan salivacin, los estmulos
inhibitorios provocan la supresin de la salivacin.
Sistema de respuesta bidireccionales. La identificacin de tendencias de respuesta
opuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direcciones
opuestas con respecto a una lnea base de ejecucin normal. Por ejemplo, una paloma puede
acercarse a una tecla luminosa asociada con la presentacin subsiguiente de comida o
cuando se utiliza un procedimiento inhibitorio, alejarse de la luz.
Una limitacin es que este mtodo funciona slo con respuestas que pueden ir en
direcciones opuestas. Otra es que esta tcnica puede mostrar slo el efecto neto de la
excitacin y la inhibicin. El sujeto se aproxima a EC si excitacin es mayor a la inhibicin
y se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Esto
invalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatorias
e inhibitorias)
La prueba del estmulo compuesto o sumacin. Cuando la conducta no es bidireccional el
procedimiento ms aceptado por los investigadores para la medicin de la inhibicin
condicionada es la prueba de sumacin o del estmulo compuesto. La prueba requiere
observar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio.
49
Prueba del estmulo compuesto de la inhibicin en un experimento de supresin del lameteo. Los estmulos A y B se
condicionaron como estmulos excitatorios mediante la presentacin de cada uno de ellos por separado junto con la descarga
(A+ y B+). El estmulo X se condicion como inhibidor presentndolo junto con el estmulo A sin la descarga (AX-). El
estmulo Y era un estmulo de control que no haba intervenido en ningn condicionamiento excitatorio o inhibitorio. A era una
luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a
prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles
adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.
50
experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo de
secrecin de lecha cuando el nio llora o cuando llega lahora habitual de amamantamiento.
Todos estos estmulos preceden de forma regular a la succin del beb y por tanto pueden
condicionarse a la estimulacin propia de la succin y adquirir la capacidad de provocar la
secrecin de lecha como respuesta condicionada. Las respuestas anticipatorias de
orientacin y succin y la respuesta anticipatoriade secrecin de leche hace que la lactancia
sea ms satisfactoria tanto para la madre como para el nio.
El condicionamiento pavloviano tambin es importante en el aprendizaje acerca de
situaciones sexuales. Estudios realizados con animales machos y como estmulo condicionado
la visin de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acaban
aproximandose a los estmulos que sealan la disponibilidad de un compaero sexual. La
exposicin a un EC sexual realizan la respuesta copulatoria ms rpidamente, compiten
mejor con otros machos por el acceso a una hembra, muestran ms conducta de cortejo,
liberan una mayor cantidad de esperma y muestran un incremento en los niveles de
testosterona y hormona luteinizante. Incluso incrementan el nmero de cras en algunas
especies de peces y codornices estudiadas.
COMENTARIOS FINALES
En este Captulo se ha continuado el estudio sobre la conducta elicitada desplazando la
atencin de la habituacin y la sensibilizacin al condicionamiento clsico, ms complejo, ya
que est mediada por mecanismos asociativos. El condicionamiento clsico es una de las
principales tcnicas para investigar cmo se aprenden las asociaciones y pueden intervenir
en muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado,
el aprendizaje puede tener lugar de manera rpida o lenta. Con algunos procedimientos, se
aprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibir
una respuesta particular en presencia del estmulo condicionado. El condicionamiento
exitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirve
para mejorar la efectifidad con la que nos enfrentamos a eventos biolgicamente
significativos.
52
TRMINOS CLAVE
Aprendizaje de objeto Aprendizaje de asociaciones entre diferente elementos de un objeto.
signo.
Condicionamiento de huella
Procedimiento de
condicionamiento clsico en el que el estmulo
incondicionado se presenta poco despus de que
haya terminado el estmulo condicionado.
Condicionamiento simultneo
Procedimiento de
condicionamiento clsico en elque el estmulo
condicionado y el incondicionado se presentan
simultneamente en cada ensayo de condicionamiento.
Intervalo EC-EI
estmulos.
53
mulo compuesto.
Supresin condicionada
emocional condicionada.
RC.
54
El efecto de bloqueo.
El modelo de Rescola y Wagner.
Otros modelos de condicionamiento clsicos.
Comentarios finales
55
A qu deben su eficiacia
incondicionados? (pgina 91 del libro)
los
estmulos
condicionados
57
ms lentamente que los participantes para los cuales el EI es novedoso. Este resultado se
denomina efecto de preexposicion al EI.
Dos son las explicaciones por parte de los investigadores de los efectos de preexposicion
al EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de los
estmulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en la
que los participantes recuerdan lo sucedido en fase de experimento alterando la respuesta
condicionada. Los mecanismos que reduzcan el recuerdo de preexposicin en el momento de
la prueba fortalecen la respuesta condicionada.
Descarga
Malestar
El experimento se emparejaron un estimulo audiovisual y un estmulo gustativo, presentados simultaneamente, con una descarga
o con una sensacin de malestar, dependiendo del grupo. Despus los sujetos se pusieron a prueba con los estmulos
gustativos y audiovisuales por separado.
Las ratas condicionadas con una sensacin de malestar adquirieron una mayor aversin a las claves gustativas que las
audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversin a las claves
audiovisuales que a las gustativas.
58
Se demostr con ratas recien nacidas que la experiencia con sabores o con la enfermedad
(o con las claves audiovisuales y el dao perifrico) no es necesaria para que se d el efecto
de relevancia del estmulo. Ms bien, el fenmeno parece reflejar una predisposicin
gentica para la asociacin selectiva de ciertas combinaciones de estmulos condicionados e
incondicionados.
Se ha documentado otras situaciones del efecto de relevancia del estmulo de aversin al
sabor en palomas que asocian la comida mejor con claves visuales que con auditivas y una
descarga ms efectivas con las auditivas. En cuanto a efectos de relevancia del estmulo en
la adquisicin del miedo en monos, estos parecen que tienen una predisposicin para
aprender a temer a las serpientes de juguete que si lo hacen a flores de plstico. Esta
selectividad de estmulos en el aprendizaje de miedos tambin se muestran en las personas,
cuando participantes en estudios, han asociado fotografas de serpientes y araas con una
descarga con mayor facilidad que fotografas de flores y casas.
Los procedimiento de condicionamiento aversivo resultan ms
efectivos a la hora de eliminar el tabaquismo si se combinan
con otras tcnicas de modificacin conductual. La inhalacin
rpida, por ejemplo, puede combinarse con un entrenamiento
en autoobservacin o autoadministracin.
59
El trmino orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento
del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono
previamente condicionado sera el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estmulo,
por ejemplo, un olor, se tratara de condicionamiento de tercer orden.
60
61
62
El efecto de bloqueo
Conlleva
una secuencia de suscesos
similar. Primero se asocia EC (estmulo
A) y el EI. Una vez que el ECA esta bien
condicionado, se aade el segundo
estmulo (estmulo B) al estmulo A y se
presentan los dos juntos en los ensayos
de condicionamiento. El hallazgo bsico
es que el condicionamiento previo de A,
bloquea el desarrollo de la RC al
estmulo B.
que el
menor
Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizaje
de forma efectiva el EI deba ser inesperado o sorprendente.
Ecuacin bsica :
V = k ( V )
: astona de aprendizaje
V : valor asociativo de los estmulos
k : constante relacionada con la saliencia del EC y del EI.
64
el EI
1
Fase 2
EI
[A + B]
EI
EI
Prdida de valor asociativo a pesar de las presentacin continuada del EI. Los estmulos A y B se condicionan separadamente
hasta llegar a la asntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los
estmulos A y B se presentan simultneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una
expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeo al principio de la Fase 2, las propiedades
condicinadas de los estmulos A y B se reducen hasta que la presentacin simultnea de los dos ECs deja de producir un
exceso de expectativas.
cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valor
asociativo positivo, la nica forma es hacer que el valor asociativo del EC- sea negativo. El
modelo Rescola-Wagner explica la inhibicin condicionada asumiento que el EC- adquiere un
valor asociativo negativo.
Extincin de la excitacin y de la inhibicin. En un procedimiento de extincin, el
estmulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquirido
propiedades excitatorias (EC+) habr un exceso de expectativa del EI la primera vez que el
EC se presente sin el EI en la fase de extincin. Al continuar con los ensayos del EC solo, la
expectativa elicitada por el EC se va acercando a la lnea que representa la ausencia del EI
por medio de una reduccin gradual del valor asociativo del EC+ hasta llegar a cero.
El modelo de Rescola y Wagner prdice un situacin similar para la extincin de la inhibicin
condicionada. Al principio de la extincin, el EC- tiene valor asociativo negativo, esto puede
considerarse una prediccin excesivamente baja del EI; el organismo predice un EI con un
valor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativas
a la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y el
EC- termina con una fuerza asociativa igual a cero.
Problemas del modelo Rescorla Wagner.
1- Su anlisis de la extincin de la inhibicin es incorrecto. Algunos investigadores
han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades
inhibitorias.
2- El modelo considera la extincin como lo opuesto a la excitacin, o a la vuelta a un
valor asociativo cero, pero la extincin no debera verse como una mera inversin de la
adquisicin. La extincin parece involucrar el aprendizaje de una nueva relacin entre el EC
y el EI.
3- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias
como inhibitorias, en el modelo no pueden ser ambos.
4- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los
paradigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,
cabria esperar que la presencia del EC previamente condicionado interfiriera en el
condicionamiento del EC aadido en la fase 2. Se encontr el resultado opuesto: un efecto
de aumento o de contrabloqueo.
66
67
68
69
Comentarios finales
70
Trminos clave
Aprendizaje E-E Aprendizaje de una asociacin
entre dos estmulos, con el resultado de que la
exposicin a uno de los estmulos adquiere la
capacidad de activar una representacin o
imagen mental del otro estmulo. Tambin
llamado aprendizaje estmulo-estmulo.
estmulo-estmulo
Lo mismo que
aprendizaje E-E.
Aprendizaje estmulo-respuesta
aprendizaje E-R.
Lo mismo que
Homeostasis
Concepto introducido por Walter
Cannon para referirse a los mecanismos
fisiolgicos que permiten mantener los aspectos
corporales crticos (tales como los niveles e
azcar en sangre o la temperatura) dentro de
ciertos lmites. El nivel homeosttico suele
lograrse mediante la accin de mecanismos de
retroalimentacin
negativa
que
permiten
contrarrestar el efecto de los cambios en el
nivel homeosttico.
Efecto
bloqueo
Interferencia
en
el
condicionamien-to de un nuevo estmulo debida a
la presencia de un estmulo previamente
condicionado.
Efecto
de
aumentacin.
contrabloqueo
Lo
mismo
que
71
72
73
En este captulo se vuelve la vista al anlisis de las situaciones de aprendizaje en las cuales
los estmulos a los que un organismo se enfrenta son el resultado directo de su conducta,
descrita como dirigida a una meta.
La conducta que sucede debido a que ha servido previamente como instrumento para
producir ciertas consecuencias se denomina conducta instrumental.
75
77
78
La respuesta instrumental
El resultado de los procedimientos del condicionamiento instrumental depende en parte de
la naturaleza de la respuesta que se este condicionando.Algunas respuestas son mas
fcilmente condicionables que otras.
Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el
reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este
nfasis alent la creencia de que los procedimientos de condicionamiento instrumental
producan repeticiones de la misma respuesta - que producan uniformidad o estereotipia en
la conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no pueda
verse tambin involucrado en la produccin de respuestas creativas o variables. Los
organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer
algo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamiento
instrumental. (ver ejemplo. Pag 137).
Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el
termino de pertinencia para explicar los fallos en el entrenamiento del rascado y del
bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la
historia evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo de
respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas
respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y
competan con las respuestas que requera el investigador.
79
El reforzador instrumental
Cantidad y naturaleza del reforzador: En un estudio sistemtico, Hutt(1954) intento
aislar los efectos de la cantidad y naturaleza del reforzador alimenticio lquido mediante la
variacin sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeron
mayor tasa de respuesta.
Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la
efectividad de un reforzador dependa no slo de sus propiedades sino tambin de cmo ese
reforzador se compara con otros que el individuo haya experimentado. La efectividad de un
EI en el condicionamiento clsica depende de cmo se compare el EI con las expectativas
del individuo basndose en la experiencia previa. Esta es la idea fundamental del modelo
Rescorla-Wagner, si el EI es mayor de lo esperado, producir condicionamiento excitatorio,
si el EI es menor producir condicionamiento inhibitorio. Los efectos de una cantidad o tipo
de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo
ha experimentado previamente.
Mellgren (1972) Los resultados que obtuvo ilustran el fenmeno de contraste positivo: se
refiere a una elevada respuesta por una recompensa favorable, resultado de una
experiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere
80
a una respuesta disminuida por una recompensa desfavorable debido a una experiencia
anterior con una consecuencia mejor. Los efectos de contraste tambin se dan si las
condiciones de recompensa se modifican una y otra vez con una clave diferente saalando
cada condicin de recompensa, estos efectos son ejemplo de contraste conductual
simultaneo.
Todos los efectos de contraste ilustran que la efectividad de un reforzador en una
situacin esta determinada en parte por las experiencias del organismo con reforzadores en
otras situaciones. Por razones que no estn totalmente claras, el contraste negativo se ha
obtenido de forma ms clara que el contraste positivo.
La relacin respuesta-reforzador
Unas veces existe una fuerte relacin entre la conducta y sus consecuencias (introducir una
moneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja al
examen y sacar buena nota) y tambin puede ser probabilistica (hacer llamadas de telefono
y encontrar a alguien que te ayude).
Existen dos tipos de relaciones entre una respuesta y un reforzador:
1.- La relacin temporal , que se refiere al tiempo que transcurre entre la respuesta
y el reforzador. Un tipo especial es la contigidad temporal, la cual se refiere a la entrega
del reforzador inmediatamente despus de la respuesta.
2.- La relacin causal o contingencia respuesta-reforzador, se refiere al hecho de
que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.
Los factores temporales y causales son independientes unos de otros.
Ambas son independientes unos de otros .
Hay una relacin causal fuerte entre presentar una solicitud de admisin y ser aceptado, pues si no lo solicitas es seguro que
no ser aceptado; sin embargo, la relacin temporal entre solicitar y ser admitido es dbil porque puede pasar semanas o
meses sin conocer la respuesta a la solicitud despues de haberla presentado.
despus, el reforzador puede ocurrir despus de alguna otra respuesta por ej. R5. Para
asociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestas
que realiza durante el intervalo de demora.
Hay dos formas de resolver este problema.
La primera tcnica, es proporcionar un reforzador secundario o condicionado
inmediatamente despus de la respuesta instrumental. Un reforzador condicionado o
secundario es un estmulo condicionado que previamente ha sido asociado con el reforzador.
Otra tcnica es marcar la respuesta instrumental criterio de alguna manera para
hacerla distinguible de otras actividades del organismo.La efectividad del procedimiento de
marcado se demostr por primera vez por Lieberman, Mcintosh y Thomas (1979)
La contingencia respuesta-reforzador. Los estudios de demora del reforzamiento
muestran que no es suficiente una relacin causal perfecta entre la respuesta y el
reforzador para producir una respuesta instrumental vigorosa. Incluso con una relacin
causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante
demasiado tiempo. Se concluy que la contigidad respuesta-reforzador ms que la
contingencia era el factor critico que produca el aprendizaje instrumental. No obstante,
esta visin ha resultado injustificada por la investigacin posterior. La contingencia
respuesta-reforzador es tambin importante.
El experimento de supersticin Skinner. Fue un hito en el debate acerca del papel de la
contigidad frente a la contingencia en el aprendizaje instrumental. Skinner situ palomas
en cmaras experimentales independientes y mont el equipo para entregar una cantidad de
de comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo.
Las palomas parecan estar respondiendo como si la conducta controlara la entrega del
reforzador. Skinner denomin a esto conducta supersticiosa.
La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio.
Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador,
un segundo emparejamiento accidental aumenta an ms la probabilidad de la respuesta, de
esta forma cada emparejamientno ayuda a estampar una respuesta particular.
puesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaron
observaciones ms extensas, definieron y midieron la ocurrencia de muchas respuestas,
algunas respuesta ocurran de modo predominante hacia el final del intervalo entre
reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del
reforzador y disminuan a medida que se acercaba el tiempo de la siguiente comida;
respuestas de interin.
82
Las acciones que eran respuestas terminales y las que eran respuestas de interin no
variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento
accidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que las
presentaciones periodicas de un reforzador producen regularidades en la conducta.
Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie que
reflejan la anticipacin de la comida a medida que el tiempo se encuentra ms cerca de la
prxima presentacin de comida. En contraste, entendieron las respuestas de interin como
una manifestacin de otras fuentes de motivacin que eran mas importantes al comienzo del
intervalo entre comidas, cuando la presentacin de comida era improbable. Los
investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las
respuestas terminales y de interin se consideran diferentes manifestaciones del mismo
sistema motivacional.
83
utilizando este diseo, incluye dos fases: exposicin, un grupo de ratas (E escape) es
expuesto a descargas periodicas que puede fianlizar mediante la realizacin de un respuesta
de escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo E
y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer
grupo (C confinado), no recibe descargas durante la fase de exposicin pero esta confinado
en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los
tres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que los
efectos de la estimulacin aversiva durante la fase de exposicin dependen de si la
descarga es o no es escapable. La exposicin a una descarga incontrolable (grupo A) produce
una severa interrupcin del aprendizaje posterior de escape-evitacion, esto indica que los
animales son sensibles a las diferencias procedimentales entre la descarga escapable y la
descarga inescapable. La principal diferencia procedimental entre los grupos E y A es la
presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo
A.
EL DISEO TRIDICO UTILIZADO EN LOS ESTUDIOS DEL EFECTO DE INDEFENSIN APRENDIDA
GRUPO
FASE DE EXPOSICIN
FASE DE
CONDICIONAMIENTO
Grupo E
Descarga escapable
Escape-evitacin
Grupo A
Escape-evitacin
Grupo C
Confinado al aparato
Escape-evitacin
PRUEBA
84
Trminos clave
Castigo
Procedimiento de condicionamiento
instrumental en el cual hay una contingencia
positiva entre la respuesta instrumental y un
estmulo aversivo. Si el sujeto realiza la respuesta instrumental, recibe el estmulo aversivo; si el
sujeto no realiza la respuesta instrumental, no
recibe el estmulo aversivo.
Contraste negativo
Respuesta menor a un
reforzador desfavorable tras una experiencia
previa con un reforzador ms deseado que en
ausencia de esa experiencia previa.
Contigidad Ocurrencia simultnea ( o casi simultnea) de dos eventos, como una respuesta y un
reforzador. Tambin denominada contigidad
temporal.
86
Entrenamiento de omisin
Procedimiento de
conicionamiento instrumental en el cual la
respuesta instrumental previene la presentacin
de un estmulo refonzante. ( Vase tambin
reforzamiento diferencial de otras conductas)
Moldeamiento
Reforzamiento de aproximaciones
sucesivas a la respuesta instrumental deseada.
Estmulo apetitivo
Estmulo placentero o
satisfactorio que puede utilizarse para reforzar
positivamente una respuesta instrumental.
Reforzador secundario
condicionado.
Reforzamiento
adventicio
reforzamiento accidental.
87
Lo
mismo
que
RDO
Reforzamiento negativo
Procedimiento de
condicionamiento instrumental en el cual hay una
contingencia negativa entre la respuesta
instrumental y un estmulo aversivo. Si la
respuesta intrumental es realizada, el estmulo
aversivo finaliza o se previene; si la respuesta
instrumental no se realiza, se presenta el
estmulo aversivo.
Reforzamiento positivo
Procedimiento de
condicionamiento instrumental en el cual hay una
contingencia
positiva
entre
la
respuesta
intrumental y un estmulo reforzante. Si el sujeto
realiza la respuesta, recibe el estmulo
reforzante; si el sujeto no realiza la respuesta, no
recibe elestmulo reforzante.
88
89
Programas de razn
La caracterstica definitoria de un programa de razn es que el reforzamiento depende
slo del nmero de respuestas que el organismo realiza. Un programa de razn slo requiere
contar el nmero de respuestas que ha ocurrido y entregar el reforzador cad vez que se
alcance el nmero requerido. Si este nmero es uno, cada ocurrencia e la respuesta
instrumental provacar la entrega de reforzador. Este tipo de programa se denomina
tcnicamente reforzamiento continuo (abreviado RFC).
Las situaciones en las que la respuesta se refuerza slo alguna vez, reforzamiento parcial o
intermitente.
Razn fija. Por ejemplo, la entrega de un reforzador despus de cada dcima respuesta de
presin de palanca en un estudio con ratas de laboratorio. En un programa como ste, hay
una razn fija entre el nmero de respuestas que la rata realiza y el nmero de
reforzadores que consigue. Esto convierte al procedimiento en un programa de razn fija.
El procedimiento podra denominarse programa de reforzamiento de razn fija (RF 10).
91
Un
programa
de
reforzamiento
continuo
constituye tambin un programa de razn fija. Es
una razn fija de una respuesta por reforzador,
en la que los organismos suelen responder con una
tasa de respuesta constante pero moderada.
Razn Fija (RF): El nmero de respuestas necesarias para obtener un reforzador es siempre el mismo.
Ejemplo: RF5 = Cada 5 respuestas, me dan un premio.
El programa de RF1 es un programa de reforzamiento continuo.
Produce pausas post-reforzamiento.
Razn variable (RV): El nmero de respuestas necesarias para obtener un reforzador va variando.
Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.
Programas de intervalo
Las respuestas son reforzadas slo si ocurren cuando ha transcurrido una cierta cantidad
de tiempo.
Intervalo fijo: el tiempo no varia de una ocasin a la siguiente. Se dan en situaciones donde
se requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que el
tiempo para la disponibilidad del prximo reforzador se acerca, la tasa de respuesta
aumenta, este aumento de la tasa de respuesta se manifiesta como una aceleracin del
registro acumulativo al final del IF, este se denomina por consenso festn de intervalo
fijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejan
una habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un punto
de luz que crecia a medida que el tiempo pasaba. L introduccin de este estimulo reloj
incremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cerca
del final del ciclo IF.
93
Programa de INTERVALO:
El reforzador se otorga en funcin del tiempo que ha transcurrido desde el ltimo reforzador (Pero todava hay que
responder al menos 1 vez para obtener el reforzador
Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo.
Ejemplo: IF5 = Cada 5 segundos, el reforzador est disponible (cada cinco segundos, si respondo me dan un premio.
Produce pausas post-reforzamiento y aceleracin pre-reforzamiento (Patrn festoneado)
Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando.
Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador est disponible.
94
95
96
RA
R A + RB
rA
rA + rB
La ley de la igualacin
Herrnstein (1961) estudio la distribucin de
las
respuestas
en
varios
programas
Ley de la igualacin (Herrnstein)
concurrentes IV-IV en los cuales la tasa total
La tasa de respuesta = tasa de reforzamiento
mxima de reforzamiento que las palomas
RA
rA
podan obtener estaba fijada en 40 por hora.
=
R A + R B r A + rB
Dependiendo del valor exacto de cada
programa de IV, se podan obtener diferentes
O sea, que la paloma responde ms en el programa
proporciones de los 40 reforzadores y no
que ms reforzadores le proporciona.
haba restricciones acerca de cual tecla
Si te dejan escoger entre pasar una tarde en el cine o
paseando con un amigo, escogers probablemente la
podan picotear. Los sujetos distribuyeron sus
actividad ms reforzante.
respuestas de una manera altamente
predecible, la tasa relativa de respuesta en
una alternativa dada, estaba siempre muy cercana a igualar la tasa relativa de
reforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa se
iguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualacin.
RA/(RA+RB)=rA/(rA+rB) o RA/RB=rA/rB; las tasas relativas de respuesta se igualan con las
tasas relativas de reforzamiento.
RA/RB= rA/rB
97
98
RA =
krA
rA + rO
Esta ecuacin predice que la tasa de respuesta (RA) estar directamente relacionada con la
tasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otra
implicacin, de particular inters clnico, es que la tasa de respuesta disminuir a medida
que aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuacin
proporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de su
tasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes de
reforzamiento.
La presuposicin de que (RA+RO) es constante para unas situacin instrumental esta puesto
en cuestin con estudios recientes que varian el reforzador pero no la respuesta
instrumental.
99
100
Estudios de autocontrol
El autocontrol es a menudo cuestin de elegir una recompensa
grande demorada sobre una recompensa pequea inmediata.
103
Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo
necesario para obtener recompensas grandes tiene que olvidarse de obtener esos
reforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente a
una recompensa pequea inmediata, es a menudo una estrategia sensible. De hecho, algunos
han sugerido que el autocontrol es un componente crtico de la socializacin y del ajuste
emocional.
Entrenar a las personas con recompensas demoradas parace tener efectos generalizados en
incrementar su tolerancia a la recompensa demorada. En un estudio de eleccin, realizados
con nios de una escuela elemental, a los que se les pregunt si queran conseguir 2 cntimos
inmediatamente o 3 al final del da, se les realizadon tres sesiones de entrenamiento con
una recompensa imediata o demorada.
Durante cada sesin de entrenamiento, se presentaron varios roblemas: uno inclua contar
objetos en una carta, otro era una rarea pictrica, y el tercero era una tarea de
emparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta era
reforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas tenian
como resultado 3 cntimos que se situaban en un cuanco y seran entregados al final de da.
Se midi la preferencia por la recompensa pequea inmediata frente a la ms grande
demorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el
entrenamiento con la recompensa demorada increment la preferencia por la recompensa
ms grande demorada durante el postest. Por tanto, el entrenamiento con reforzamiento
demorado produca autocontrol generalizado.
Comentarios finales
104
TRMINOS CLAVE
Programa
concurrente
Procedimiento de
reforzamiento complejo en el cual el participante
puede elegir cualquiera de dos o ms programas de
reforzamiento simples que estn disponibles
simultneamente. Los programas concurrentes
permiten la medida de la eleccin entre
alternativas de programas simples.
Ley de la igualacin
Regla de la conducta
instrumental, propuesta por R.J.Herrnstein, que
establece que la tasa relativa de respuesta en una
alternativa de respuesta particular es igual a la
tasa relativa de reforzamiento para esa alternativa
de respuesta.
Mejoramiento
Mecanismo para alcanzar la
igualacin respondiendo para mejorar las tasas
locales de reforzamiento en las alternativas de
respuesta.
105
intermitente.
Reforzamiento
diferencial
de
tasas
bajas
Programa de reforzamiento en el cual una respuesta
es reforzada slo si ocurre despues de que haya
transcurrido una cantidad especificada de tiempo
despues de la respuesta precedente. Abreviado RDB.
106
La
-
Regulacin conductual
- Antecedentes de la regulacin conductual
- Regulacin conductual y el punto de deleite conductual
- Conceptos econmicos y distribucin de respuesta
- Problemas con las aproximaciones de regulacin conductual
- Contribuciones de la regulacin conductual
Comentarios finales
107
Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la
respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en
explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con
el trabajo de Skinner y se centra en como la conducta esta regulada en vista de las
limitaciones o restricciones creadas por los procedimientos de condicionamiento
instrumental. Las teoras de la regulacin conductual describen los efectos del
reforzamiento dentro del amplio contexto del repertorio conductual de un organismo
utilizando conceptos de varias reas de investigacin, incluyendo la economa conductual y
la ecologa conductual. La aproximacin asociacionista se centra en los mecanismos
moleculares y no se preocupa de la meta a largo plazo o la funcin de la conducta
instrumental. Por el contrario, la aproximacin de la regulacin conductual se centra n los
aspectos molares de la conducta y considera los efectos del condicionamiento instrumental
como manifestaciones de procesos de maximizacin u optimizacin.
La motivacin de la respuesta instrumental ha sido considerada desde dos perspectivas
radicalmente distintas. La primera se origino con Thorndike e incluye el anlisis de la
estructura asociativa del condicionamiento instrumental , radica en el concepto de
asociaciones y es compatible con la tradicin terica del condicionamiento pavloviano. Toma
una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la
aproximacin asociativa examina el aprendizaje instrumental en preparaciones conductuales
aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos,
la aproximacin asociativa proporciona un marco conveniente para estudiar los mecanismos
neurales del condicionamiento instrumental.
La aproximacin alternativa a los procesos motivacionales en el aprendizaje instrumental es
la regulacin conductual. Se desarrolla dentro de la tradicin skinneriana e incluye la
consideracin del condicionamiento instrumental en el contexto ms amplio de las mltiples
cosas que el organismo esta haciendo. Esta interesada en como un procedimiento de
condicionamiento instrumental establece los limites al flujo de actividades de un organismo
y las consecuencias conductuales de estas restricciones: considera la motivacin de la
conducta instrumental desde un punto de vista ms molar, las metas y como los organismos
sacan provecho de la complejidad de su ambiente y de sus mltiples opciones conductuales
para alcanzar sus metas.
Dos perspectivas de motivacin de la respuesta instrumental:
Regulacin conductual: influencia Skinneriana. Contexto ms amplio que la conducta aislada. Se centra en cmo un
procedimiento instrumental establece lmites a las actividades naturales de un organismo y las consecuencias de
dichas restricciones (perspectiva molar)
109
Clark Hull
Una de las explicaciones ms tempranas e influyentes del papel del condicionamiento clsico
en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y ms tarde
elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.
La respuesta instrumental llega a ser instigada o motivada por dos factores. En primer
lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacin
con E-R. En segundo lugar, la actividad instrumental tambin llega a realizarse en respuesta
Descargado del campus, http://campus.felizmente.info
110
111
112
Regulacin Conductual
113
completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con
su teora y sugiri que las respuestas reforzadoras son especiales slo debido a que es ms
probable que ocurran que las respuestas instrumentales a las que siguen.
El principio de Premack: Apunt que
Principio de Premack
las respuestas incluidas en los
Las respuestas incluidas en los reforzadores comnmente
reforzadores comnmente utilizados
utilizados son actividades que es altamente probable que
realicen los animales.
eran actividades que es altamente
probable que realicen los animales. Las
Principio de Premack o "Principio de la probabilidad diferencial"
respuestas instrumentales son activi"Dadas dos respuestas de diferente probabilidad, A y B, la
dades que normalmente ocurren a una
oportunidad para realizar la respuesta de alta probabilidad A
despus
de la respuesta de baja probabilidad B tendr como
baja probabilidad. Propuso que esta
resultado el reforzamiento de la respuesta B. (BA refuerza B). La
diferencia en las probabilidades de
oportunidad para realizar la respuesta B de baja probabilidad
despus de la respuesta A de alta probabilidad no dar como
respuesta es critica para el reforzaresultado el reforzamiento de la respuesta (A no refuerza A)"
miento.
Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora.
En consecuencia tambin es denominado el principio de la probabilidad diferencial.
114
Principio de Premack
Tambin sirve para el castigo...
115
116
117
118
4 Aceptan la idea de que los organismos responden para maximizar sus beneficios.
5 Han proporcionado caminos nuevos y precisos para describir las restricciones que
imponen varios procedimientos de condicionamiento instrumental en el repertorio de
conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no
puede ser estudiada en un vaco o en un tubo de ensayo conductual. Todas las opciones de
respuesta del organismo que se dan en un momento dado deben ser consideradas como un
sistema.
Comentarios finales
Los procesos motivacionales en la conducta instrumental se ha enfocado desde dos
perspectivas radicalmente diferentes y dos tradicionales intelectuales: la perspectiva
asociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamiento
pavloviano, y la perspectiva de la regulacin conductual tiene su origen en el anlisis
conductual skinneriano. Estas dos aproximaciones difieren ms que se asemejan, haciendo
difcil imaginar cmo podran integrarse. Por ejemplo, el concepto fundamental en la
Descargado del campus, http://campus.felizmente.info
119
120
TERMINOS CLAVE
Principio de Premack
Experimento
de
transferencia
de
control
Experimento que evala los efectos de un
estmulo condicionado clsicamente (EC) en la
ejecucin de la conducta instrumental. El EC y la
respuesta instrumental se condicionan en primer
lugar en fases independientes del experimento.
Los efectos del EC sobre la respuesta
instrumental se determinan entonces en la fase
de transferencia.
Hiptesis de la privacin de respuesta Explicacin
del reforzamiento que defiende que la restriccin
el acceso a una respuesta por debajo de su tasa
de lnea base de ocurrencia (privacin de
respuesta) es suficiente para hacer que la
oportunidad de ejecutar esa respuesta acte
como un reforzador positivo efectivo.
probabilidad diferencial.
121
123
Cmo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos
estmulos?.
Reynolds (1961)
Entrenamiento:
Prueba:
Resultados: una paloma picoteaba ms el circulo
rojo y para la otra fue el tringulo blanco.
Conclusiones:
Si un cambio en el estmulo conlleva un cambio
Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pjaro
estaba controlada por un estmulo diferente. En ausencia de procedimientos especiales, los
investigadores no siempre pueden predecir cual de varios estmulos de aquellos que un
organismo experimenta adquirir control sobre su conducta instrumental
Generalizacin de estmulos
Identificar y diferenciar varios estmulos no es algo tan simple. Los estmulos pueden
definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se
consideran ejemplos del mismo estmulo debido a que comparten la misma funcin. En otros
casos, los estmulos se identifican y distinguen partiendo de rasgos fsicos precisos, como
la longitud de onda.
Los anlisis experimentales del problema han dependido en su mayora del fenmeno de la
generalizacin de estmulos, que es lo opuesto a la respuesta diferencial, o discriminacin
de estmulos. Se dice que un organismo muestra generalizacin de estmulos si responde
manera similar a dos o mas estmulos. Este fenmeno fue observado en primer lugar por
Pavlov.
En un experimento clsico Guttman y Kalish palomas programa IV picotear con luz
amarillenta con longitud de onda 580 anmetros, despus se observa que palomas tambin
responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en funcin de
la semejanza entre cada estmulo de prueba y el estmulo original de entrenamiento. Este
resultado es un ejemplo de lo que se denomina gradiente de generalizacin de estmulo.
Los gradientes de generalizacin del estmulo como medidas del control por el
estmulo
Se utilizan a menudo para medir el control por el estmulo porque facilitan informacin
acerca del grado de sensibilidad de la conducta de un organismo ante la variacin de un
aspecto particular del ambiente.
Guttman y Kalish (1956) y el experimento hipottico con las palomas ciegas a los colores
indica que lo acusado del gradiente de generalizacin de un estmulo proporciona una
medida precisa del grado de control del estmulo. Se obtiene un gradiente de
generalizacin plano si el organismo responde de forma similar a todos los estmulos de la
prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estmulo que se
varia en la prueba de generalizacin no controla la conducta instrumental. Por el contrario,
se obtiene un gradiente de generalizacin acusado si el organismo responde en mayor
medida a algunos de los estmulos de prueba que a otros. Esta respuesta diferencial
Descargado del campus, http://campus.felizmente.info
125
evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del
estmulo que varia entre los estmulos de prueba.
Si se da una gran cantidad de generalizacin, se dar poca respuesta diferencial. Si la
respuesta es altamente diferencial ante los estmulos, se obtendr una mnima
generalizacin.
Tipo de reforzamiento
Es ms probable que ciertos tipos de
estmulos adquieran control sobre la
conducta instrumental con reforzamiento
positivo que con reforzamiento negativo.
Ciertos hallazgos indican que el control por
el estmulo de la conducta instrumental
esta determinado en parte por el tipo de
reforzamiento utilizado. Es ms probable
que los estmulos visuales adquieran control
sobre la conducta en situaciones apetitivas
que las claves auditivas, mientras que es
mas probable que estas adquieran control
en situaciones aversivas.
FACTORES
ESTMULO
DE
APRENDIZAJE
EN
EL
CONTROL
POR
EL
Los factores del estmulo y la respuesta son los puntos de arranque del control por el
estmulo. El que ciertos estmulos lleguen a controlar la conducta a menudo depende de lo
que el organismo ha aprendido acerca de esos estmulos.
La sugerencia de que la experiencia con los estmulos puede determinar hasta que punto
estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el
fenmeno de la generalizacin de estmulos. Pavlov sugiri que la generalizacin del estmulo
se da porque el aprendizaje sobre el EC llega a transferirse a otros estmulos en funcin de
la semejanza fsica de esos estmulos de prueba con el EC original.
Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea
de que la generalizacin del estmulo reflejase la transferencia del aprendizaje y
argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la
generalizacin del estmulo ocurre si los organismos no han aprendido a distinguir las
diferencias entre los estmulos. Defendan que los animales tenan que aprender a tratar
los estmulos como diferentes uno de otro. Consideraban la forma del gradiente de
Descargado del campus, http://campus.felizmente.info
129
generalizacin del estmulo como determinada principalmente por las experiencias previas
de aprendizaje del organismo mas que por las propiedades fsicas de los estmulos.
procedimientos de discriminacin de
estmulos establecen un control por
los estmulos que sealan cuando
esta
o
no
disponible
el
reforzamiento. Cuando E+ y E- han
133
denomina efecto del desplazamiento del mximo, este puede ocurrir en cualquier
discriminacin intradimensional.
Explicacin de Spence del desplazamiento del mximo. El efecto de desplazamiento de
mximo es importante porque muestra que el nico estmulo en cuya presencia se refuerza
la respuesta (E+) no es necesariamente es estmulo que evoca la tasa de respuesta ms alta.
Spence sugiri que los gradientes
excitatorio e inhibitorio pueden producir el
fenmeno de desplazamiento del mximo,
asumi
que
el
entrenamiento
en
discriminacin intradimensional produce
gradientes de generalizacin excitatorios e
inhibitorios centrados en el E+ y el E-, sin
embargo, debido a que el E+ y el E- son
semejantes en las tareas de discriminacin
intradimensional, los gradientes de generalizacin de la inhibicin y excitacin se
superpondrn. Es mas, el grado de superposicin depender del grado de semejanza entre
el E+ y el E-. La inhibicin generalizada del E- suprimir la respuesta al E+, dando como
resultado un efecto de desplazamiento del mximo.
Explicaciones alternativas del desplazamiento del mximo: Una cuestin importante es si
vemos los estmulos en funcin de sus propiedades individuales y absolutas, o en funcin de
su relacin con otros estmulos que experimentamos, existe evidencia consistente con cada
una de estas aproximaciones, que sugiere que ambos tipos de mecanismos estn implicados
en la forma de responder de los organismos.
El modelo de Spence es un modelo de aprendizaje absoluto del estmulo. Predice la
conducta basada en las propiedades excitatorias netas de los estmulos individuales. Una
aproximacin alternativa asume que los organismos aprenden a responder a un estmulo
basndose en la relacin de ese estmulo con otras claves de la situacin. Una prediccin
interesante de esta aproximacin es que la forma de un gradientes de generalizacin
cambiara en funcin del rango de los estmulos de prueba que se presenten durante la
sesin de generalizacin. Estas y oras predicciones de la teora relacional han sido
confirmadas.
contiene agua, una vez que aprenden la discriminacin agua/no agua, su conducta se
generalizo a nuevas fotografa.
Los investigadores tambin han explorado la posibilidad de que la equivalencia funcional
entre dos estmulos diferentes podra establecerse enlazando cada una de las distintas
claves con un tercer estmulo comn Ej. Honey y Hall (1989) un grupo ruido y click con
comida, grupo control ruido y click, solo el click con comida despus ambos recibe ruido con
descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo
condicionado se generalizara al clik, se dio significativamente mas generalizacin en los
animales entrenados en equivalencia que en el grupo de control.
El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia
funcional entre esos estmulos, con la consecuencia de que una respuesta condicionada a uno
de ellos se generalizara a los oros. Una definicin mas formal de clase de equivalencia ha
sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si
sus miembros poseen propiedades matemticas 1 reflexividad o igualdad, 2 simetra y 3
transitividad. La reflexividad o igualdad se refiere a la relacin A=A: la simetra existe si
una relacin es bidireccional, la transitividad se refiere a la integracin de dos relaciones
en una tercera.
136
COMENTARIOS FINALES
TRMINOS CLAVE
Facilitacin
Procedimiento en el que una clave
designa cundo otra clave ser reforzada.
Tambin llamado establecimiento de la ocasin.
Gradiente
de
generalizacin
del
estmulo
Gradiente de respuesta que se observa si los
participantes se prueban con estmulos que
difieren cada vez ms del estmulo que estaba
presente durante el entrenamiento. (Vase
tambin gradiente de generalizacin del estmulo
Gradiente
de
generalizacin
del
estmulo
excitatorio
Gradiente de respuesta que se
observa cuando se prueba a los organismos con el
E+ de un procedimiento de discriminacin y con
estmulos que difieren cada vez ms del E+. El
nivel ms alto de respuesta sucede con los
estmulos similares al E+; se da progresivamente
menos respuestas a los estmulos que difieren
cada vez ms del E+. Por tanto, el gradiente tiene
forma de U invertida.
Gradiente
de
generalizacin
del
estmulo
inhibitorio
Gradiente de respuesta que se
observa cuando se prueba a loa organismos con el
E- de un procedimiento de discriminacin y con
estmulos que difieren cada vez ms del E-. El
nivel ms bajo de respuesta sucede con los
estmulos similares al E-; se da progresivamente
ms respuestas a los estmulos que difieren cada
vez ms del E-. Por tanto, el gradiente tiene
forma de U.
Lo mismo que
139
140
Recuperacin espontnea
Renovacin del condicionaiento excitatorio original
Restauracin de la ejecucin de la extincin.
Restablecimiento de la excitacin condicionada.
Sensibilidad a a devaluacin del reforzador.
Qu se pretende en la extincin?
-
143
Descargado del campus, http://campus.felizmente.info
La extincin puede llevarse a cabo slo despus de que haya sido establecida una
respuesta o una asociacin utilizando condicionamiento pavloviano o instrumental. El
objetivo es revertir los efectos de la adquisicin, pero raramente se alcanza y en la mayora
resultan imposible. Fenmenos como la recuperacin espontnea, la renovacin y el
restablecimiento muestran que la extincin no elimina lo que se aprendi de forma original.
Los estudios sobre devaluacin del reforzador sugieren que la extincin no tiene
virtualmente ningn impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo
aprendizaje de una asociacin E-R inhibitoria que se superpone a lo que se aprendi con
anterioridad.
La inhibicin surge de los efectos de la frustacin y esta falta inesperada de
recompensa es responsable de una serie de efectos paradjicos de la recompensa,
incluyendo el efecto del reforzamiento parcial en la extincin.
El reforzamiento parcial o intermitente permite a los organismos aprender sobre la
falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la
extincin, como demuestra los estudios acerca del momento conductual.
La extincin implica la omisin del EI o reforzador. Por tanto, la extincin en
condicionamiento clsico incluye presentaciones repetidas del estimulo condicionado por
solo; la extincin en el condicionamiento instrumental implica no volver a presentar
reforzador como una consecuencia de la respuesta instrumental. El resultado es que
respuesta condicionada disminuye. La extincin no es lo contrario de la adquisicin.
el
s
el
la
La extincin se produce por la omisin del EI que sigue a las presentaciones del EC o
la omisin del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,
es una disminucin de la respuesta condicionada que se da por la ausencia prolongada de
experiencia con el estimulo condicionado o con la respuesta instrumental.
La extincin no siempre funciona en la terapia de conducta, los avances sugieren que
los fallos en la extincin reflejan las limitaciones normales de la misma. La extincin no
revierte los efectos de la adquisicin, en lugar de ello, implica el aprendizaje de algo nuevo
que se superpone sobre lo que se aprendi antes (sin la perdida de lo que se aprendi
anteriormente).
145
Descargado del campus, http://campus.felizmente.info
Recuperacin espontanea
La recuperacin espontanea tras el condicionamiento pavloviano: La extincin se disipa
con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse
si el sujeto se pone a prueba tras una demora que siga al procedimiento de extincin.
147
Descargado del campus, http://campus.felizmente.info
148
Descargado del campus, http://campus.felizmente.info
Si como hemos visto la extincin no implica desaprendizaje y deja intacta las asociaciones
R-C y E-C, por qu disminuye las respuestas en los procedimientos de extincin?
Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de
centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han
llegado a la conclusin de que la falta de reforzamiento produce una asociacin E-R
inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estmulo
especfico, produce una asociacin E-R inhibitoria que sirve para suprimir esa respuesta
siempre y cuando el E est presente. Esta hiptesis, predice que los efectos de la extincin
sern altamente especficos del contexto en el que la respuesta fue extinguida.
La omisin de una recompensa esperada genera desilusin o frustracin. Estos efectos
emocionales se presume que desempean un papel crtico en la disminucin conductual que se
da en la extincin. La ausencia de recompensa esperada desencadena una reaccin frustante
aversiva incondicionada que sirve para que se deje de responder durante el curso de la
extincin mediante el establecimiento de una asociacin inhibitoria.
La afirmacin de que la extincin implica el aprendizaje de una asociacin inhibitoria resulta
controvertida frente a las teoras convencionales que consideraban la inhibicin
condicionada y la extincin como fenmenos diferentes.
149
Descargado del campus, http://campus.felizmente.info
150
Descargado del campus, http://campus.felizmente.info
152
Descargado del campus, http://campus.felizmente.info
Comentarios finales
Los estudios sobre extincin ilustran la naturaleza duradera de ciertos temas en la teora
de la conducta. Los primeros estudios sobre la extincin se centraron en los efectos del
reforzamiento parcial enla extincin y otros efectos paradjicos de la recompensa, y se
llevaron a cabo dentro de la tradicin hulliana que daba preeminencia al aprendizaje E-R.
Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el
condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que
estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de
la revolucin cognitiva que se introdujo en la psicologa en el ltimo cuarto de siglo XX.
sta proporcion una mejor compresin de la recuperacin espontnea y llev al
descubrimiento de nuevos fenmenos como la renovacin y el restablecimiento. Sin
embargo, estos fenmenos representas los fallos de la extincin ms que la exticnin en s
misma. Como se ha descrito, la compresin de la extincin en s misma ha requerido la
vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los
investigadores sigun interesados en qu es lo que hace que conducta sea resistente al
cambio. Esta resistencia o momento conductual plantea especiales desafos para la terapia
de conducta.
153
Descargado del campus, http://campus.felizmente.info
Terminos Clave
Restablecimiento
Recuperacin de la respuesta
excitatoria a un estmulo extinguido producida
por la exposiciones al estmulo incondicionado.
Renovacin
Recuperacin de la respuesta
excitatoria a un estmulo extinguido producida
por la retirada de las claves contextuales que
estaban presentes durante la extincin.
Teora de la frustracin Teora del efecto del
reforzamiento parcial en la extincin, de acuerdo
con la cual la extincin se retarda tras le
reforzamiento parcial porque la resuesta instrumental se condiciona a la anticipacin de la ausencia frustante de recompensa.
Extincin
(en el condicionamiento intrumental)
Reduccin de la respuesta instrumental que
ocurre porque la respuesta no vuelve a ir seguida
de un reforzador. Tambin, el procedimiento de
no volver a reforzar la respuesta instrumental.
Frustracin
Respuesta emocional aversiva que es
resultado de la ausencia inesperada de reforzamiento.
Teora secuencial Teora del efecto de reforzamiento parcial en la extincin, de acuerdo con la
que la extincin se retarda tras el reforzamiento
parcial porque la respuesta intrumental se condiciona a la memoria de ausencia de rescompensa.
Hiptesis de la discriminacin
Explicacin del
efecto de reforzamiento parcial en la extincin,
de acuerdo con la que la extincin es ms lenta
tras el reforzamiento parcial que tras el reforzamiento continuo, porque el principio de la extincin es ms difcil de detectar cuando sigue el
reforzamiento parcial.
154
Descargado del campus, http://campus.felizmente.info