Condicionamiento Operante

UNIVERSIDAD PRIVADA DE TACNA
FACULTAD DE EDUCACIÓN, CIENCIAS DE LA COMUNICACIÓN Y

HUMANIDADES
ESCUELA PROFESIONAL DE PSICOLOGÍA
“CONDICIONAMIENTO OPERANTE Y CONTRIBUCIONES DE

E.THORNDIKE”
Curso:
Sistemas Psicológicos Contemporáneos – Sec. A
Docente:
Mag. Cristina Beatriz Flores Rosado
Integrantes:
Huarachi Perca, Jhon Alexander
Lira Palza, Carlos Humberto
Gutierrez Neyra, Maricielo Reyna
Quispe Mena, Lelyz Yanifer
Mamani Tarqui, Ronaldo Ronald
TACNA – PERÚ
2020
2
Índice
Resumen.......................................................................................................................6
Introducción.................................................................................................................7
1. Concepto de Condicionamiento Instrumental......................................................8
2. Leyes básicas de aprendizaje en el condicionamiento instrumental....................9
2.1. Leyes básicas de aprendizaje en el condicionamiento instrumental................9
2.1.1. Ley se asociación..........................................................................................9
2.1.2. Ley del Ejercicio..........................................................................................10
2.1.3. Ley del Efecto..............................................................................................10
2.1.4. Ley de la Disposición...................................................................................10
2.2. Modalidades del condicionamiento instrumental..........................................12
2.2.1. Condicionamiento por recompensa............................................................12
2.2.2. Condicionamiento por evitación.................................................................12
2.2.3. Condicionamiento por omisión...................................................................12
2.2.4. Condicionamiento por castigo....................................................................13
3. Condicionamiento Operante..............................................................................13
3.1. Modelado de la conducta...............................................................................15
3.1.1. Programas de razón fija..............................................................................16
3.1.2. Programas de intervalo fijo.........................................................................16
3.1.3. Programas de razón variable......................................................................16
3.1.4. Programas de intervalos variables..............................................................17
3.2. El refuerzo......................................................................................................17
3.3. Condicionamiento aversivo............................................................................19
3.3.1. Condicionamiento de respuestas emocionales...........................................20
3.3.2. Condicionamiento de escape......................................................................20

3
3.3.3. Condicionamiento de evitación activa........................................................20
3.3.4. Condicionamiento de evitación pasiva.......................................................20
4. Procedimiento del condicionamiento.................................................................21
4.1. Reforzamiento positivo...................................................................................22
4.2. Reforzamiento negativo.................................................................................23
4.3. Castigo positivo...............................................................................................24
4.4. Castigo negativo.............................................................................................24
5. Fases del Condicionamiento...............................................................................25
5.1. Adquisición.....................................................................................................25
5.2. Generalización................................................................................................25
5.3. Discriminación................................................................................................26
5.4. Extinción.........................................................................................................26
5.5. Recuperación espontánea.............................................................................27
6. Programas de reforzamiento..............................................................................27
6.1. En el reforzamiento continuo.........................................................................27
6.1.1. Razón fija...................................................................................................28
6.1.2. Razón variable............................................................................................29
6.2. El reforzamiento intermitente........................................................................29
6.2.1. Intervalo fijo...............................................................................................29
6.2.2. Intervalo variable........................................................................................30
7. Extinción de la conducta.....................................................................................30
El efecto de la magnitud del refuerzo sobre la extinción.......................................31
El efecto de la demora del refuerzo.......................................................................32
En cuanto a la consistencia....................................................................................32
8. Discriminación y generalización del estímulo.....................................................32
9. Bibliografía de E. Thorndike................................................................................34
10. Aportes...........................................................................................................34
10.1. Aprendizaje por Ensayo y Error: Las cajas del problema de Thorndike.......35
4
10.2. Ley del efecto..............................................................................................36
10.2.1. Desarrollo de la ley del efecto de Edward Thorndike.................................37
10.2.2. Consideraciones sobre la ley del efecto de Edward Thorndike...................38
Conclusiones...............................................................................................................39
Referencias.................................................................................................................40
Anexos........................................................................................................................41
5
Tabla 1: Esquema representativo de la relación estimulo-respuesta-refuerzo en el

condicionamiento clásico e instrumental....................................................................................11
Tabla 2: Trasportar la estructura de la conducta...........................................................15
6
Resumen
Este es un estudio personal de investigación sobre el condicionamiento

operante, principalmente llamado condicionamiento instrumental y la explicación de
las diferentes definiciones, leyes, procedimientos, fases, programas. Además de
resaltar la importante labor e involucramiento para la investigación los estudios del
psicólogo E. Thorndike, y como esta investigación sigue trascendiendo con el
trascurso de los años.
Explica groso modo, los cambios que se han producido y como este
condicionamiento se ve influido, además de ser punto de partida en otros futuros
estudios del comportamiento y búsqueda de la explicación del aprendizaje.
Explica además la importancia de los elementos para lograr un

condicionamiento, los factores importantes de la conducta como el reforzamiento,
discriminación generalizada del estímulo.
Y por último, pero no menos importante damos a conocer de manera explícita

y concisa quien fue Thorndike, donde estudio y como es que inició sus estudios en el
mundo de la investigación y explicación del comportamiento y aprendizaje, sus
estudios y sus aportes valiosos para el logro del condicionamiento operante o
instrumental.
7
Introducción
El condicionamiento Instrumental llamada así principalmente es un tipo de

aprendizaje que se entiende como ensayo y error, es decir es la capacidad que posee un
individuo de decidir si repetir o conservar una conducta dependiendo de sus
consecuencias. Este nos habla de que es más probable que la conducta se repita si el
resultado es positivo. El termino fue introducido por Edward Thorndike, este es
precedido por el termino de condicionamiento operante introducido por Frederic
skinner, que habla sobre el mismo principio de condicionamiento operante, pero se
prefiere el instrumental al ser más específico.
Principalmente otros autores iniciaron sus investigaciones del

condicionamiento operante, por ende los primeros trabajos los realizo el psicólogo
Edward Thorndike, para su estudio elaboro experimentos, llamados las “cajas de
solución de problemas” que se trataba de hacer que los gatos pudieran salir de jaulas
con mecanismos simples, los incentivos eran colocar comida fuera de la jaula, y
esperar que el gato resolviera el problema, este tardaba cada vez menos en resolverlo
ya que la conducta era reforzada por su repetición.
Posteriormente a sus experimentos Thorndike estableció la llamada ley del

efecto (Toda conducta que produzca un resultado positivo será más probable en el
futuro). Aunque se trata de tipos de aprendizaje distintos, los estudios de Pavlov o
Paulov, sobre el condicionamiento clásico tuvieron influencia sobre el operante al
compartir varios de sus principios como, el proceso de extinción, generalización,
adquisición etc.
Es por todo lo mencionado anteriormente que, en el presente trabajo daremos a

conocer como fue la transición de condicionamiento instrumental a condicionamiento
operante y en que consiste este tipo de condicionamiento.
1. Concepto de
8
Condicionamiento Antes de continuar con las

Instrumental conclusiones que Thorndike extrajo de
Antes de que tuvieran lugar las esta experiencia, queremos destacar la
investigaciones de Paulov, E. L. diferencia tan enorme existente entre
Thorndike (1874-1949) realiza en el aprendizaje de este gato y el que
Estados Unidos una serie de trabajos realizó el perro de Paulov. Mientras
que van a dar origen al que el condicionamiento clásico no
condicionamiento instrumental. La representaba ninguna conducta nueva,
base experimental fue la conducta de en esta ocasión el gato aprende algo
un gato hambriento encerrado en una que para él es absolutamente
jaula frente a la cual se coloca novedoso: salir de una jaula cerrada.
alimento (publicado en 1898). Para Además, se trata de un aprendizaje
poderlo alcanzar, el animal ha de salir muscular, de movimientos de todo el
de la jaula, y el único procedimiento organismo en la búsqueda de un
para ello es mover un mecanismo propósito, algo totalmente extraño al
instalado por el experimentador. Para condicionamiento clásico. Es evidente,
lograr salir en la experiencia, el gato pues, que estamos ante una nueva y
se movía de lado al otro de la jaula, más compleja forma de aprendizaje.
dando zarpazos sin un plan. En algún
Thorndike sacó muchas
momento acierta con el resorte de
conclusiones de su experimento, que
apertura de la puerta y puede salir y
se preocupó en describir y que
hacerse con la comida. La experiencia
finalmente las estructuró en tres leyes.
se repite hasta que el animal va
Todas ellas nacen de la conducta del
advirtiendo los movimientos inútiles,
animal en la jaula en las condiciones
que va desechando, y aquellos
descritas, que se pueden explicitar de
eficaces, que va repitiendo. El final es
la siguiente manera:
que logra aprender el mecanismo de
apertura y ponerlo en acción en cuanto  La actividad del animal se
desea salir de la jaula. Hay que produce cuando existe un
advertir que en los sucesivos intentos motivo, en ese caso es el hambre
el aprendizaje no fue progresando de y la necesidad de conseguir
manera lineal, sino que hubo avances comida. El gato hace lo
y retrocesos hasta que se fijó la necesario para lograr aquello
conducta adecuada.
9
que precisa. No actúa cuando no  Finalmente, se establece la

tiene apetito. conexión definitiva entre la
 Existe un problema, un respuesta y el logro de lo que se
obstáculo para satisfacer su busca. El aprendizaje se ha
necesidad: la comida está fuera consumado y el animal sale
de la jaula, lejos del alcance del inmediatamente de la jaula con
animal. Este impedimento será el movimiento exacto cuando lo
el que obligue al gato a buscar desea. Es decir, se han
una salida, a actuar para lograr eliminado todos los
lo que pretende. movimientos erróneos y han
 Se inicia una actividad errática quedado exclusivamente los
del animal pretendiendo salir. eficaces.
En ese tanteo, lleno de errores,
La actividad enunciada en
hay un momento en que acierta
los tres últimos puntos -la
con el mecanismo y abre la
propiamente de aprendizaje se
puerta, saliendo y comiéndose el
conforma con la que ya había sido
alimento. Es decir, termina la
definida como de ensayo y error por
actividad con la resolución
A. Bain y LI. Morgan. [ CITATION
casual del problema.
Pér95 \l 3082 ]
 Cuando se repite la experiencia
2. Leyes básicas de
se aprecia que el animal va
aprendizaje en el
eliminando gradualmente las
condicionamiento
respuestas inútiles y
instrumental
seleccionando y conservando las
Thorndike llega a identificar
que tienen éxito. Esa selección
varias leyes y principios básicos del
tiene sus altibajos, pero avanza
aprendizaje, entre ellas destacan:
sólidamente, y el animal va
saliendo con mayor rapidez y 2.1. Leyes básicas de
menos movimientos ineficaces aprendizaje en el
cada vez. El grado de respuestas condicionamiento
inútiles y la capacidad de instrumental
selección de las apropiadas están 2.1.1. Ley se asociación
de acuerdo con las
características del animal.
10
La asociación es una la conexión se fortalece. Si

condición importante del una respuesta es seguida de
aprendizaje, porque el un acontecimiento
fortalecimiento del insatisfactorio y perturbador
aprendizaje del sujeto la conexión se debilita y
depende de la asociación o desaparece. Esta ley fue un
conexión entre la respuesta primer paso para el concepto
correcta y un acontecimiento de refuerzo positivo y
satisfactorio, y el castigo positivo de Skinner.
debilitamiento del
2.1.4. Ley de la Disposición
aprendizaje se da por la
Todo sujeto tiene la
asociación o conexión entre
disposición y motivación
la respuesta incorrecta y un
para el establecimiento de
acontecimiento
una conexión entre la
insatisfactorio.
respuesta y un
acontecimiento satisfactorio.
2.1.2. Ley del Ejercicio
Thorndike en 1930
Denominada también
incluye una de las
ley de formación de hábitos.
modificaciones en la ley del
Incluye dos sub leyes: Ley
ejercicio, planteo que la practica
del uso, que se refiere al
da lugar al mejoramiento de las
fortalecimiento de las
respuestas únicamente si permite
conexiones mediante la
operar otros factores. La práctica
práctica; y Ley del desuso,
en si misma nada hace y la mera
que se refiere al
repetición no basta. En la ley del
debilitamiento de las
efecto planteo que la
conexiones u olvido cuando
recompensa es más poderosa
la práctica o ensayo se
que el castigo. Los castigos
interrumpe.
afectan el aprendizaje
2.1.3. Ley del Efecto indirectamente. [ CITATION
Postula que si una Cam06 \l 3082 ]
respuesta es seguida de un
Evidentemente, hay
acontecimiento satisfactorio,
variaciones en cada uno de estos
11
condicionamientos, como ya Sin embargo, en el

hemos hecho notar; pero en condicionamiento instrumental
todos existe el refuerzo y el el refuerzo depende de la
propósito en el aprendizaje, conducta del animal, y solo
puesto que en el después de que esta se realiza
condicionamiento clásico ya apropiadamente. Esto significa
insistimos en que el animal veía que el refuerzo es contingente y
en cierta forma el EC como un depende del mismo sujeto, por
aviso de la proximidad del El; es ello su conducta instrumental.
decir, del refuerzo.
Las experiencias de
condicionamiento instrumental
Tabla 1: Esquema representativo de la relación han mostrado que las conductas
estimulo-respuesta-refuerzo en el condicionamiento adquiridas de esta forma son
clásico e instrumental.
más estables que las del
condicionamiento clásico,
Condicionamiento Clásico
produciéndose más difícilmente
EI (Refuerzo) + EC RC
la extinción. Esta mayor
Esquema E R irreversibilidad del
condicionamiento instrumental
Condicionamiento Instrumental
ya la apreció Paulov y así lo
EI RC Refuerzo hizo saber en una de sus charlas
de los miércoles:
Se aprecia en el cuadro En nuestros

que en el conductismo clásico experimentos…las conexiones
un estímulo específico es son bastante transitorias... En
impuesto al organismo, en una los estudios de Thorndike las
relación temporal dada con conexiones son de naturaleza
respecto a otro estimulo más permanente.
asimismo específico e impuesto.
Esta dependencia del
En su mecánica, el refuerzo
logro del refuerzo de la conducta
aparece al margen de lo que se
del animal explica la actitud de
pueda hacer, es decir, dado por
este ante los fracasos. Mientras
otro de una manera “necesaria”.
que en el condicionamiento
12
clásico el animal se muestra 2.2. Modalidades del

tranquilo en todo el proceso de condicionamiento
extinción, en el instrumental
condicionamiento instrumental El condicionamiento
se producen auténticas instrumental abarca básicamente
frustraciones, que se suelen cuatro modalidades. [ CITATION
acompañar de agitación y Cam06 \l 3082 ]
agresividad. Es evidente, por
2.2.1. Condicionamiento por
otra parte, que la dependencia
recompensa
en la obtención del refuerzo de
Es un entrenamiento
la acción del animal hace que su
por ensayo y error, y el logro
conducta sea más propositiva y
accidental de la recompensa
dé esa clara impresión.
La idea de propósito
evitación
lleva a la aceptación de una
Consiste en dar
relación medio-fin en el
respuesta a una señal, para
aprendizaje instrumental, que es
evitar la aparición de un
lo que pretende eliminar la
estímulo aversivo o nocivo.
teoría conductista. Sin embargo,
Estos dos entrenamientos
la experiencia práctica hace que
son los más utilizados,
solo con un prejuicio muy fuerte
porque el organismo actúa a
se puedan cerrar los ojos a la
fin de obtener una
conducta eminentemente
recompensa o evitar
mediadora de todos los
situaciones adversas.
animales, y muy especialmente
del hombre. 2.2.3. Condicionamiento por
omisión
Alrededor de esta
Consiste en que una
conducta propositiva, conviene
respuesta específica provoca
destacar las ideas de E.Tolman,
que no se efectúe el
iniciador de lo que se ha llamado
reforzamiento. En este
la línea cognitiva del
entrenamiento el no
conductismo. [ CITATION Pér95 \l
reforzamiento no solo
3082 ]
impide el desarrollo de una
13
respuesta condicionada, sino en oposición a la puramente

que más bien fortalece la refleja; por ello, nace en
respuesta antagónica. oposición al término
instrumental, en el cual existe un
estímulo que origina la conducta
castigo
de respuesta. Esta razón lleva a
Consiste en que una
Skinner a distinguir entre
respuesta específica provoca
conducta respondiente y
que se efectúe el castigo.
operante. En el primer caso
Este entrenamiento tiene
estaría la originada por el
como propósito abandonar
condicionamiento clásico y el
una conducta.
instrumental de Thorndike, en
3. Condicionamiento los cuales la causa de la
Operante conducta es manifiesta al
El condicionamiento espectador, que puede señalar el
instrumental de Thorndike fue estímulo que la pone en marcha
continuado por un gran número y el fin que se propone con ella.
de investigadores, cada uno de No ocurre así con el operante, al
los cuales indujo algunas que Skinner define como una:
innovaciones o explicaciones, “Parte identificable de
sin embargo, nadie ha dejado la la conducta, de la que hay que
huella de Skinner, sin duda el decir no que carezca de
más popular de los conductistas, estímulo que la elicite... sino
y el que más ha contribuido a su que cuando se la observa es
progreso y extensión. Resultado imposible hallarlo... No
de sus estudios de laboratorio pretendo que la conducta
son una serie de innovaciones en espontánea carezca de fuerzas
la técnica y en la concepción del que la originen, sino tan solo
condicionamiento, que le llevo a que no están situadas en el
denominado condicionamiento ambiente, No podemos
operante. observarlas, y además no lo
El concepto de operante necesitamos."
aparece como un intento de Se puede apreciar
explicar la conducta espontánea claramente, de la cita tomada,
14
que lo fundamental está en espectador y aun al mismo

justificar una conducta realizador. Así, la llamada
espontánea a partir de la conducta voluntaria es para
ausencia de un estímulo claro en nuestro investigador parte de la
el entorno. Así, la impresión que conducta operante.
el observador tiene es que la Naturalmente, la
conducta se origina en el conducta responde a un
organismo y no en el exterior. Si estímulo, y aquellos a los cuales
esto lo trasladamos a nuestra un organismo puede responder
caja de experimentos, significa con un operante, Skinner los
que la rata va a jalar de la denomina discriminativos, en
palanca simplemente porque se oposición a los elicitantes, que
le ocurre comer cuando se es como llama a los que originan
enciende la luz. Un observador la conducta respondiente.
que no haya conocido el Mientras estos preceden
adiestramiento de la rata, regularmente a las respuestas de
pensará que la conducta es manera notoria y las suscitan de
movida exclusivamente desde el manera necesaria, los
interior del animal; sin embargo, discriminativos parecen invitar a
el experimentador sabe la la respuesta desde algún lugar
historia del proceso y el incógnito, pero no la fuerzan.
estímulo que significa la Con esto se quiere decir que al
iluminación de la pantalla. tener los operantes aspectos de
Pretender que en esa espontáneo, dan la impresión de
conducta no existe el propósito que la respuesta es libre, no
sino la simple conducta forzada por el estímulo, como
"espontánea" del animal, ocurre con la rata que responde a
sí parece un despropósito. la luz de la caja de
Obviamente, existe la respuesta experimentación.
a un estímulo y para la Como consecuencia de la
satisfacción de unas necesidades acción del operante, aparece el
que constituye el fin de la refuerzo, que constituye el otro
acción, aunque, como insiste centro de explicación de la
Skinner, esto pasa oculto al conducta. Todo operante
15
produce una modificación del muy extendido y que consiste en

ambiente que lleva como confundir la espontaneidad, es
resultado la consecución de un decir, la respuesta a un deseo sin
refuerzo. Siguiendo con nuestro coacción, con la libertad. Sus
ejemplo experimental, la acción intentos de explicación del
de la rata sobre la palanca lenguaje a partir de esos
origina la aparición de alimento, esquemas, llevó a Chomsky a
que ingiere inmediatamente. mostrar lo absurdo de pretender
Skinner afirmará que un dar explicación del lenguaje en
operante, al conseguir un términos de operantes y
refuerzo, hace a este depender refuerzos.
de aquel: la rata, para conseguir
3.1. Modelado de la
alimento ha de mover la palanca.
conducta
La acción del refuerzo
Como un tercer factor de
sobre la actividad es
primordial importancia en la
normalmente representada por
aportación de Skinner
una flecha que va desde aquel
anunciamos la modelación; es
hasta un momento anterior a la
decir, su técnica para
conducta, con lo cual se intenta
condicionar a los animales, que
explicar la presencia implícita
hace posible una fina dirección
del refuerzo en toda la
hasta lograr la conducta
operación, tal como lo hace el
preconcebida. Su base es la
esquema siguiente:
manera de suministrar los
Tabla 2: Trasportar la estructura de la refuerzos para conseguir los
conducta operantes deseados. Mediante
aquellos modela la conducta de
EC  RC  S
los animales como quien realiza
(refuerzo)
Transponer la estructura una máquina artesanal o una
de esa conducta a la voluntaria programación robótica.
en el hombre es una exageración La originalidad de la
que Skinner continúa técnica reside fundamentalmente
manteniendo, a pesar de las en la división de la conducta
muchas críticas que ha recibido deseada en pequeños
por ello. Se trata de un error
16
movimientos aproximativos la conducta humana que se abre

sucesivos. Cada una de las con esta técnica.
aproximaciones es lograda y
En sus esfuerzos para
fijada con un sistema de
conseguir el modelado, Skinner
refuerzos pertinente.
utilizó varias pautas de
 Por ejemplo, si se desea
condicionamiento con unos
que una paloma realice
programas de refuerzo que se
círculos hacia la
clasifican de la siguiente
izquierda, se le refuerza
manera:
todo movimiento en esa
dirección-no en cualquier 3.1.1. Programas de razón
otra-, y poco a poco el fija
animal aprende a girar Se proporciona el
para conseguir los refuerzo tras un número fijo de
sucesivos granos. operantes. Se puede reforzar

cada vez que lo realiza, cada dos
Generalmente, el
o cada veinte, por ejemplo. Las
programa de refuerzo se
razones serian entonces de 1 a 1,
administra de manera que este se
2 al y 20 a 1, respectivamente.
consigue paulatinamente,
conforme la conducta se va 3.1.2. Programas de
aproximando cada vez más al intervalo fijo
comportamiento final buscado. El refuerzo se aplica tras
Es decir, en un comienzo se un periodo de tiempo fijo. Puede
premia cualquier movimiento de ser cada 2 minutos, y entonces
la paloma hacia la izquierda; solo se refuerza el operante
pero más adelante se le exige pasado ese intervalo de tiempo.
una mayor sección del giro para 3.1.3. Programas de razón

concederle el refuerzo, hasta que variable
al final solamente se le Se refuerza, al igual que
proporciona cuando es completo. el programa de razón fija, según
No es necesario comentar la el número de respuestas, pero se
enorme cantidad de varía continuamente el intervalo
posibilidades de modelación de que se refuerza, teniendo
17
cuidado de que el promedio sea merece un poco más de

constante, Por ejemplo, se atención.
premia de promedio en razón de En principio, todo
20 a 1, pero unas veces se le aquello que aumenta la
refuerza cada 5 operante y otras probabilidad de que una
cada 40, de manera aleatoria. conducta sé produzca es un
refuerzo. Se trata, pues, de un
3.1.4. Programas de
estímulo para una respuesta y
intervalos variables
también de un objetivo buscado
El refuerzo ocurre
por una conducta. Su búsqueda
tras un periodo variable de
solo se explica si es gratificante,
tiempo. Unas veces se
por lo que se puede hablar de
premiará muy seguido otras
estímulos capaces de ser
con intervalos más largos.
refuerzos y de otros que no lo
No conviene que sea mayor
son, al menos por su propio
de 2 minutos.
valor. Las respuestas pueden ser
Cada programa es más a su vez reforzantes, pero no
apropiado en determinadas reforzables (comer, beber,
condiciones; pero en general se dolor...) y otras reforzables, pero
puede decir que los programas no reforzantes (apretar la barra
de razones fijas y variables son de la jaula de Skinner...). Se
los más eficaces. Una prueba de entiende que detrás de una
ello está en los juegos de azar actividad reforzable debe haber
como las máquinas un logro reforzante. Todo esto
tragamonedas, la ruleta, etc. hace que se distinga entre
3.2. El refuerzo refuerzos primarios, con valor
Con lo dicho, queda reforzante natural, y refuerzos
claro que el refuerzo es el punto secundarios, cuyo valor
central del condicionamiento reforzante ha sido adquirido
operante; pero lo es también de mediante la asociación con uno
los demás, y en general de una primario, como ocurre con todos
gran extensión de la psicología los condicionamientos. Se
actual -aunque a veces reciba entiende que la mayoría de los
otra denominación- por lo que refuerzos son secundarios,

18
especialmente los de carácter hombre es capaz de suplantar la

social. A la vez, es fácil advertir comida o la familia como el
cómo, mediante estas valor reforzante buscado. Se
asociaciones, un refuerzo puede independiza así, la conducta de
constituirse en la finalidad de un los reforzantes primarios, que
sinnúmero de operantes. Ocurre pueden ser sustituidos por los
así con el dinero, o con las secundarios, cuya extensión es
sonrisas... En cualquiera de los muchísimo mayor.
grupos indicados se podrían Queremos ahora llamar
distinguir refuerzos positivos y la atención sobre los refuerzos
negativos, según constituyeran de carácter afectivo, entre los
algo deseado o temido. Debido a que se pueden contar aquellos
las características peculiares de que producen principalmente
los segundos, los trataremos de placer que es lo que
modo separado más adelante. predominará en los animales
Son de interés las irracionales- y los que
apreciaciones de Premack sobre proporcionan un sentimiento
la posibilidad de que se inviertan más espiritual, que estarían
los papeles entre un refuerzo reducidos al ámbito humano,
primario y otro secundario. Lo Se maneja el placer
concreta afirmando que de dos cuando se produce un operante
respuestas, la de emisión más con la sacarina sustituyendo al
probable refuerza a la que tiene azúcar, o se estimula
menos probabilidades de ser directamente los centros
emitida. Por ejemplo, el esfuerzo límbicos del placer (algunas
de la rata ante los obstáculos ratas de experimentación han
para comer busca la muerto por no comer, centradas
gratificación de la comida; pero en la búsqueda de placer por ese
esto se puede invertir y comer medio), o se premia con unas
para buscar la gratificación de palabras amables la respuesta de
recorrer el laberinto o empujar la un perro. Los sacrificios de
palanca. Quizá sea más fácil amistad, religiosos, etc., del
comprenderlo cuando se piensa hombre, son harto conocidos por
en los casos en que el trabajo del todos como ejemplo de amor
19
espiritual. Queda pues 3.3. Condicionamiento

manifiesta la posibilidad de aversivo
operantes de carácter afectivo. Afirmamos más arriba el
Cuando esas finalidades carácter peculiar del condicionamiento
afectivas no son consideradas negativo al que se denomina también
necesidades, pueden aparecer aversivo. Su estudio ha sido tomado
problemas en la interpretación y con menos interés, a la vez que ha
generalización del concepto de tenido menos éxito en la vida práctica.
refuerzo, ya que este tiene como En nuestra sociedad se está más
función satisfacer una necesidad. pendiente de los premios, que son
No es fácil aceptar la existencia repartidos en multitud de
de necesidades no biológicas en circunstancias, que de los castigos, que
los animales. Sí está claro en el cuentan con el desagrado de las
hombre, cuya necesidad de grandes mayorías. Esto ha influido en
afecto es algo primario. De la concepción y realización de la
cualquier manera, es claro que la educación, tanto a nivel familiar como
posibilidad de operantes académico.
afectivos amplían enormemente
Mientras que el
los reforzadores potenciales.
condicionamiento positivo busca
Nos parece de
obtener algo con el refuerzo, el
importancia en la comprensión
negativo consiste en la evitación de un
del papel del refuerzo, las
castigo; es decir, se busca más bien
apreciaciones de E. C. Tolman,
suprimir, con lo cual la diferencia
sobre las que volveremos más
parece que estaría muy clara. Sin
adelante. Para este investigador
embargo, no es así cuando
el refuerzo no es imprescindible
interpretamos -como lo hace Hull, por
para el aprendizaje sino para la
ejemplo- toda conducta como la
ejecución del mismo. Es decir,
supresión de una necesidad. En este
se realiza un operante cuando se
caso, la comida suprime el hambre
desea lo que se obtiene en él,
igual que la huida el dolor, y las
algo distinto y que no conviene
diferencias no serían tales, al menos en
confundir con el mero
sus bases, aunque si en las
aprendizaje.
20
consecuencias por las peculiaridades aparecido el estímulo aversivo,

de cada uno. el animal puede evitarlo
colocándose en determinadas
El condicionamiento aversivo
condiciones. Siguiendo el
puede tener distintas formas, entre las
ejemplo anterior, la rata es
que destacan:
condicionada esta vez de manera
3.3.1. Condicionamiento de que al aparecer la luz puede huir
respuestas a un lugar donde evita que le
emocionales alcance el shock.
El condicionamiento de
3.3.3. Condicionamiento de
respuestas emocionales se
evitación activa
produce cuando el sujeto no
puede evitar la estimulación
evitación activa se caracteriza
negativa, y con ello, el refuerzo
porque el sujeto tiene la
negativo (castigo). Ocurre, por
posibilidad de impedir el
ejemplo, cuando un animal es
refuerzo aversivo una vez que
condicionado en la recepción de
aparece el estímulo
un shock eléctrico al encenderse
discriminativo. Siguiendo con
una luz, sin que pueda hacer
nuestro ejemplo, al aparecer la
nada para evitarlo. Basta
luz la rata puede hacer una
entonces que vea luz para que
maniobra que evita que se
sufra los cambios biológicos
produzca el shock eléctrico.
propios del miedo. Este tipo de
Existe, pues, una respuesta de
condicionamientos es, sin duda,
supresión con la que el animal
muy frecuente en nuestra
puede evitar el refuerzo.
sociedad, ya desde la primera
infancia, y explicaría muchos 3.3.4. Condicionamiento de
comportamientos anómalos. evitación pasiva
3.3.2. Condicionamiento de
evitación pasiva es el reconocido
escape
más generalmente como castigo,
En él, el sujeto evita el estímulo
escape proporciona al sujeto la
aversivo mediante la supresión
posibilidad de huir del castigo.
de una respuesta en lugar de una
Es posible porque una vez
21
respuesta de supresión. Es decir, respuesta a unos ámbitos de

aprende a no hacer algo para amplitud impensables en el
evitar el castigo. Hay, pues, la condicionamiento positivo. De
supresión de una conducta al este modo, se entiende el
final de la cual se produciría el cuidado que en la vida práctica
refuerzo negativo, mientras que debe tenerse con ellos, a la vez
con el condicionamiento de que aclara ciertas conductas, y
evitación activa se puede lograr aconseja el cuidado de
la realización de una tarea que situaciones muy traumatizantes.
impide un castigo, algo que es Estos mismos excesos pueden
imprescindible en cualquier ocurrir en los positivos, aunque
actividad escolar. Esta manera los matices son diversos. Ya
de actuar es lo normal en indicamos más arriba que una
cualquier sociedad y se propicia rata puede llegar a morir de
mediante el carácter coactivo de inanición por dedicarse
las leyes, algo de lo que no se exclusivamente a la búsqueda de
podrá nunca prescindir. placer. Y es claro que la
Lo que más ha alarmado sociedad tiene muestras
a los investigadores y dificultado suficientes de los excesos a los
la puesta en la práctica de los que puede llevar la búsqueda de
condicionamientos adversivos, refuerzos positivos, desde las
es la desmedida en las drogas hasta el poder o el
proporciones del mismo. Si bien dinero. [ CITATION Pér95 \l 3082 ]
este condicionamiento responde
4. Procedimiento del
a las leyes generales ya descritas
condicionamiento
de todo condicionamiento,
Existen cuatro
puede llegar a dimensiones que
procedimientos fundamentales
llevan más allá de lo pretendido
de condicionamiento
o deseable. Por ejemplo, un
instrumental que pueden
shock en la comida a una rata
clasificarse entendiendo a la
puede hacer que esta muera de
naturaleza del acontecimiento
inanición antes que volverse a
ambiental controlado por la
acercar al comedero. Otras veces
conducta.
se dan generalizaciones de la
22
Hay dos factores a aumenta la probabilidad, eleva la

considerar: tasa de respuesta o' de emisión
 Uno de ellos es el tipo de de una conducta. El castigo es
acontecimiento, que cualquier acontecimiento
puede ser agradable o consecutivo a una respuesta que
desagradable; cuando es reduce la probabilidad de que la
agradable se denomina respuesta se repita.
estimulo apetitivo o
4.1. Reforzamiento positivo.
positivo, y cuando es
Se produce en las
desagradable se
situaciones en las que existe
denomina estimulo
una contingencia positiva
aversivo o negativo.
entre la respuesta y un
 El otro factor es la
estímulo reforzador
relación entre la
apetitivo. Si aplicamos un
respuesta y el
refuerzo positivo
acontecimiento
contingentemente a la
ambiental que controla;
emisión de una determinada
la respuesta puede
conducta, decimes que tal
producir el
conducta ha sido reforzada, o
acontecimiento se dice
lo que es lo mismo, que se
que tiene lugar una
producido un reforzamiento
contingencia positiva, o
positivo. Skınner (1938)
puede eliminar el
indica que un estímulo
acontecimiento y tendría
reforzador positivo es un
lugar una contingencia
evento, conducta u objeto
negativa.
que aumenta la frecuencia de
Ya se ha visto cualquier conducta a la que
anteriormente que por refuerzo sigue Es una relación
se entiende cualquier positiva entre una respuesta
acontecimiento cuya aparición y la producción de un evento
intensifica la conducta que lo En cuanto se termina la
produce; un refuerzo es conducta se terminan los
cualquier acontecimiento que estímulos reforzadores.
23
Existen muchísimos cualquier estímulo cuya

ejemplos de este tupo de retirada contingente
reforzamiento entregar un incrementa la emisión de la
cheque después de realizar respuesta (Skinner, 1938).
un trabajo, aplaudir a una Al igual que en el
persona que da una reforzamiento positivo, la
conferencia, regalar un consecuencia de esta
juguete a un niño que ha relación también es el
hecho bien los deberes, etc. aumento de la probabilidad
futura de la respuesta, sin
4.2. Reforzamiento negativo
embargo, la relación es
Se produce si tras la
negativa puesto que la
realización de una
ejecución de la respuesta
determinada conducta, se
produce la desaparición del
produce la eliminación de un
reforzador. Ejemplo de
estímulo aversivo, entonces
reforzamiento negativo es el
habremos reforzado
hecho de tomar una aspirina
negativamente dicha
cuando nos duele la cabeza;
conducta, es decir, tal
si desaparece el dolor de
conducta incrementará su
cabeza, que es el estímulo
probabilidad de repetirse en
aversivo, aumentamos la
un futuro. Está implicada
probabilidad de emitir la
una contingencia negativa
conducta de tomar aspirina la
entre la respuesta y el
próxima vez que nos duela la
reforzador, la respuesta
cabeza; también es una
interrumpe, impide o elimina
situación de reforzamiento
la presentación del
negativo el abandonar una
reforzador. Si no se presenta
conversación cuando el tema
la respuesta, se admınistra el
no nos interesa, con lo que
reforzador, que es un
desaparece el estímulo
estímulo aversivo. Skinner
aversivo.
(1938) indica que un
Hay dos tipos de
reforzador negativo o
procedimientos de
estimulo aversivo es
reforzamiento negativo. Uno
24
de ellos es cuando el aumentar la probabilidad

estímulo aversivo se presenta futura de la respuesta, la
continuamente y la emisión debilita, y es menos probable
de la respuesta lo puede que se produzca en el futuro.
interrumpir, y que se En este caso las
denomina escape. Por consecuencias no se
ejemplo, marcharse del cine denominan estímulos
cuando la película no nos reforzadores, sino punitivos
gusta. En el otro tipo de No se debe confundir
procedimiento está reforzamiento negativo con
implicado un estímulo castigo, el castigo no es un
aversivo que se presenta de reforzador, ya que su
vez en cuando en el futuro, y objetivo es la reducción de la
la emisión de la respuesta lo frecuencia de alguna
puede evitar; se denomina conducta Ejemplo de castigo
evitación. Ejemplo: llevar a positivo es reñir a un niño
revisión el coche para evitar por no hacer los deberes,
una avería. recibir una descarga eléctrica
al tocar un aparato eléctrico,
4.3. Castigo positivo
etc.
Se produce en las
situaciones en las que existe 4.4. Castigo negativo
una contingencia positiva Igual que en el
entre la respuesta y un castigo positivo, el resultado
estímulo desagradable o final es la dismınución de la
aversivo. El castigo positivo probabilidad de la respuesta.
se refiere a la utilización de El castigo negativo se
un evento físico o produce cuando se aprende a
psicológicamente doloroso dejar de emitir una respuesta
como castigo. Si no se porque tiene como
ejecuta la respuesta no se consecuencia la retirada o el
presenta el estímulo cese de algún evento positivo
aversivo. Esta relación o significativo para el sujeto.
positiva, en lugar de El reforzamiento se pierde o
25
no está disponible como 5. Fases del

consecuencia de la Condicionamiento
realización de una conducta 5.1. Adquisición
inapropiada. Por ejemplo, las La adquisición de la
sanciones mediante multas respuesta se refiere a la fase
emplean este tipo de castigo del aprendizaje en que la
negativo: conducir por respuesta es seguida por
encima de la velocidad reforzadores. Durante la
permitida comporta la adquisición la respuesta se
pérdida de dinero o la vuelve más fuerte o más
retirada del carné de frecuente, debido a su relación
conducir. con la consecuencia reforzante.
Hay dos categorías de  Ejemplo: Juan, quien
castigo negativo, una de ellas gusta mucho de acudir al
es el coste de respuesta, Cine al menos 3 veces al
donde la respuesta no mes, acude al Cine “X”
deseada hace que se retire o donde se encuentra con
no se pueda obtener el que por cada 2 visitas al
reforzamiento. En el cine le regalan una
laboratorio una respuesta no entrada gratis y por cada
deseada hará que el animal 4 le dan 2 entradas gratis
pierda o no consiga, por más un premio sorpresa.
ejemplo, comida. El otro tipo
5.2. Generalización
de castigo negativo se
Las respuestas
denomina tiempo fuera o
fortalecidas mediante
tiempo fuera de
procedimientos operantes en un
reforzamiento; aquí se utiliza
conjunto de circunstancias
un período de tiempo durante
tienden a extenderse o a
el cual el reforzamiento no
generalizarse en situaciones
está disponible, por ejemplo,
similares, al igual que ocurre en
cuando a un niño se le envía
el condicionamiento clásico.
a su habitación por
Cuando más parecidos sean los
comportarse mal en la mesa.
[ CITATION Fer01 \l 3082 ]
26
contextos, más probable es la que son reservados para:

generalización. minusválidos. Aquí estas
 Ejemplo: María, es una imágenes o señalización
joven de 17 años, que le actúan como Estimulo
gusta llamar la atención discriminatorio, ya que
de los chicos, sus amigas discriminan una
le han dicho que usando respuesta de estacionarse
jeans pitillos marca “D” en el espacio destinado
iba a tener más chicos a para otras personas.
su alrededor, para lograr
5.4. Extinción
que esa conducta se
Cuando se retira el
reproduzca con otras
reforzamiento para alguna
marcas de pantalones del
respuesta particular, dicha
mismo modelo, bastó
conducta disminuye su
con que los chicos las
frecuencia gradualmente hasta
miraran más por la calle,
que solo ocurre con la misma
teniendo cada vez más
frecuencia con que ocurría antes
admiradores, reforzando
del reforzamiento. Sin embargo,
de esa manera
es importante advertir que en
sistemáticamente el uso
muchas ocasiones, después de
de ese modelo de jeans
que se retiren los reforzadores,
(pitillos).
se advierte inicialmente un
5.3. Discriminación aumento de la cantidad de
Los individuos respuesta y de la frustración
desarrollan también antes de que empiece la
discriminaciones al reforzarse disminución.
las respuestas en una situación,  Ejemplo: Luis estaba
pero no en otra. acostumbrado a
 Ejemplo: En un consumir la marca de
estacionamiento se yogurt “Vaquita” en su
señalan a través de presentación de litro,
imágenes de porque le daba el 20%
señalización, los lugares más además de tener un
27
muy buen sabor a frutas, 6. Programas de

por el mismo precio de reforzamiento
los demás yogures de Los programas de
litro que existen en el reforzamiento son reglas que
mercado. De pronto indican el momento y la forma
dejaron de dar el 20% en que la aparición de la
más y el sabor no era el respuesta va a ir seguida de un
mismo, por lo que Luis reforzador sobre la
dejó de comprar y administración del reforzador.
consumir yogurt Estos programas influyen en
“Vaquita”. distintos aspectos del
aprendizaje, como la rapidez con
5.5. Recuperación
la que se aprende inicialmente la
espontánea
respuesta, la frecuencia con la
Al igual que en el
que se ejecuta la respuesta
condicionamiento clásico, las
aprendida, la frecuencia con la
respuestas que se han extinguido
que se hacen las pausas después
vuelven a aparecer algunas
de los reforzamientos, o el
veces, es decir, se da una
tiempo que se sigue ejecutando
recuperación espontánea
la respuesta una vez que el
después de un descanso.
refuerzo deja de ser predecible o
[ CITATION Mye00 \l 3082 ]
se suspende.
 Ejemplo: Luego de unos
Existen dos tipos básicos de
meses el yogurt
reforzamiento:
“vaquita” al bajar sus
ventas en el mercado, 6.1. En el reforzamiento
nuevamente ofreció el continuo
20% más y sumado a Cada una de las
ello el mejoramiento del respuestas da lugar a la
sabor de su producto, aparición de un reforzador,
Luis nuevamente empezó como en el caso de una paloma
a consumir el yogurt que recibe comida cada vez que
“Vaquita”. picotea una tecla. Este tipo de
reforzamiento parece ser el
28
modo más eficaz para Miles, el cliente acumula

condicionar inicialmente la millas para volar con
conducta. Sin embargo, cuando Delta que a su es
el refuerzo cesa (por ejemplo, miembro de Sky Team.
cuando desconectamos la
A su vez, cada uno de ellos
entrega de alimento) la extinción
admite dos tipos de administración:
también es rápida. Por su parte,
fija o variable.
en el reforzamiento intermitente
las respuestas solo se refuerzan 6.1.1. Razón fija
algunas veces, como en el caso El refuerzo se
de una persona que juega a las obtiene después de un
máquinas y recibe el refuerzo o número fijo de
premio cada varias jugadas. Este respuestas. Un ejemplo se
tipo de programa produce un da cuando las fábricas
patrón más persistente de pagan a sus obreros
respuestas que un programa después de producir un
continuo cuando el determinado número de
reforzamiento se vuelve productos. En realidad, el
impredecible o cesa. Una reforzamiento continuo es
combinación de reforzamiento un programa de este tipo de
intermitente y de refuerzo razón 1. Los individuos
continuo es muy eficaz cuando responden con una tasa
se trata de enseñar a los sujetos relativamente mayor de
mediante condicionamiento respuestas cuando operan
operante: al principio se utiliza bajo programas de razón
un reforzamiento continuo, para fija superior a 1 (dependerá
que se adquiera la respuesta, y del caso aplicar la razón
luego se pasa a un reforzamiento más adecuada), pero por lo
intermitente, para que sea más general hacen una pausa
difícil que se extinga. para descansar después de
 Ejemplo. Cada vez que recibir el reforzamiento,
se compra algo con la antes de proseguir con la
tarjeta “American respuesta.
Express” Delta Sky

29
 Ejemplo. Con el servicio siguiente reforzador

de 20,000 ,40.000, mantiene a los organismos
60.000 y 80.000 produciendo la respuesta
kilómetros en la agencia constantemente.
donde compraste el auto,  Ejemplo. Si se le dice a
se te obsequia un regalo. un vendedor, que por
cada diez helados que
venda, uno será para él,
6.1.2. Razón variable
la razón fija será 10.
En este caso, el
número de respuestas para 6.2. El reforzamiento
conseguir el reforzador intermitente
varía aleatoriamente, Da lugar a los programas
aunque siempre dentro de de reforzamiento, que pueden
un promedio determinado. ser de dos tipos: de razón (en
Un ejemplo son las función del número de
máquinas tragamonedas, respuestas) y de intervalo (en
que están programadas para función del tiempo).
otorgar el premio conforme  Ejemplo. Martha acude
a un programa de razón los sábados a una
variable. Muchos discoteca que
reforzadores naturales, promociona “sábados
como el éxito o el gratis para las chicas
reconocimiento, se acercan con minifalda”, pero
mucho a este tipo de esta promoción solo se
programas. Los programas da por 2 sábados al
de razón variable producen mes. Por lo que el
una tasa de respuesta global refuerzo es intermitente,
elevada sostenida, y los no es continuo.
individuos no hacen pausa
A su vez, cada uno de ellos
después del refuerzo.
admite dos tipos de
Aparentemente, la
administración: fija o variable.
incertidumbre de no saber
cuándo va a llegar el
30
6.2.1. Intervalo fijo con lo que más le gusta a

El refuerzo aparece Juana, que es escuchando
cada vez que trascurre una música o viendo la TV.
determinada cantidad de
6.2.2. Intervalo variable
tiempo, siempre que durante
El refuerzo está
el intervalo se haya dado la
disponible después de un
respuesta. Un ejemplo sería
tiempo que varía
el de un padre que verifica
aleatoriamente, pero
cada media hora que su hijo
alrededor de un promedio.
está estudiando, y cuando es
Un ejemplo es el de un
así le hace un halago. Los
profesor que realiza
problemas de intervalo fijo
exámenes sorpresa
producen una tasa de
aproximadamente cada
respuestas desigual. Una vez
semana. Este tipo de
que se administra el
programa por lo general
refuerzo, la tasa de
produce una tasa de
respuestas tiende a ser baja.
respuesta constante, pero
Durante el intervalo, la
moderada.
conducta aumenta
 Ejemplo. Lucia llama a
típicamente hasta alcanzar
la radio para ganarse una
un nivel elevado
canasta navideña sin que
inmediatamente antes del
le contesten por la
siguiente reforzador
congestión de llamadas.
programado. La cantidad
Luego de varios intentos
global de respuestas en un
se da cuenta de que las
programa de intervalos fijos
llamadas entran cada 20
es moderada.
min, cada media y cada
 Ejemplo. Juana lleva
hora. El intervalo de
estudiando 3 horas para
tiempo es variable.
su examen de biología,
de la cual su mamá Por lo general, los programas
decide que pasado ese de tasa (razón) producen una
intervalo de tiempo, debe adquisición más rápida, pero
darle 2 horas de descanso fácilmente extinguible una vez

31
suspendida la administración de sugirió que la ausencia de refuerzo

reforzadores; y los de intervalo produce un estado aversivo de
producen una adquisición más estable frustración. Los estímulos asociados
y resistente a la extinción. En la vida con la ausencia de refuerzo llegan a
real, estos programas básicos a producir una respuesta condicionada
menudo se combinan.[ CITATION de frustración, por lo que el sujeto
Pap00 \l 3082 ] intenta escapar de esa situación, ya
que escapar de esa situación aversiva
7. Extinción de la conducta
es reforzante.
Una respuesta adquirida
mediante condicionamiento Otros investigadores como, por
instrumental puede extinguirse si el ejemplo, Brooks (1980) también han
refuerzo deja de presentarse tras la demostrado que los estímulos
emisión de la respuesta. Skinner asociados con el no reforzamiento
(1938) observó que cuando se dejaba adquieren propiedades aversivas, En
de reforzar a una rata para ejecutar una las condiciones de extinción una
respuesta previamente adquirida reacción frecuente es la agresión, las
mediante este condicionamiento, se ratas suelen morder la palanca y las
producía la extinción de esa respuesta. palomas agitar las alas.
La primera vez que se interrumpe el
Hay tres factores que
reforzamiento la tasa de respuesta es
contribuyen significativamente a la
alta, pero va disminuyendo hasta que
resistencia a la extinción de una
se extingue.
respuesta, que son la magnitud del
La respuesta puede aparecer refuerzo adquirida durante la fase de
después de la extinción si al sujeto se adquisición de una respuesta, la
le devuelve a la situación demora del refuerzo y la consistencia
experimental; es el fenómeno de la del mismo.
recuperación espontánea. Con
El efecto de la magnitud
sucesivas sesiones de extinción este
del refuerzo sobre la
fenómeno es cada vez menor hasta que
extinción depende del nivel
desaparece del todo.
de entrenamiento durante la
Otro fenómeno que aparece en adquisición; si el nivel de
la extinción es la aparición de entrenamiento en la fase de
respuestas emocionales, Amsel (1958) adquisición es mínimo, un
32
refuerzo alto produce parcial, persiste más tiempo

mayor resistencia a la durante la extinción, es
extinción; en cambio, con decir, es más resistente a la
un entrenamiento extinción que una respuesta
prolongado de adquisición, que siempre ha sido
cuanto mayor es la cantidad reforzada; este efecto se
de refuerzo menor es la denomina efecto del
resistencia a la extinción, y, reforzamiento parcial o
por último, con un efecto de extinción del
entrenamiento prolongado reforzamiento parcial.
y un refuerzo pequeño [ CITATION Fer01 \l 3082 ]
durante la adquisición se
8. Discriminación y
produce mayor resistencia a
generalización del
la extinción de la respuesta.
estímulo
Los organismos aprenden a
El efecto de la demora del
responder de distinta manera ante
refuerzo sobre la
estímulos diferentes, y este proceso de
resistencia a la extinción
responder ante unos estímulos pero no
depende de su consistencia;
ante otros se denominan
si la demora del refuerzo
discriminación. También los
durante la adquisición ha
organismos aprenden a responder de la
sido constante, no afecta a
misma manera ante estímulos
la resistencia a la extinción;
semejantes o parecidos, es el proceso
en cambio, una demora
de generalización. Estos dos procesos
variable aumenta la
suponen un aprendizaje adaptativo
resistencia a la extinción.
ante la complejidad del medio
ambiente.
En cuanto a la
Ya se ha visto la importancia
consistencia del refuerzo,
de la relación respuesta-refuerzo en
se ha comprobado que una
este condicionamiento, pero estos
respuesta que no ha sido
elementos no se presentan aislados, y
reforzada cada vez que se
es frecuente que los organismos
ha producido ha estado
experimenten estímulos concretos
sometida a reforzamiento
33
cuando emiten la respuesta. Por- discriminativos positivos (EDP), que

ejemplo, en la situación experimental indican que si la conducta se emite en
de la caja de Skinner donde la rata presencia de ellos se obtendrá
aprieta la palanca y se la refuerza con refuerzo, y estímulos discriminativos
comida, hay una serie de estímulos negativos (EDN), cuya presencia
ambientales como el olor y los sonidos indica la no disponibilidad de
de la cámara experimental que están refuerzo. El control por el estímulo en
presentes cuando la rata presiona la la conducta instrumental se demuestra
palanca. Por tanto, realmente la si la presencia de estímulos diferentes
situación de condicionamiento provoca respuestas distintas. Por
instrumental contiene tres elementos: ejemplo, si se entrena a una paloma a
los estímulos ambientales, la respuesta picotear un disco para obtener comida,
y el reforzador. Estas claves y este disco puede iluminarse con dos
ambientales pueden llegar a controlar colores, rojo y verde, y el refuerzo
la aparición de la respuesta. sólo se presenta cuando está el color
Sabemos que en muchas verde y emite la conducta de picoteo,
ocasiones el refuerzo está disponible y la paloma aprende a picotear cuando
es contingente a la respuesta, pero en se ilumine la luz verde y la tasa de
otras no está disponible y no se respuesta de picoteo es muchísimo
obtendrá refuerzo a pesar de la más alta con el disco iluminado de
emisión de la conducta. Para aprender color verde que de luz roja. El color
a discriminar cuándo está o no el verde es un EDP y el color rojo un
refuerzo disponible hemos de EDN.
descubrir las condiciones que indican El proceso de generalización
la disponibilidad de refuerzo y omitir hace que se responda ante estímulos
la respuesta cuando se den esas semejantes presentados en el proceso
condiciones, y, por tanto, también de condicionamiento es el fenómeno
hemos de aprender a discriminar opuesto a la discriminación de
cuándo no se dan esas condiciones estímulos. La medida del control por
para así no emitir la respuesta. Sólo en el estímulo se realiza a través de los
el caso de que la presencia de un gradientes de generalización.
estímulo altere la frecuencia de una Mediante este sistema se determina
conducta se puede hablar de estímulo exactamente cuánto tiene que
discriminativo. Existen estímulos modificarse el ambiente para producir
34
un cambio en la conducta (Domjan y Cursó estudios en la Wesleyan

Burkhard, 1986). El gradiente de University de Connecticut, donde se
generalización se utiliza tanto para el licenció en 1895, pasando a la
condicionamiento clásico como para el Universidad de Harvard, donde tuvo
instrumental. Por ejemplo, en el como maestro a William James.
experimento de Guttman y Kalish
Tras Harvard, fue tutor en la
(1956) con cuatro grupos de palomas,
Universidad de Columbia, en Nueva
durante el entrenamiento de
York, donde se doctoró en 1898.
condicionamiento, presentaron a cada
Continuó enseñando en Columbia
grupo un tipo de luz de diferente
hasta su jubilación en 1941.
longitud de onda que varió desde el
verde amarillento al rojo, y Inició sus investigaciones en el
posteriormente tras el entrenamiento terreno de la Psicología animal, sus
de adquisición comprobaron la dos primeros escritos versaron sobre
generalización a otras luces de colores La psicología de los peces y La vida
parecidos; los resultados demostraron mental de los simios, posteriormente,
que las palomas daban el número derivó sus investigaciones al dominio
máximo de respuestas lógicamente del aprendizaje, a la medida de la
ante el estímulo entrenado y que el inteligencia y a la Psicología social.
nivel disminuía conforme aumentaba Su trabajo estudiando la

la diferencia de longitud de onda entre conducta de los animales condujo a la
el estímulo entrenado y los de prueba.[ teoría del conexionismo. Se interesó
CITATION Fer01 \l 3082 ] por la comunicación mediante gestos
9. Bibliografía de E. inconscientes (debido a la información
Thorndike que le llegó sobre un caballo que
Edward Lee Thorndike, realizaba operaciones aritméticas). Su
psicólogo estadounidense. Nació el 31 contribución más importante es la
de agosto de 1874 Williamsburg. Fue formulación de la llamada ley del
el segundo hijo de Edwward Roberts efecto, a partir de los estudios que
Thorndike y Abbie Ladd. Se crio en el realizó con gatos en cajas-problema de
seno de una familia metodista, su las que debían escapar.
padre fue pastor.

35
Edward Thorndike falleció el 9 había una habitación con comida. El

de agosto de 1949 en Ontrose (Nueva resultado de sus estudios fue la
York).[ CITATION Mor17 \l 3082 ] elaboración de la teoría del
aprendizaje por ensayo y error. Según
10. Aportes
afirmaba este autor "por cada perro
Edward Thorndike es
que encuentra el camino de regreso al
considerado un antecesor de la
hogar, hay quizás un centenar que se
psicología conductista estadounidense.
pierden." Sostenía que los animales
Sus principales aportaciones fueron el
no razonan ni avanzan en la resolución
aprendizaje por desarrollo/error y la
de problemas, sino que aprenden de
ley del efecto. Sus estudios sobre la
una manera más o menos mecánica,
conducta animal le permitieron
partiendo de un método de ensayo y
desarrollar la teoría del conexionismo.
error.
Fue presidente de la American
Psychological Association en 1912. En 10.1. Aprendizaje por
la actualidad se reconoce también a Ensayo y Error: Las cajas
Thorndike su papel en los comienzos del problema de
del desarrollo de las pruebas Thorndike
psicológicas. Edward Thorndike descubrió el
aprendizaje por ensayo y error cuando
Elaboró una teoría a la que
observó que la conducta casual o
denominó conexionismo en la que
aleatoria de un animal podía venir
mantiene la idea de conciencia aunque
acompañada por respuestas del medio
sin perder de vista la importancia del
ambiente satisfactorias para el animal.
entorno ni el carácter práctico.
Si estas respuestas del medio
Sus investigaciones se basaron
ambiente se repiten, es muy probable
en el estudio del comportamiento en
que el animal asocie la conducta con la
animales, y la utilización de
respuesta que tras ella aparece. Así, el
herramientas como la "caja
animal habrá aprendido una conducta
rompecabezas" o "caja-problema", en
que podrá utilizar siempre que necesite
la que el animal debía accionar un
que aparezca esa respuesta del medio
mecanismo para poder salir de ella;
además de esta caja también ideó Algunos ejemplos de
recorridos a modo de laberinto donde aprendizaje mediante ensayo y error:
36
 Encerramos a un perro Psicología y además, a partir de este

en una jaula y situamos tipo de aprendizaje, Thorndike postuló
fuera comida, el perro se la ley del efecto, otro gran
moverá por la caja de descubrimiento para la ciencia
forma casual hasta que psicológica.
con uno de esos
“Los seres humanos están
movimientos apriete una
acostumbrados a pensar en la
palanca que abra la caja
inteligencia como el poder de
y de ese modo obtenga
disponer y controlar las ideas y de la
comida. Si esta situación
capacidad de aprender como
se repite, el perro
sinónimo de capacidad de tener ideas.
acabará aprendiendo que
Pero aprender por tener ideas es
para salir de la caja y
realmente uno de los eventos más
comer tendrá que apretar
raros y aislados en la naturaleza”.
la palanca.
Edward Thorndike.
 Llamas a tu perro y viene
10.2. Ley del efecto
pero lo que quieres es
La idea esencial de la ley del
que cada vez que lo
efecto de Edward Thorndike es que el
llames venga y se siente.
comportamiento puede ser modificado
El perro irá donde estés
por sus consecuencias. Así, según este
cada vez que lo llames y
principio, las respuestas de
a lo mejor se queda de
comportamiento que son seguidas más
pie, se acuesta o incluso
de cerca por un resultado satisfactorio
se marcha, pero si
tienen más probabilidades de
empiezas a reforzarle
convertirse en patrones establecidos y
con una galleta cada vez
ocurrir nuevamente en respuesta al
que venga y además se
mismo estímulo.
siente, el perro acabará
aprendiendo que cuando Por lo tanto, la ley del efecto
oiga su nombre tiene que refuerza la idea de que el
ir donde estés y sentarse. comportamiento se establece más
firmemente a través de conexiones
El aprendizaje por ensayo y
frecuentes de estímulo y respuesta. Es
error suspuso un gran avance en
esta repetición lo que terminaría
37
generando la asociación 10.2.1. Desarrollo de la ley

(«aprendizaje»). del efecto de Edward
Thorndike
El psicólogo estadounidense
Thorndike utilizó cajas de
Edward Thorndike (1874-1949) fue
rompecabezas para sus experimentos;
uno de los primeros psicólogos que
su objetivo era estudiar cómo
intentaron interpretar el aprendizaje
aprenden los animales. Estas cajas,
mediante la vinculación de estímulos y
aunque estaban cerradas, contenían
respuestas. Thorndike observó que las
una pequeña palanca que permitía que
formas más distintivas de la ciencia
el animal escapara cuando la
son el aprendizaje por ensayo y error,
presionara.
tanto en el ser humano como en el
reino animal. Este tipo de aprendizaje Thorndike puso un gato dentro
es evidente cuando una persona está de la caja del rompecabezas y luego
una situación problemática que debe colocó un trozo de carne fuera de la
resolver y/o que debe superar para caja con la intención de ver qué
alcanzar un objetivo concreto. esfuerzo hacía el animal para escapar
y obtener la comida. Aunque la
La ley del efecto de Edward
primera vez que los gatos presionaron
Thorndike es una de las llamadas
la palanca fue por accidente,
teorías de estímulo-respuesta, teorías
posteriormente repitieron la acción
fundamentales para los principios del
puesto que la primera vez habían
condicionamiento. Estas teorías se
obtenido un premio.
basan en el supuesto de que el
comportamiento humano es aprendido. Con cada prueba Thorndike
notó que los gatos se volvían mucho
Uno de los primeros
más rápidos al abrir la puerta. Como al
colaboradores del campo fue Edward
presionar la palanca había conseguido
Thorndike con la ley del efecto,
un resultado favorable, había más
publicada en 1905, cuya influencia fue
probabilidades de que los gatos
muy importante en las teorías del
repitieran comportamiento más
condicionamiento sobre las que se
adelante. A esto Thorndike lo llamó
basan los psicólogos conductistas,
ley del efecto.
especialmente sobre la teoría del
condicionamiento operante de Thorndike enfatizó la
Skinner. importancia de la situación para
38
obtener una respuesta. En este sentido, consecuencias

el gato no hubiera hecho el desfavorables.
movimiento de presionar la palanca si
Sin embargo, este último
no hubiera estado en la caja del
aspecto fue modificado por Thorndike
rompecabezas. Es decir, si
años después. En realidad, las
simplemente en un lugar donde la
recompensas por un comportamiento
respuesta nunca había sido reforzada.
fortalecen siempre las asociaciones
La situación implica no solo la entre la conducta y otros elementos.
ubicación del gato, sino también los Por otro lado, los castigos por
estímulos a los que está expuesto, por respuestas inapropiadas suelen
ejemplo, el hambre y el deseo de disminuir la fuerza de la asociación a
libertad. El gato reconoce el interior de una velocidad mucho menor de la que
la caja, las barras y la palanca y se ha creado.
recuerda lo que debe hacer para
10.2.2. Consideraciones sobre
producir la respuesta correcta. Esto
la ley del efecto de
demuestra que el aprendizaje y la ley
Edward Thorndike
de efecto están muy relacionados con
El trabajo inicial de Thorndike
el contexto.
es considerado como el primer estudio
Hay dos aspectos clave de la de laboratorio sobre aprendizaje
ley de efecto. animal. Su énfasis en la medición y el
análisis cuantitativo de los datos, en
 Por una parte, es más
oposición a los relatos meramente
probable que los
descriptivos de los experimentos, ha
comportamientos con
sido influido enormemente en la
consecuencias
psicología moderna. En especial, ha
favorables vuelvan a
influido sobre la corriente conductista
ocurrir.
y se interés por la experimentación.
 Por otra, y en
consecuencia, es menos Destaca también el hecho de
probable que ocurran que Thorndike fue el primero en
nuevamente conductas introducir el concepto de refuerzo,
cuando a estas le siguen También fue el primero en aplicar los
principios psicológicos en el área de
aprendizaje. Como ya hemos
39
adelantado, la investigación de
Thorndike dio lugar a muchas teorías
y leyes del aprendizaje, como el
condicionamiento operante de Skinner
y la teoría del aprendizaje de Clark
Hull. La investigación de Thorndike
influyó en la psicología comparativa
durante varias décadas.[ CITATION
Rod18 \l 3082 ]
Conclusiones
 El condicionamiento operante se basa en el aprendizaje de una conducta

dependiendo de la probabilidad de una consecuencia esperada. Dicho
condicionamiento se fundamenta en los reforzadores (positivos o
negativos) y castigos (positivos o negativos).
 El reforzamiento o refuerzo controla la conducta en una amplísima
variedad de circunstancias, y de hecho los procedimientos basados en
los principios de condicionamiento instrumental se aplican para ayudar
a resolver muchos problemas prácticos del mundo real en muchísimos
ámbitos, educación, clínica, trabajo, relaciones personales, etc.
 Se puede decir que la conducta humana, está guiada por los refuerzos,
los cuales son de carácter motivador para dirigir una conducta, son
fundamentales en el aprendizaje sabiendo utilizar los, para lograr una
respuesta esperada en los seres humanos.
 El saber controlar bien una conducta a través de los refuerzos ayudara a
las personas a vivir en un mundo más placentero, ya que se podrán por
ejemplo eliminar o reducir todas esas conductas aceptadas socialmente
como inadecuadas.
Referencias
41
Rodríguez, E. M. (2018). La ley del efecto de Edward Thorndike. La Mente es

Maravillosa.
Campos, J., Palomino, J., González , E., & Zencenarro, J. (2006). Introduccion a la
Psicología del Aprendizaje . Lima: San Marcos.
Fernández Abascal, E., Martín Díaz , M. D., & Domínguez Sánchez , J. (2001).
Procesos Psicológicos . Madrid: Pirámide .
Moreno, V., Ramírez, M., de la Oliva, C., & Moreno, E. (07 de 05 de 2017). Biografía
de Edward Thorndike. Obtenido de Biografía de Edward Thorndike:
https://www.buscabiografias.com/biografia/verDetalle/9569/Edward
%20Thorndike
Myers, D. (2000). Psicología . España.
Papalia, D. E. (2000). Psicología . Mexico.
Pérez Sanches , P. (Primera edición 1995). Psicología Educativa. Editorial San Marcos.
42
Anexos
Anexo A: Ejemplos De Condicionamiento Operante

43
Ejemplo 1
44
Ejemplo 2
45
Ejemplo 3

Condicionamiento Operante

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Condicionamiento Operante

Caricato da

Copyright:

Formati disponibili

UNIVERSIDAD PRIVADA DE TACNA

FACULTAD DE EDUCACIÓN, CIENCIAS DE LA COMUNICACIÓN Y

ESCUELA PROFESIONAL DE PSICOLOGÍA

“CONDICIONAMIENTO OPERANTE Y CONTRIBUCIONES DE

Sistemas Psicológicos Contemporáneos – Sec. A

Mag. Cristina Beatriz Flores Rosado

Huarachi Perca, Jhon Alexander

Lira Palza, Carlos Humberto

Gutierrez Neyra, Maricielo Reyna

Quispe Mena, Lelyz Yanifer

Mamani Tarqui, Ronaldo Ronald

1. Concepto de Condicionamiento Instrumental......................................................8

2. Leyes básicas de aprendizaje en el condicionamiento instrumental....................9

2.1. Leyes básicas de aprendizaje en el condicionamiento instrumental................9

2.1.1. Ley se asociación..........................................................................................9

2.1.2. Ley del Ejercicio..........................................................................................10

2.1.3. Ley del Efecto..............................................................................................10

2.1.4. Ley de la Disposición...................................................................................10

2.2. Modalidades del condicionamiento instrumental..........................................12

2.2.1. Condicionamiento por recompensa............................................................12

2.2.2. Condicionamiento por evitación.................................................................12

2.2.3. Condicionamiento por omisión...................................................................12

2.2.4. Condicionamiento por castigo....................................................................13

3.1. Modelado de la conducta...............................................................................15

3.1.1. Programas de razón fija..............................................................................16

3.1.2. Programas de intervalo fijo.........................................................................16

3.1.3. Programas de razón variable......................................................................16

3.1.4. Programas de intervalos variables..............................................................17

3.3. Condicionamiento aversivo............................................................................19

3.3.1. Condicionamiento de respuestas emocionales...........................................20

3.3.2. Condicionamiento de escape......................................................................20

3.3.3. Condicionamiento de evitación activa........................................................20

3.3.4. Condicionamiento de evitación pasiva.......................................................20

4. Procedimiento del condicionamiento.................................................................21

4.1. Reforzamiento positivo...................................................................................22

4.2. Reforzamiento negativo.................................................................................23

4.3. Castigo positivo...............................................................................................24

4.4. Castigo negativo.............................................................................................24

5. Fases del Condicionamiento...............................................................................25

5.5. Recuperación espontánea.............................................................................27

6.1. En el reforzamiento continuo.........................................................................27

6.1.1. Razón fija...................................................................................................28

6.1.2. Razón variable............................................................................................29

6.2. El reforzamiento intermitente........................................................................29

6.2.1. Intervalo fijo...............................................................................................29

6.2.2. Intervalo variable........................................................................................30

El efecto de la magnitud del refuerzo sobre la extinción.......................................31

El efecto de la demora del refuerzo.......................................................................32

8. Discriminación y generalización del estímulo.....................................................32

10.2. Ley del efecto..............................................................................................36

10.2.1. Desarrollo de la ley del efecto de Edward Thorndike.................................37

10.2.2. Consideraciones sobre la ley del efecto de Edward Thorndike...................38

Tabla 1: Esquema representativo de la relación estimulo-respuesta-refuerzo en el

Este es un estudio personal de investigación sobre el condicionamiento

Explica además la importancia de los elementos para lograr un

Y por último, pero no menos importante damos a conocer de manera explícita

El condicionamiento Instrumental llamada así principalmente es un tipo de

Principalmente otros autores iniciaron sus investigaciones del

Posteriormente a sus experimentos Thorndike estableció la llamada ley del

Es por todo lo mencionado anteriormente que, en el presente trabajo daremos a

Condicionamiento Antes de continuar con las

desea salir de la jaula. Hay que produce cuando existe un

advertir que en los sucesivos intentos motivo, en ese caso es el hambre

el aprendizaje no fue progresando de y la necesidad de conseguir