Sei sulla pagina 1di 20

1

CONDICIONAMIENTO OPERANTE

* Cerna Monzn, Leticia


** Cortijo Castillo, Jenifer
*** Ros de la Cruz, Jhonny
**** Sanchez Rodriguez, Richar
***** Solar Plasencia, Arelyn

ESTUDIANTE DEL IV CICLO de la escuela profesional de Psicologa Uladech


Catlica, (soledad_aries19@hotmail.com)
ESTUDIANTE DEL IV CICLO de la escuela profesional de Psicologa Uladech
Catlica, (cortijojenn.30@gmail.com)

ESTUDIANTE DEL IV CICLO de la escuela profesional de Psicologa Uladech


Catlica, (Johnnyriosdelacruz4@gmail.com)

ESTUDIANTE DEL IV CICLO de la escuela profesional de Psicologa Uladech


Catlica, (richar.sanchezrodriguez@hotmail.com)

ESTUDIANTE DEL IV CICLO de la escuela profesional de Psicologa Uladech


Catlica, (arelynsolar@hotmail.com)

2017
2

NDICE

Pag

INTRODUCCION...04

CAPITULO I
1. LA CAJA DE SKINNER.05

CAPITULO II
2. LA CONTINGENCIA DE TRES TRMINOS..06
2.1. El estmulo discriminativo06
2.2. La Respuesta.07
2.3. El Reforzador07
2.3.1. Reforzamiento Condicionado.08

CAPITULO III
3. REFORZAMIENTO..09
3.1. Reforzamiento Positivo...09
3.1.1. Primarios, Secundarios, Generalizado...09
3.1.2. Naturales, Artificiales10
3.2. Reforzamiento Negativo...10
3.2.1. Escape10
3.2.2. Evitacin10

CAPITULO IV

4. PROGRAMAS DE REFORZAMIENTO.11
4.1. Programa de Reforzamiento Continuo...,,...11
4.2. Programa de Reforzamiento parcial o intermitente....11
4.2.1. Programa de Razn..11
3

4.2.2. Programa de Intervalo..12


4.3. Otros programas de Reforzamiento....12
4.3.1. Programa de Reforzamiento Mltiple..12
4.3.2. Programa Concurrente..12
4.3.3. Programa de Conjugado o Proporcional..12

CAPITULO V

5. PROCESOS DE CONDICIONAMIENTO...13
5.1. Condicionamiento Instrumental (CI)..13
5.1.1. El Fenmeno / Procedimiento bsico..14
5.2. Conceptos Principales.....14
5.2.1. La Respuesta14
5.2.2. Consecuente.15
5.2.3. Contingencia.....16
5.2.4. Antecedente......16
5.2.5. Estimulo Discriminativo..17
5.2.6. Generalizacin..17
5.2.7. Discriminacin.17
5.2.8. Moldeado o Moldeamiento..18
5.2.9. Adquisicin..18
5.2.10. Extincin..19
5.2.11. Mantenimiento.19

Referencias Bibliogrficas...20
4

INTRODUCCIN

Burrhus Frederic Skinner (1904-1990) ha sido, si no el investigador ms importante, el


principal responsable del aumento del inters en relacin con la problemtica del
reforzamiento. Adems de realizar una extensa investigacin sobre los principales
fundamentos del condicionamiento operante, su trabajo acadmico dio lugar a la
formacin de un gran nmero de investigadores que siguieron desarrollando de forma
muy intensa estos principios. En The Behavior of Organisms (1938) desarrolla la idea de
que los reflejos podran ser estudiados como conducta ms que como un reflejo del
sistema nervioso o de la mente: es aqu donde ya Skinner distingue entre el
condicionamiento de los reflejos de Pavlov y el tipo de aprendizaje que haba propuesto
Thorndike, lo que le llev a formular que la conducta se regula tanto por el
condicionamiento de los reflejos o condicionamiento respondiente como por el operante.
A su vez, mientras Thorndike trataba de explicar su aprendizaje por ensayo y error
mediante asociaciones de naturaleza interna, Skinner se centr en las relaciones
funcionales entre la conducta y sus consecuencias. Para l, tanto el condicionamiento
operante como el respondiente deban slo prestar atencin al estudio de las relaciones
entre los eventos observables y la conducta. Para describir los procedimientos que dan
lugar al reforzamiento de conductas utiliz los trminos condicionamiento operante y
condicionamiento instrumental. El trmino operante refleja la capacidad que tiene el
individuo para operar sobre su ambiente, mientras que el trmino instrumental tiene en
cuenta el hecho de que la conducta del sujeto es el instrumento para obtener el reforzador.
La innovacin tcnica ms importante que introdujo Skinner con respecto a Thorndike
fue utilizar en sus experimentos una respuesta que el sujeto poda ejecutar repetidamente
sin intervencin del experimentador. En el caso de los experimentos con ratas esta
respuesta fue la presin de palanca, mientras que en los experimentos con palomas utiliz
el picoteo del animal sobre una tecla. Este tipo de procedimientos experimentales son
conocidos como de operante libre para distinguirlos de los de ensayo discreto que
utilizaba Thorndike en sus trabajos. En ellos, la respuesta puede ocurrir en cualquier
momento y de forma repetida mientas el sujeto permanezca en la caja de
condicionamiento. La variable dependiente medida y analizada en este modelo es la tasa
de respuesta o nmero de respuestas emitidas por unidad de tiempo, en lugar de la
latencia, utilizada por Thorndike como medida del aprendizaje.
5

CAPITULO I
LA CAJA DE SKINNER

Segn Ferster (1974) citado por Sierra (2013). El aprendizaje de un ratn en la caja de
skinner comienza con una privacin de comida la cual consiste en que el indispensable
privar de ella al animal antes de que el estmulo incremente con la efectividad, la
frecuencia de la conducta a la que siga la comida. Hablamos de privacin de comida dado
el nmero horas transcurrido desde que el animal comi por ltima vez. Luego se
introduce el ratn a la caja de skinner, la cual contiene una palanca de respuestas y un
dispensador de comida, se utiliza un equipamiento electrnico para programar
procedimientos y registrar respuestas automticamente. El sujeto experimental es
sometido a una aproximacin sucesiva que consiste en que el sujeto se adapte al medio
en el que est. El reforzador o estimulo reforzante es el acontecimiento que incrementa la
frecuencia de la ejecucin a la que sigue de modo inmediato, para elevar la frecuencia de
una ejecucin, hacemos que suceda un estmulo reforzante; y el reforzamiento habr sido
efectivo si aumenta la frecuencia de la ejecucin. El termino condicionamiento lo usamos
por lo general para denotar un cambio en la conducta operante resultado del
reforzamiento. As, cuando decimos que una ejecucin operante ha sido condicionada
significa, por ejemplo, que su frecuencia de ocurrencia ha sido incrementada por
reforzamiento. En manera de condicionamiento operante, aprendemos la manera de
elevar y disminuir la frecuencia de ejecuciones operantes con procedimientos de
reforzamiento. La conducta operante comprende las ejecuciones cuya frecuencia se
incrementa por reforzamiento. Las ejecuciones operantes se contraponen a las reflejas en
que en medio producen un cambio dentro del organismo. El resultado de los
procedimientos de condicionamiento instrumental depende en parte de la naturaleza de la
respuesta que se est condicionando. Algunas respuestas son ms fcilmente modificadas
que otras. La magnitud de la respuesta y del estmulo tiene singular importancia en
materia de reflejos ya que constituyen las dimensiones significantes de los
acontecimientos. En general, la magnitud de la respuesta es el efecto principal del
condicionamiento del reflejo y la magnitud del estmulo controla en alto grado la
magnitud de la respuesta.
6

CAPTULO II
LA CONTINGENCIA DE TRES TRMINOS

Suarez (2014). Para adentrarnos en el estudio del condicionamiento operante es necesario


conocer una serie de conceptos y trminos que nos permitan establecer los procedimientos
utilizados en estos estudios, as como poder asimilar posteriormente las teoras surgidas
a partir de estas investigaciones. En el condicionamiento operante se suele mantener que
existe una contingencia entre la respuesta y el reforzador, es decir, la consecuencia est
relacionada con la presentacin de la respuesta. Sin embargo, la conducta operante puede
ponerse bajo el control de los estmulos antecedentes y, la descripcin de la conducta
operante requiere habitualmente de tres trminos elementales y sus interrelaciones
funcionales. Estos tres trminos fundamentales son el estmulo discriminativo, la
respuesta y la consecuencia. De este modo la contingencia se redefine como: en presencia
de un estmulo especfico, el reforzador se presentar si y solo si la respuesta operante
sucede. La contingencia de tres trminos constituye la unidad fundamental de anlisis en
el estudio de la conducta operante.

2.1. El estmulo discriminativo

Suarez (2014). La conducta no se compone siempre de respuestas discretas, sino que,


como sealamos al establecer la contingencia de tres trminos, la deberamos considerar
como la ejecucin que ocurre despus de un estmulo que en un momento determinado
tiene como resultado una consecuencia especfica. Esto nos viene a sealar que los
estmulos antecedentes tambin tienen una gran importancia en el condicionamiento
operante. Sin embargo, las claves contextuales juegan un papel bastante diferente que en
el condicionamiento clsico. Estos estmulos, en el caso del condicionamiento operante,
reciben el nombre de estmulos discriminativos (Eds). En el condicionamiento operante
estos eventos no provocan la aparicin de la respuesta, sino que sealan la ocasin para
que si la conducta se presenta sea seguida por una consecuencia, es decir, un estmulo, en
principio neutro, puede indicar que una respuesta puede llevar a la aparicin de la
consecuencia, es decir, indica si el reforzador est disponible y, por tanto, informa al
sujeto de cundo ha de responder. El reforzamiento diferencial implica reforzar una
operante en una situacin, pero no en otra, pero, aunque la probabilidad de emitir una
7

operante en presencia de un Ed puede ser muy alta, esto significa que ese estmulo ejerce
un control sobre esa respuesta, pero no que el Ed provoque la respuesta.

Suarez (2014). Las consecuencias de las respuestas operantes establecen el control que
ejercen los estmulos discriminativos. Cuando un Ed es seguido de una respuesta cuya
consecuencia es apetitiva esa respuesta se ve reforzada y ello hace que la probabilidad de
que la operante ocurra aumente si en una ocasin posterior dicho estmulo est presente.
Cuando una operante no es seguida de una consecuencia reforzante, el estmulo que
precede la respuesta se conoce como estmulo delta (E). En presencia de un E la
probabilidad de emitir la operante disminuye. El trmino control por el estmulo se refiere
a cmo los estmulos que preceden una conducta pueden controlar la ocurrencia de esa
conducta.

2.2. La respuesta

Suarez (2014). En el caso del condicionamiento instrumental, la respuesta operante se


define por los efectos que provoca en el ambiente. Cuando una respuesta produce el
mismo efecto que otra respuesta estaremos hablando de la misma operante. La operante
se define por su funcin y no por su forma o topografa, es decir, las respuestas que
producen los mismos efectos sobre el ambiente son ejemplos de la misma operante. En el
caso de la presin de palanca que ejercen las ratas para conseguir comida en una caja de
Skinner, los animales pueden presionar la palanca con el morro o con la cola, las dos
respuestas producen los mismos efectos (que se libere una bolita de comida) y, por ello,
son ejemplos de una misma operante.

Segn Skinner (1953) citado por Suarez (2014). El trmino enfatiza el hecho de que la
conducta opera sobre el ambiente para generar consecuencias. Las consecuencias definen
las propiedades en funcin de las cuales las respuestas se consideran similares. El trmino
se usar como adjetivo (conducta operante) y como sustantivo que designa la conducta
definida por una consecuencia dada.

2.3.E l reforzador

Para el condicionamiento instrumental, el trmino reforzador debe dar cabida a la gran


variedad de estmulos y eventos que poseen la capacidad de reforzamiento de una
conducta. De este modo el reforzador no puede definirse simplemente segn sus
caractersticas fsicas sino ms bien en funcin de los efectos que ste tiene sobre la
8

conducta. Segn esta definicin funcional, un reforzador es cualquier suceso o evento que
al hacerse contingente con una respuesta cambia la probabilidad de aparicin de esa
respuesta en el futuro. Sobre esta cuestin veremos una discusin ms especfica en
captulos posteriores.

2.3.1. Reforzamiento condicionado

Suarez (2014). Es importante tener en cuenta en relacin con el anlisis de la conducta


humana que muy frecuentemente no es controlada por reforzadores primarios como
puede ser la comida, sino por eventos cuyos efectos dependen de la historia de
reforzamiento. Los elogios o cumplidos que nos hacen, las crticas o juicios que hacen
sobre nuestro comportamiento o, el dinero, son consecuencias que pueden fortalecer o
debilitar la ocurrencia de una conducta. Este tipo de eventos adquieren los efectos que
producen debido a las experiencias que la gente ha tenido con ellos a lo largo de sus vidas
y ello hace que la misma consecuencia pueda tener efectos distintos dependiendo de la
experiencia personal del sujeto.

Cuando estos procedimientos para el estudio del reforzamiento condicionado se llevan a


cabo en el laboratorio los resultados encontrados en los experimentos son en muchos
casos contradictorios. Uno de los problemas ms habituales es que cuando entran en juego
los procesos de extincin, los reforzadores condicionados pueden perder su efectividad
en poco tiempo y mantener su capacidad reforzadora durante pocas respuestas. Segn
Suarez (2014) investigadores como Alferink, Crossman y Cheney (1973) han demostrado
que el reforzamiento condicionado que proporciona la luz situada junto al comedero de
la caja de Skinner es efectivo para mantener el picoteo incluso en situaciones
experimentales en los que los animales tienen que picotear una tecla hasta 300 veces para
que la luz se encienda. Aunque hasta el momento la investigacin de laboratorio no ha
arrojado resultados del todo concluyentes en cuanto a la duracin del reforzamiento
condicionado, la experiencia con el reforzamiento condicionado en la vida diaria sugiere
que eventos de este tipo pueden reforzar gran cantidad de conductas sin extinguirse. La
conducta de los animales est conformada por secuencias de conducta complejas que son
mantenidas en muchos casos por reforzamiento condicionado y, esto es bastante evidente
en la especie humana, en la que multitud de conductas se mantienen da a da como
consecuencia del reforzamiento condicionado.
9

CAPITULO III

REFORZAMIENTO

Skinner consider que su investigacin sobre los programas de reforzamiento constitua


el principal aporte de su obra. El gran descubrimiento del condicionamiento operante es
que la conducta de un organismo cualquiera cae bajo el control de ciertos estmulos
debido a sus consecuencias, y los programas de reforzamiento establecan las diferentes
relaciones temporales en que poda darse dicho control. A travs de ellos Skinner pudo
dar cuenta de una gran cantidad de fenmenos, en particular del comportamiento humano,
que caan dentro de lo que se denominaba conducta voluntaria, y se crean
indeterminados. Los hallazgos de los programas de reforzamiento constituyen algunas de
las pocas leyes bien establecidas e incontrovertibles de la psicologa entendida como
ciencia del individuo

3.1. Reforzamiento Positivo

Bados (2011). Un reforzador positivo es un estmulo (evento, conducta u objeto) cuya


presentacin contingente a una conducta da lugar a un aumento o mantenimiento de esta,
de modo que este aumento o mantenimiento es menor o no se da cuando la presentacin
es no contingente. Se han distinguido diversos tipos de reforzadores positivos:

3.1.1. Primarios, secundarios, generalizados: Los reforzadores primarios o


incondicionados son aquellos que no requieren de experiencias de aprendizaje para
funcionar como reforzadores; comida, bebida, contacto sexual. Los reforzadores
secundarios o condicionados son aquellos que adquieren su capacidad reforzante
mediante la asociacin con otros reforzadores primarios o secundarios o mediante la
asociacin con la retirada de estmulos aversivos. Los reforzadores generalizados son
reforzadores condicionados asociados con diferentes reforzadores primarios y/o
secundarios; ejemplos son la aprobacin, el afecto, la atencin, la sumisin, el dinero y
los puntos en una economa de fichas. Son fciles de administrar y especialmente eficaces
porque permiten acceder a una variedad de reforzadores y, por tanto, no dependen de un
estado especfico de privacin como cuando se utiliza un nico reforzador primario o
secundario. En ocasiones siguen siendo eficaces aun cuando ya no sean acompaados por
los reforzadores en que se basan.
10

3.1.2. Naturales, artificiales: Los reforzadores naturales son aquellos que se emplean
habitualmente en el medio de la persona para reforzar la conducta en cuestin; por
ejemplo, premiar la conducta de estudio con alabanzas y buenas notas. Los reforzadores
artificiales son aquellos que no se emplean habitualmente en el medio de la persona para
reforzar la conducta en cuestin; por ejemplo, premiar la conducta lectora con partidas de
parchs o paseos en bicicleta.

Bados (2011). El reforzamiento positivo es un procedimiento que consiste en presentar


un supuesto reforzador positivo contingentemente a una conducta con el objetivo de
incrementarla o mantenerla. Al igual que el resto de tcnicas operantes, el reforzamiento
positivo puede definirse no slo como un procedimiento, sino tambin como un proceso:
incremento o mantenimiento de una conducta como resultado de la presentacin de un
evento (reforzador positivo) contingentemente a dicha conducta.

3.2. Reforzamiento Negativo

Bados (2011). El reforzamiento negativo consiste en retirar, reducir o prevenir un


supuesto estmulo aversivo o terminar o prevenir la prdida de un supuesto reforzador
positivo contingentemente a una conducta con el objetivo de incrementarla o mantenerla.
Pueden distinguirse dos clases de reforzamiento negativo: escape y evitacin.

3.2.1. Escape: Consiste en retirar o reducir un supuesto estmulo aversivo o terminar la


prdida de un supuesto reforzador positivo contingentemente a una conducta con el
objetivo de incrementarla o mantenerla.

3.2.3. Evitacin: Consiste en presentar un supuesto estmulo aversivo o retirar un


supuesto reforzador positivo contingentemente a la no emisin de una conducta. As pues,
sta aumenta o se mantiene debido a que previene o pospone contingentemente la
aparicin de un estmulo aversivo o la prdida de un reforzador positivo.

Bados (2011). El reforzamiento negativo es un procedimiento muy habitual en la vida


cotidiana, pero poco utilizado en la clnica. En este contexto, slo se aplicara cuando en
el propio entorno del sujeto ya existen condiciones que le resultan aversivas. Por ejemplo,
terapeuta y padres pueden acordar con un adolescente que, si estudia media hora ms al
da, podr librarse una vez a la semana de una tarea domstica que no le gusta. En general,
la tcnica a elegir para incrementar o mantener conductas es el reforzamiento positivo.
11

CAPITULO IV

PROGRAMAS DE REFORZAMIENTO

Segn Salazar (2003). Los programas de reforzamiento son "reglas", que determinan
cuando seguir la entrega o presentacin contingente de un reforzador a la presentacin
de una respuesta o conducta. Existen diferentes tipos de programas de reforzamiento, de
los cuales, definiremos los ms significativos.

4.1. Programa de reforzamiento continuo


Se llama a este tipo de programa, cuando el refuerzo es manifestado en cada momento
de ser producida una respuesta. Ejemplo: Cuando en una clase, un alumno levanta la mano
para dar su opinin, el profesor pronuncia su nombre dndole la palabra.
4.2. Programa de reforzamiento parcial o intermitente
Este reforzamiento se da cuando son reforzadas solo algunas de las conductas emitidas
por el organismo, no todas. En la vida cotidiana, en el colegio, universidad, etc., se dan
estos tipos de programas. Ejemplo: Cuando llamamos a una persona por telfono, y esa
persona no se encuentra, la conducta no ha sido reforzada; no queriendo decir con ello
que no ocurra la prxima vez.
Segn los experimentos realizados por Skinner, los programas de reforzamiento parcial,
son bastante estables y mantienen la conducta por periodos ms largos que los programas
de reforzamiento continuo.
Los programas de reforzamiento parcial o intermitente, pueden programarse teniendo en
cuenta el nmero de respuestas o tambin el tiempo que transcurre. Por lo tanto, hay que
tomar en consideracin:
- Programa de razn
- Programa de intervalo

4.2.1. Programa de razn: Estos programas consideran el nmero de respuestas antes de


presentar un reforzador, es decir, el reforzador depende de la conducta del organismo en
base al nmero de respuestas de este.
Este programa se subdivide en dos:
- Razn fija: Que es cuando el reforzamiento se da cada vez que el sujeto cumple con un
determinado nmero de repuestas que se ha establecido de antemano. Ejemplo: Si se le
dice a un vendedor, que por cada diez helados que venda, uno ser para l, la razn fija
ser 10.
- Razn variable: los reforzamientos ocurren despus de una cantidad variable de
respuestas, no despus de un nmero fijos. Esta cantidad difieren de reforzamiento en
reforzamiento. Ejemplo: Si al mismo vendedor se le dice ahora, en base a un
12

establecimiento previo de la cantidad variable, que se le dar el reforzamiento (dar el


helado) cuando venda el primer helado, el segundo reforzamiento le ser dado cuando
venda el tercer helado, el tercero cuando venda el cuarto y el cuarto cuando venda ocho.
As el valor de la razn variable se designa por el promedio de estas, (1-3-4-8) cuya suma
seria 16 en este caso, siendo el promedio cuatro.
4.2.2. Programa de intervalo: Son aquellos que toman la cantidad de tiempo transcurrido
antes de proporcionar el reforzador. Los programas de intervalo se definen en funcin del
tiempo, pero se refuerzan en base a la primera respuesta que se obtiene luego de
transcurrido el tiempo previsto; es decir, el reforzamiento, cualquiera que sea el programa
seguido (de razn o de intervalo) siempre debe ser consecuencia de una respuesta. Existen
dos tipos de programas de intervalo:
- Intervalo fijo: que son aquellos en donde se establece un intervalo, donde al trmino
de este, se refuerza la primera respuesta que se emita.
- Intervalo variable: es cuando se establece un determinado intervalo variable, por
ejemplo 2-4-7; y en donde se refuerza la primera conducta transcurrido el tiempo.
Ejemplo: Si el intervalo es 2-4-7 se reforzar la primera conducta transcurridos los
dos primeros minutos, luego se refuerza la primera conducta pasados cuatro
minutos y finalmente se reforzar la primera conducta pasados siete minutos. El
promedio de estos ser el valor del intervalo variable

4.3. Otros programas de reforzamiento


4.3.1. Programa de reforzamiento mltiple
Salazar (2003). Consiste de dos o ms programas independientes, los cuales se presentan
al organismo en forma sucesiva, cada uno de ellos en presencia de un estmulo
caracterstico. Los programas mltiples son programas combinados, en los que se agrega
un estmulo discriminativo caracterstico.
4.3.2. Programa concurrente
Estn formados, tambin, por dos o ms programas. A diferencia del mltiple, los
programas no son sucesivos, sino simultneos; es decir, que el sujeto puede emitir dos
respuestas distintas que se refuerzan simultneamente por programas independientes,
pero paralelos en el tiempo. Los reforzamientos previstos en cada programa son
independientes entre s. Este tipo de programa se utiliza cuando se desea reforzar ms de
una respuesta a la vez, como ocurre en los programas de conducta social.
4.3.2. Programa de conjugado o proporcional
En estos programas, se establece una proporcin entre cierta medida de la conducta en
cierta medida del reforzamiento. Por lo general, estas medidas estn dadas por la
frecuencia del reforzamiento, pero tambin pueden seguir propiedades tales como la
magnitud de la respuesta y la magnitud del reforzamiento. En este programa, cuanto ms
responde el sujeto, ms reforzamiento recibe, hay una proporcin directa entre conducta
y reforzamiento. La relacin tambin puede ser inversa; dependiendo de los propsitos
del programa.
13

CAPITULO V
PROCESOS DE CONDICIONAMIENTO

Segn Reynolds, G. (1968) El procedimiento bsico para realizar condicionamiento


respondiente, comprende la presentacin repetida de un estmulo incondicionado dentro
de un arreglo temporal fijo y regular, con el estmulo que se va a condicionar. El estmulo
incondicionado se abrevia con las iniciales EI, y el estmulo condicionado se abrevia con
las iniciales EC. Por lo tanto, el procedimiento de condicionamiento respondiente
establece la presentacin del EC junto con el EI. Despus de que se han efectuado
suficientes presentaciones de los dos estmulos, al presentar nicamente el EC, evocar
por s solo la respondiente que inicialmente solo era evocada por el EI. En el
condicionamiento operante, una respuesta va seguida de un estmulo (reforzante); en el
condicionamiento respondiente, la presentacin de un estmulo (EC), va seguida de la
presentacin de otro estmulo (EI). En el condicionamiento operante, el estmulo
reforzante no ocurrir a menos de que ocurra la respuesta. En el condicionamiento
respondiente, el EC y el EI ocurren dentro de una secuencia regular, sin importar lo que
el organismo est haciendo.

5.1. - Condicionamiento instrumental (CI)


Segn Reynolds, G. (1968). El condicionamiento instrumental (CI) constituye uno de
los mecanismos de aprendizaje de mayor importancia terica y prctica: por una parte, es
seguramente el ms investigado y mejor comprendido, y por otra es fuente de algunas de
las ms significativas aplicaciones de la psicologa a problemas concretos. En una
primera aproximacin, se trata del mecanismo que permite a un organismo aprender
cules de sus acciones se relacionan con resultados beneficiosos y cules con resultados
nocivos en un ambiente dado. Es decir, es el mecanismo de aprendizaje basado en premios
y castigos. El organismo aprende a realizar ms frecuentemente comportamientos que
demuestran tener consecuencias beneficiosas, y a abandonar aquellas conductas cuyas
consecuencias resultan ser dainas.

El condicionamiento clsico o pavloviano (CC) permite a un organismo aprender acerca


de las seales que presagian eventos importantes: aspectos de su entorno que no le
resultan controlables. El CI, por el contrario, permite a un organismo aprender a controlar
ciertos aspectos del medio mediante su conducta.

El condicionamiento instrumental, por tanto, se diferencia del CC en un aspecto esencial:


En el CI, la secuencia de sucesos depende de la conducta del organismo. En el CC, lo que
sucede a lo largo de una sesin est prefijado por el psiclogo, en el caso de un
experimento o una intervencin profesional, o viene dado por el ambiente en las
situaciones naturales. En todo caso, en el CC la secuencia de estmulos que el organismo
recibe es la misma independientemente de lo que haga.
14

En sentido estricto, el C. Operante es un caso particular de C. Instrumental. El C.


Instrumental, como ya hemos dicho, se refiere a los mecanismos por los cuales un
organismo aprende a dar una respuesta ms frecuentemente (o menos) en virtud de los
eventos (o consecuencias) que siguen sistemticamente a dicha respuesta. El C.
Operante se refiere a los casos en los que dicha respuesta se define como un operante, es
decir, en virtud de sus propiedades funcionales. Sin embargo, la importancia relativa del
C.operante es tan grande que a menudo ambos trminos (operante e instrumental)
aparecen intercambiados.

5.1.1. El fenmeno/procedimiento bsico

En una situacin estimular dada (antecedente), una respuesta emitida por un organismo
va seguida sistemticamente por un cierto tipo de suceso ambiental (consecuente o
consecuencia). A medida que la situacin se repite, la fuerza o la probabilidad de la
respuesta se ve modificada.

Cuando la respuesta resulta aumentada o fortalecida, decimos que el consecuente es un


refuerzo o reforzador. Cuando la respuesta resulta debilitada o reducida, llamamos al
consecuente castigo.

En el caso ms sencillo, se sita a un organismo en una determinada situacin controlada


(e.g., en una caja de Skinner y con cierto grado de privacin previa de alimento), y se le
suministra como consecuente (reforzador) una cierta cantidad de comida cada vez que
emite una respuesta concreta y predeterminada por el psiclogo (apretar una palanca,
picotear un disco, etc.). Se comprueba que la frecuencia de la respuesta elegida aumenta
sistemticamente a medida que transcurre el tiempo. A la inversa, se puede disear una
situacin en la que la respuesta vaya seguida, por ejemplo, por una descarga elctrica. En
tal caso, la R tender a darse menos o a desaparecer (Reynolds, G. 1968).

5.2. Conceptos Principales

5.2.1. Respuesta

La respuesta objeto de condicionamiento instrumental puede ser, en principio,


cualquiera que est incluida en el repertorio conductual del organismo. Puede ser desde
la respuesta ms simple hasta una secuencia conductual compleja.

Las respuestas de carcter innato, relacionadas con funciones muy vitales para el
organismo (alimentacin, reproduccin, etc.), son muy difciles de modificar por
condicionamiento (incluso imposibles, en algunos casos) y siempre existe el riesgo de
15

producir alteraciones psicopatolgicas al contravenir tendencias muy potentes y


arraigadas (por ejemplo, si aplicamos consecuentes dolorosos a la conducta de comer, el
organismo puede sufrir un serio desequilibrio psicolgico). En general, el
condicionamiento funciona ptimamente sobre conductas previamente aprendidas por el
organismo, cuyo componente innato sea escaso o nulo. Estas, particularmente en nuestra
especie, son la inmensa mayora (Reynolds, G. 1968).

Un tipo especialmente importante lo constituyen los operantes o respuestas operantes.


Un operante es una respuesta definida por sus propiedades funcionales o funcionalidad,
es decir, por los efectos que opera en el ambiente (de ah su nombre). As, por ejemplo,
cualquiera de las formas en que un organismo puede accionar una palanca se considera
como casos de una misma respuesta u operante. Es decir, puede ignorarse por ejemplo la
morfologa concreta de la respuesta (que se ejecute con un miembro u otro, con
movimientos diferentes, etc.) o la intensidad concreta (siempre que sea suficiente para
cerrar el contacto).

5.2.2. Consecuente

Suceso que afecta sistemticamente a la fuerza o probabilidad de la respuesta a la que


sigue consistentemente.

Reforzador o refuerzo: es un consecuente que aumenta la fuerza o la frecuencia de R a


la que sigue.

Un refuerzo puede ser positivo (p.ej. aparicin o administracin de un E apetitivo) o


negativo (no-aparicin o retirada de un E aversivo).

Castigo: es un consecuente que reduce la fuerza o la frecuencia de R a la que sigue.

Un castigo puede tambin ser positivo (p.ej. aparicin de un suceso aversivo) o negativo
(no-aparicin o retirada de un suceso apetitivo).

Es muy importante no confundir un reforzador con un estmulo o suceso agradable.


Un suceso es un reforzador, por definicin, en virtud de su efecto en el aumento de la
respuesta a la que sigue, y no por su supuesta induccin de un estado subjetivo en un
organismo
16

Asimismo, es importante observar que el refuerzo o el castigo no tienen por qu ser


necesariamente estmulos. Por ejemplo, el permitir o impedir al organismo realizar
determinadas conductas pueden actuar como refuerzos o castigos respectivamente.

5.2.3. Contingencia

Es la relacin estadstica entre la emisin de una respuesta y la aparicin de un


consecuente. A menudo se emplea la expresin "contingencias de refuerzo" para referirse
al proceso por el cual un organismo ha adquirido o mantiene una determinada respuesta.

Una contingencia de refuerzo o castigo puede ser mayor o menor. Es mxima en el caso
de que siempre que el organismo emita la respuesta, y slo entonces, recibe el
consecuente. Por el contrario, puede suceder que el consecuente no siga siempre a la R,
sino slo a veces, y que adems el organismo reciba el consecuente en ocasiones sin haber
emitido la R. En tal caso la contingencia es ms baja.

La relacin entre la magnitud de la contingencia y la fuerza del condicionamiento no es


simple ni lineal: o Si el organismo puede recibir el consecuente sin realizar la conducta,
esto debilita el condicionamiento. o Si el organismo recibe el consecuente slo en una
pequea fraccin de las ocasiones en que emite la conducta, esto puede fortalecer
muchsimo el efecto del condicionamiento. Este tipo de efectos son muy importantes en
la prctica, y se vern con detalle ms adelante.

5.2.4. Antecedente

Estmulo o configuracin estimular que permite al organismo identificar la situacin en


que est activa una contingencia de refuerzo o de castigo (la casa de los abuelos, la
cafetera de la facultad, el aula, el grupo de amigos, el comedor de casa)

Algunos casos de condicionamiento se producen de tal manera que el aprendizaje queda


muy vinculado al antecedente. Por ejemplo, un adolescente aprende que cierto tipo de
bromas son muy celebradas en su grupo de amigos, pero en ningn otro sitio.

En otros casos de condicionamiento, el historial de aprendizaje ha hecho que una


conducta sea relativamente independiente del antecedente. Por ejemplo, algunas personas
tienden a bromear en cualquier contexto que se encuentren, mientras otras han aprendido
a retraerse en casi cualquier lugar.
17

Cuando el antecedente se puede identificar con uno (o unos pocos) estmulos concretos,
llamamos a stos estmulos discriminativos

5.2.5. Estmulo discriminativo

Estmulo cuya presencia es informativa sobre la disponibilidad de un consecuente. Es


decir, indica si la contingencia est "activa" o no.

Estrictamente hablando, es lo mismo que antecedente. Sin embargo, como ya hemos


observado, lo ms comn es llamar estmulos discriminativos slo a los antecedentes
concretos y puntuales, como una palabra, una imagen concreta, un sonido particular, etc.

En las situaciones controladas (laboratorio, clnica etc.), su uso es opcional: no tiene por
qu haber un E discriminativo explcito. Sin embargo, en la prctica, su importancia es a
menudo crucial: de un buen anlisis y manejo de los Estmulos discriminativos puede
depender el xito del proceso de condicionamiento.

Se suele denotar ED o E+ a los estmulos que indican la disponibilidad de un


consecuente (que la contingencia est vigente o activa), y E o E- a los que informan de
su no-disponibilidad (contingencia no vigente o inactiva).

5.2.6. Generalizacin

En el Condicionamiento Clsico la generalizacin es la tendencia de un estmulo similar


al estmulo incondicionado a producir una respuesta parecida a la respuesta condicionada.
La Generalizacin en el Condicionamiento Operante implica dar la misma respuesta ante
estmulos similares. Es de especial inters la magnitud en que la conducta se generaliza
se una situacin a otra. Por ejemplo, si el cumplido de un docente provoca que el
estudiante trabaje con mayor empeo Se generalizar el mayor esfuerzo del estudiante
fuera de la clase o a las tareas en la casa?

En el caso del CI, es el grado en que el organismo extiende el efecto del aprendizaje
a situaciones antecedentes diferentes de aquellas en las que originalmente aprendi.

5.2.7. Discriminacin

Aprender a efectuar o no efectuar una respuesta en funcin de cambios (que pueden ser
muy pequeos) en el antecedente.
18

La Discriminacin en el Condicionamiento Operante se refiere a la diferenciacin de


estmulos o eventos ambientales. Esto puede parecer sumamente sencillo, pero es
importante porque el mundo de los estudiantes est lleno de ste tipo de estmulos
discriminativos donde se pueden incluir letreros como "No entrar", "Silencio", entre
otros.

Por ejemplo, un nio puede aprender a realizar frecuentemente una conducta en casa de
sus tos (donde es reforzada) y a no realizarla nunca en casa de sus padres (donde no lo
es, o resulta castigada).

5.2.8. Moldeado o moldeamiento

Dado que debemos esperar a que ocurra una respuesta para que la podamos reforzar,
parecer imposible crear nuevas conductas operantes. No obstante, la conducta operante
nueva o que no existe en el repertorio de un organismo, puede ser creada mediante un
proceso llamado moldeamiento, el cual emplea una combinacin de reforzamiento y de
no-reforzamiento, para cambiar las respuestas simples ya existentes en respuestas nuevas
ms complejas. Para poder entender cmo se lleva a cabo el moldeamiento y cmo es que
ste funciona, debemos considerar antes algunos efectos del reforzamiento y de la
ausencia de reforzamiento sobre la conducta (Reynolds, G. 1968).

Consecucin gradual de una R que no estaba presente en el repertorio conductual del


organismo (o lo estaba con una probabilidad muy baja) mediante reforzamiento de
respuestas que constituyen aproximaciones sucesivas a la R deseada.

Tiene gran importancia prctica, ya que es el principal procedimiento de aprendizaje de


Rs genuinamente nuevas para el organismo.

Importante: no confundir con modelado, que es un proceso de aprendizaje basado en


imitacin de la conducta de alguien que sirve de modelo.

5.2.9. Adquisicin

Periodo y situacin en el que se produce el condicionamiento, es decir, el aprendizaje


de una contingencia de refuerzo o castigo. En laboratorio o clnica, se llama as tambin
al procedimiento concreto empleado para ello.
19

5.2.10. Extincin

La extincin de la conducta respondiente condicionada, se lleva a cabo presentando


varias veces el EC sin el EI. La magnitud de la respuesta evocada por el EC y el porcentaje
de presentaciones del EC que evoca la respuesta, se reducen gradualmente a medida que
se presenta el EC durante varias veces sin el EI. La extincin dentro del condicionamiento
respondiente no es la misma que la extincin dentro del condicionamiento operante. En
la extincin operante, la respuesta deber ocurrir sin ser reforzada. En la extincin
respondiente, el EC deber ser presentado durante varias veces sin que se presente el EI.
Sin embargo, las presentaciones eventuales del EI, podrn ser suficientes para que
contine activa la efectividad del EC (Reynolds, G. 1968).

5.2.11. Mantenimiento

Cualesquiera circunstancias que impiden que una conducta entre en extincin.


Normalmente, son contingencias de refuerzo (sea R+ o R-).

El anlisis del mantenimiento de las conductas problemticas es uno de los aspectos ms


importantes de la intervencin clnica, ya que a menudo es difcil y al tiempo resulta clave
para el xito de la intervencin.
20

REFERENCIAS BIBLIOGRFICAS

- Sierra. (2013). Aprendizaje De Palanqueo En Un Ratn De Laboratorio. Bogota


D.C: Trillas.

- Suarez. (2014). Psicologa del aprendizaje. Madrid, ES: UNED - Universidad


Nacional de Educacin a Distancia. Extrado de: http://www.ebrary.com

- Bados. (2011). Tcnicas Operantes. Barcelona: Piramide

- Salazar. (2003). Psicologa: Un aporte a la Educacin. Santiago de Chile:


Editor Universidad Arturo Prat.

- Reynolds, G. (1968). Compendio de Condicionamiento Operante. San Diego,


Universidad de California. Extrado de:
https://s3.amazonaws.com/academia.edu.documents/44132285/Reynolds.pdf?A
WSAccessKeyId=AKIAIWOWYYGZ2Y53UL3A&Expires=1508819200&Sign
ature=7jY8VGQN3mUtMB8HMMvDk9N73qI%3D&response-content-
disposition=inline%3B%20filename%3DCOMPENDIO_DE_CONDICIONAM
IENTO_OPERANTE_A.pdf