Sei sulla pagina 1di 5

28 de Febrero de 2014

Aprendizaje (Parte II)

Origen del estudio del Condicionamiento Instrumental u Operante


Condicionamiento Instrumental u Operante
Fenmenos del Aprendizaje por Condicionamiento Instrumental u Operante

Origen del estudio del Condicionamiento Instrumental u Operante


Uno de los pioneros en el rea de aprendizaje fue el norteamericano Edward Lee
Thorndike (1874 -1949). Este cientfico utiliz, en la mayora de sus estudios,
gatos hambrientos que eran colocados en cajas de truco de la cuales tenan que
escapar para alcanzar el alimento que estaba justo fuera de la caja. Para salir, los
gatos deban alzar un pestillo o bien apretar un pedal. Cuando se colocaban en la
caja, una primera vez, los gatos hacan muchos movimientos hasta que, por
casualidad, alguno de ellos accionaba el mecanismo y lo liberaba, permitindole
alcanzar la tan ansiada comida (Keller, 1978).
Thorndike repeta este procedimiento muchas veces y lo que observ fue que, a
medida que aumentaba el nmero de veces que el gato era colocado en la caja,
ms rpido lograba salir de ella. A partir de estas observaciones Thorndike
estableci la Ley del Efecto que corresponde a uno de los principios
fundamentales del mecanismo de aprendizaje instrumental u operante.
La ley del efecto seala que, de todas las respuestas que un sujeto realiza en una
misma situacin, aquella que va seguida o acompaada por satisfaccin ser la
que, en una situacin futura similar, se repetir con ms frecuencia. Al contrario,
aquellas respuestas que van seguidas o acompaadas por perturbacin o
desagrado, ser menos probable que se repita.
De esta manera, Thorndike formul una teora sobre el aprendizaje basada en las
consecuencias de la conducta. Consider que este tipo de aprendizaje era
instrumental, y supona una asociacin entre los estmulos presentes en el inicio
de la conducta y la respuesta adquirida.

Condicionamiento Instrumental u Operante


Las investigaciones DE Thorndike fueron la base para los trabajos realizados
posteriormente por B.F Skinner (1904-1990), una de las figuras ms relevantes
dentro de la psicologa del aprendizaje.
Para Skinner, la mayor parte de la conducta de los sujetos est regulada por las
relaciones que el organismo establece con su ambiente; considera que los sujetos
operan su ambiente y obtienen as resultados que le permiten la sobrevivencia y la
propagacin de la especie.

28 de Febrero de 2014
El anlisis de la conducta propuesto por Skinner requiere de la consideracin de
tres trminos:

Los antecedentes de la conducta: corresponden a los estmulos


presentes antes de la emisin de la respuesta y se los conoce ms
tcnicamente como Estmulo Discriminativos (ED)
La respuesta: es la conducta que se emite, corresponde generalmente a la
tasa de respuesta (Rs). La tasa de respuesta corresponde al nmero de
respuestas realizadas en un tiempo determinado.
Las consecuencias: es el resultado de la conducta operante, esta pueden
ser, a su vez, de dos tipos: en un caso puede ocurrir que aumenten la
probabilidad de repetir la misma conducta en el futuro; en otros casos, los
resultados pueden conducir a que dicha conducta disminuya su
probabilidad de ocurrencia en el futuro (Tarpy, 2000).

As, los trminos claves del Condicionamiento Operante, se representan en la


figura 1:

Reforzamiento Positivo
Reforzamiento Negativo
ED

Rs

Consecuencias
Castigo

Figura 1. Trminos claves en Condicionamiento Operante

Reforzador: es cualquier estmulo que incrementa la probabilidad de que


una conducta o respuesta se repita en el futuro (Hilgard y Marquis, 1980).
o Reforzadores Primarios: estmulo que satisfacen una necesidad
biolgica (por ejemplo, el agua o la comida).
o Reforzadores Secundarios: aquellos que tienen el poder de reforzar
una conducta pues se han asociado con un reforzador primario ( el
dinero es el reforzador secundario por excelencia, pues permite
obtener otros reforzadores primarios, como la comida o el abrigo).

Como operacin, el Reforzamiento puede clasificarse en positivo y negativo.


Reforzamiento positivo: se aade un estimulo luego de una secuencia de
conducta particular y esto trae como consecuencia un aumento en la
probabilidad de ocurrencia futura de la respuesta precedente.
Reforzamiento negativo: supone la remocin o eliminacin de un estimulo
aversivo del entorno del sujeto y esto trae como consecuencia un aumento
en la probabilidad de ocurrencia futura de la respuesta precedente.

28 de Febrero de 2014
Por otra parte, cuando la consecuencias disminuyen la probabilidad de que
ocurra la misma conducta en el futuro, se habla de Castigo. Los estmulos que
forman parte del proceso de castigo son conocidos como estmulos punitivos:
una reprimenda, un estimulo doloroso o perder algn privilegio constituyen
ejemplos de estmulos punitivos.
No es posible saber con anticipacin qu estmulos pueden servir de
reforzadores o punitivos para los sujetos, por tanto, no resulta adecuado
pensar en trmino de cosas o estados agradables o desagradables (como lo
haca Thorndike); la identificacin de un objeto como reforzador o como
punitivo depender de que aumente o disminuya la probabilidad de la
respuesta en el futuro.
Desde el Condicionamiento Operante es posible explicar muchas de las
conductas que cambian como producto del aprendizaje. Por ejemplo: Cmo
ensear a un perro a que d la pata.

ED
Voz de
"dame la
pata"

Rs
Levantar
efectivam
ente la
pata

Consecue
ncia

Recibir
refuerzo.
Ejemplo:
Galleta

Figura 2. Cmo ensear a un perro a que d la pata con Condicionamiento


Operante

Otra observacin importante del trabajo de Skinner fue el reconocimiento que


cuando se refuerzan slo algunas respuestas emitidas pos un sujeto, est en
operacin un programa de reforzamiento. Un programa de reforzamiento puede
ser entendido como la regla que sigue el medio al determinar cules sern las
respuestas que van a ser reforzadas. Segn Reynolds (1977), los programas de
reforzamiento tienen efectos regulares, ordenados y profundos sobre la tasa de
respuesta los programas son la fuerza principal del control conductual (p.81)
Los programas de reforzamiento ms simples se clasifican en Programas de
Razn y Programas de Intervalo.
Programas de Razn: especifican cuntas respuestas deben emitirse
antes de que alguna de ellas sean reforzadas
Programas de Intervalo: el criterio para reforzar una emisin de respuesta
es el paso de un determinado tiempo desde el refuerzo anterior.
A su vez, los criterios de razn y de intervalo pueden ser subclasificados en fijos y
variables.

28 de Febrero de 2014

Programas fijos: se requiere consistentemente del mismo nmero de


respuesta de un reforzamiento a otro (Razn), o se mantiene
constantemente el tiempo establecidos para el reforzamiento (Intervalo).
Programas Variables: el nmero de respuestas requerido para el
reforzamiento vara de un reforzamiento a otro (Razn), o bien vara la
cantidad de tiempo que debe pasar antes de que una respuesta sea
seguida de refuerzo.

En el cuadro 1 se muestran las caractersticas de los programas, efectos sobre la


conducta y ejemplos.
Programas

Curso de la Extincin

Intervalo Fijo

El curso de la extincin es muy


rpido. Se observa que se contina
la respuesta hasta ms all del
intervalo original y se termina la
respuesta bruscamente.

Intervalo Variable

La extincin ocurre de manera muy


lenta y gradual. Se observa una
constante reduccin en la tasa sin
que se registren pausas repentinas.

Razn Fijo

Existe una resistencia media a la


extincin. Se caracteriza por pausas
repentinas

Intervalos
Variable

Ocurre la mayor resistencia de la


extincin

Ejemplo en la conducta humana


1. Recibir un pago regularmente, por
ejemplo, cada semana o cada mes.
2. Un da de trabajo cuya longitud es
constante: los preparativos para
salir del trabajo se incrementan a
medida que se acerca la hora de
salida
1. Llamar por telfono a una persona
quien est hablando por la lnea.
2. Las personas que tienen su propio
negocio, reciben su pago en
intervalos irregulares, dependiendo
del pago de los clientes.
1. Cada vez que se realice un nmero
fijo de tareas o productos, se recibe
el pago
2. Pago de comisin extra por el
numero de ventas realizadas.
1. Los juegos de azar, tales como las
mquinas de monedas, constituyen
un ejemplo tpico de este programa.

Fenmenos del Aprendizaje por Condicionamiento Instrumental u


Operante
En el condicionamiento operante es posible tambin identificar algunos fenmenos
que se researon para el Condicionamiento Clsico. As, si una respuesta que
antes haba sido seguida de refuerzo deja de serlo, ocurrir Extincin de esa
respuesta. Igualmente, se aprende a emitir una respuesta particular ante estmulos
discriminativos especficos, es decir, ocurre Discriminacin. Tambin ocurre
Generalizacin, esto es, se emiten respuestas similares ante estmulos que son
parecidos al estimulo discriminativo (Reynolds, 1977).
4

28 de Febrero de 2014
Referencias Bibliogrficas
Csoban, E. (2003). Aprendizaje. En Pea, G., Moreno, M., Csoban, E., Eds.
Introduccin a la psicologa. Caracas: Editorial UCAB.
Guillen, O. (2000). Psicologa. Caracas: Salesiana

Potrebbero piacerti anche