Sei sulla pagina 1di 11

Reforzamiento en el aprendizaje según B.F Skinner.

(Burrhus Frederic Skinner; Susquehanna, 1904 - Cambridge,


Estados Unidos, 1990) Psicólogo estadounidense. Obtuvo el
doctorado en psicología por la Universidad de Harvard en
1931, y continuó sus investigaciones en la misma universidad
como asistente de laboratorio de biología con el profesor
Crozier; en 1936 empezó a trabajar como profesor en la
Universidad de Minnesota, donde permaneció nueve años.

La teoría del reforzamiento elaborada por Skinner, también conocida como


condicionamiento operante o condicionamiento instrumental, intenta explicar la
conducta humana en correspondencia con el medio ambiente o los estímulos que
la rodean.

Mediante el método experimental, Skinner llega a la conclusión de que la aparición


de un estímulo desencadena una respuesta en la persona. Si esta respuesta es
condicionada utilizando reforzadores positivos o negativos, se podrá ejercer una
influencia en dicha reacción o conducta operante, la cual puede potenciarse o
inhibirse.

Skinner estableció que la conducta se mantiene de un contexto o situación a otra


siempre que las consecuencias, es decir los reforzadores no cambien o lo hagan
siguiendo unas ciertas lógicas, "reglas" que hay que descubrir. Como
consecuencia, tanto el comportamiento humano como el animal pueden ser
condicionados o modificados utilizando una serie de estímulos que el sujeto puede
considerar satisfactorios o no.

Explicado de una manera más sencilla, la Teoría del reforzamiento hace hincapié
en que una persona tiene más probabilidades de repetir una conducta que es
reforzada de manera positiva, así como será más probable que repita aquellas que
estén asociadas a estímulos o refuerzos negativos.

¿Cuáles son los tipos de reforzamiento que existen?


Los estímulos condicionales o reforzadores tanto positivos como negativos,
pueden utilizarse con la finalidad de rectificar o cambiar la conducta de la persona.
Estos son de gran utilidad tanto en la terapia psicológica, como en el ámbito
escolar, familiar o incluso laboral.

Skinner diferenciaba entre dos tipos de reforzadores: los reforzadores positivos y


los reforzadores negativos.

1. Reforzadores positivos: Los reforzadores positivos son todas aquellas


consecuencias que aparecen tras una conducta y que la persona considera
satisfactorias o beneficiosas. Mediante estos reforzadores positivos o
satisfactorios, se busca aumentar la tasa de respuesta de una persona, es decir
que aumente la probabilidad de realizar o repetir una acción.

Esto significa que los actos que son reforzados de manera positiva tendrán más
probabilidades de repetirse puesto que van seguidos gratificaciones, premios o
recompensas percibidas como positivas por la persona que realiza la acción.

Skinner diferenciaba entre dos tipos de reforzadores: los reforzadores positivos y


los reforzadores negativos.
1. Reforzadores positivos

Los reforzadores positivos son todas aquellas consecuencias que aparecen tras
una conducta y que la persona considera satisfactorias o beneficiosas. Mediante
estos reforzadores positivos o satisfactorios, se busca aumentar la tasa de
respuesta de una persona, es decir que aumente la probabilidad de realizar o
repetir una acción.

Esto significa que los actos que son reforzados de manera positiva tendrán más
probabilidades de repetirse puesto que van seguidos gratificaciones, premios o
recompensas percibidas como positivas por la persona que realiza la acción.

A su vez, estos reforzadores positivos pueden ser clasificados en las siguientes


categorías:
 Reforzadores primarios o intrínsecos: son conductas que por sí mismas
generan satisfacción. Por ejemplo comer si se tiene hambre.
 Reforzadores secundarios: se dan mediante aprendizaje y son externos a la
persona. Pueden ser materiales, como el dinero o sociales, como el
reconocimiento.

2. Reforzadores negativos

Al contrario de lo que popularmente se cree, los reforzadores negativos no


consisten en administrar castigos o estímulos aversivos a la persona; sino todo lo
contrario. La utilización de reforzadores negativos busca aumentar la tasa de
respuesta de esta mediante la eliminación de aquellas consecuencias que esta
considere negativas.

Como podemos observar, a diferencia del refuerzo positivo, en este caso se


elimina la aparición un estímulo negativo o aversivo para que aumente una
conducta determinada. No obstante, aquello sí tienen en común es los estímulos
también tendrán que estar adaptados a los gustos de la persona.

Skinner buscaba llevar estas teorías a la práctica real. Para ello, elaboró una serie
de programas de refuerzo concretos, siendo los más destacados los programas de
refuerzo continuo y refuerzo intermitente (refuerzo de intervalo y refuerzo de
razón).

1. Refuerzo continuo

En el refuerzo continuo la persona es recompensada constantemente por una


acción o conducta. La principal ventaja es que la asociación de forma de manera
veloz y efectiva; sin embargo, una vez eliminado el refuerzo la conducta también
se extingue rápidamente.

2. Refuerzo intermitente

En estos casos solamente se refuerzan la conducta de la persona en


determinadas ocasiones. Este programa a su vez se subdivide en dos categorías:
refuerzo de intervalo (fijo o variable) o refuerzo de razón (fijo o variable)

Reforzamiento en el aprendizaje según Edward Tolman.


Nació en West Newton, Massachusetts. Su hermano, Richard
Chace Tolman, fue físico en el Caltech. Estudió en el Instituto
Tecnológico de Massachusetts, donde se graduó
en electroquímica en 1911. Recibió su doctorado de la Universidad
de Harvard en 1915. La mayor parte de su carrera la pasó en
la Universidad de California en Berkeley entre 1918 y 1954, donde
enseñó psicología.
En 1957 recibió el premio de la Asociación Psicológica
Estadounidense (APA) por contribuciones científicas distinguidas. En 1959 recibió
un LLD honorario de la Universidad de California.

Los modelos de aprendizaje E-E y E-R

A mediados del siglo XX existió un profundo debate dentro de la orientación


conductista en torno a la naturaleza del condicionamiento y al papel del refuerzo.
Así, se opusieron el modelo Estímulo-Respuesta (E-R), personificado en autores
como Thorndike, Guthrie o Hull, y el paradigma Estímulo-Estímulo (E-E), del que
Tolman fue el representante más importante.

Según el modelo E-E el aprendizaje se produce por la asociación entre un


estímulo condicionado y otro incondicionado, que pasa a evocar la
misma respuesta condicionada en presencia del refuerzo; en cambio, desde la
perspectiva E-R se defendía que el aprendizaje consiste en la asociación entre un
estímulo condicionado y una respuesta condicionada.

Así, Tolman y autores afines consideraban que el aprendizaje depende de que el


sujeto detecte la relación entre dos estímulos, lo cual le permitirá obtener una
recompensa o evitar un castigo, frente a los representantes del modelo E-R, que
definían el aprendizaje como la adquisición de una respuesta condicionada a la
aparición de un estímulo previamente incondicionado.

Desde el paradigma E-R se proponía una visión mecanicista y pasiva del


comportamiento de los seres vivos, mientras que el modelo E-E afirmaba que el
rol de quien aprende es activo puesto que implica un componente
de procesamiento cognitivo voluntario, con una meta determinada.

Experimentos sobre aprendizaje latente

Hugh Blodgett había estudiado el aprendizaje latente (que no se manifiesta como


respuesta observable de forma inmediata) mediante experimentos con ratas y
laberintos. Tolman desarrolló su célebre propuesta sobre los mapas cognitivos y
buena parte del resto de su obra a partir de este concepto y de los trabajos de
Blodgett.

En el experimento inicial de Tolman tres grupos de ratas fueron entrenados para


recorrer un laberinto. En el grupo control los animales obtenían comida (refuerzo)
al llegar al final; en cambio, las ratas del primer grupo experimental sólo
consiguieron la recompensa a partir del séptimo día de entrenamiento, y las del
segundo grupo experimental a partir del tercer día.

Tolman encontró que la tasa de errores de las ratas del grupo control descendió
desde el primer día, mientras que las de los grupos experimentales lo hicieron de
forma brusca a partir de la introducción de la comida. Estos resultados sugerían
que las ratas aprendían el recorrido en todos los casos, pero sólo llegaban al final
del laberinto si esperaban conseguir refuerzo.
Así, este autor teorizó que la ejecución de una conducta depende de la
expectativa de obtener refuerzo, pero que sin embargo el aprendizaje de dicho
comportamiento se puede producir sin necesidad de que se dé un proceso de
reforzamiento.

El estudio de los mapas cognitivos.

Tolman propuso el concepto de los mapas cognitivos para explicar los resultados
de sus experimentos y de los de Blodgett. Según esta hipótesis, las ratas
construían representaciones mentales del laberinto durante las sesiones de
entrenamiento sin necesidad de refuerzo, y por tanto sabían cómo llegar a la meta
cuando ello tuviera sentido.

Lo mismo sucedería con las personas durante la vida cotidiana: cuando repetimos
una ruta de forma frecuente aprendemos la localización de un gran número de
edificios y lugares; no obstante, sólo nos dirigiremos a estos en caso de que
resulte necesario para alcanzar una meta determinada.

Para demostrar la existencia de los mapas cognitivos Tolman hizo otro


experimento similar al anterior, pero en el que después de que las ratas
aprendieran el recorrido del laberinto éste se llenaba de agua. A pesar de ello los
animales conseguían llegar al lugar donde sabían que encontrarían comida.

De este modo confirmó que las ratas no aprendían a ejecutar una cadena de
movimientos musculares, como defendían los teóricos del paradigma E-R, sino
que eran necesarias variables cognitivas, o al menos no observables, para
explicar el aprendizaje que habían adquirido, y la respuesta utilizada para alcanzar
el objetivo podía variar.
Reforzamiento en el aprendizaje según Clark Hull.

(Akron, 1884 - New Haven, 1952) Psicólogo estadounidense.


Formado en las universidades de Michigan y de Wisconsin,
por la que se doctoró en 1918, fue luego profesor de
psicología en esta universidad y, a partir de 1929, en la
Universidad de Yale, etapa en la que profundizó en la obra de
destacadas figuras de la psicología conductista como John B.
Watson.

Hull fue uno de los primeros teóricos en intentar crear una gran teoría diseñada
para explicar todo el comportamiento. Esta teoría del aprendizaje desarrollada por
Hull en 1943 se conoce como teoría de la reducción del impulso. Hull basó su
teoría en el concepto de homeostasis, la idea de que el cuerpo trabaja
activamente para mantener un cierto estado de equilibrio o equilibrio.

A parte de esta idea, Hull sugirió que toda motivación surge como resultado de
estas necesidades biológicas. Así, en su teoría, Hull usó el término ‘impulso’ para
referirse al estado de tensión o excitación causado por necesidades biológicas o
fisiológicas.

Un impulso, como la sed, el hambre o el frío, crea un estado desagradable, una


tensión. Para reducir este estado de tensión, los humanos y los animales buscan
maneras de satisfacer estas necesidades biológicas (beber, comer, buscar
abrigo). En este sentido, Hull sugirió que los humanos y los animales repitan
cualquier comportamiento que reduzca estos impulsos.

La teoría de Hull se basa en la idea de que las unidades secundarias (a diferencia


de las unidades primarias/innatas, que son necesidades biológicas como el deseo
de socialización, la sed y el hambre) se aprenden a través del condicionamiento y
satisfacen indirectamente las unidades primarias, como el deseo de dinero, ya que
ayuda a pagar refugio o sustento.

Estas unidades secundarias múltiples se producen cuando uno se enfrenta a más


de una necesidad. El propósito es corregir la interrupción del equilibrio
(homeostasis), que es incómodo, lo que significa que el comportamiento se
aprende y se condiciona si, y solo si, satisfacen un impulso primario.
Hull planteó que el aprendizaje es un modo de adaptación a los retos del medio
que favorece la supervivencia de los seres vivos. Lo define como un proceso
activo de formación de hábitos que nos permiten reducir los impulsos, como el
hambre, la diversión, la relajación o la sexualidad. Estos pueden ser básicos o
adquiridos por condicionamiento.

Según Hull, cuando nos encontramos en un “estado de necesidad” aumenta el


impulso, o la motivación, para llevar a cabo un comportamiento que sabemos por
experiencia que la satisface. Para que la conducta sea ejecutada es necesario que
el hábito tenga una cierta fuerza y que el refuerzo que se obtendrá por el
comportamiento motive al sujeto.

La fórmula que creó Hull para explicar la motivación es la siguiente: Potencial de


conducta = Fuerza del hábito (número de refuerzos obtenidos hasta el momento) x
Impulso (tiempo de privación de la necesidad) x Valor de incentivo del refuerzo.

Sin embargo, la teoría de Hull fue derrotada por el conductismo proposicional de


Edward C. Tolman, que tuvo un mayor éxito a causa de la introducción de
variables cognitivas (las expectativas) y demostró que puede haber aprendizaje
sin necesidad de refuerzo. Tal hecho puso en cuestión la base de los
planteamientos de Hull.
Reforzamiento en el aprendizaje según Edwin Gutrhie.
Edwin Ray Guthrie (9 de enero de 1886 al 23 de abril de 1959)
fue un psicólogo estadounidense. Nació en la ciudad de Lincoln,
Nebraska. Ahí transcurrieron los primeros años de su formación.
Ingresó en la Universidad de Nebraska donde realizó estudios de
matemáticas. Después de cinco años, se trasladó al
departamento de psicología donde permaneció durante el resto
de su carrera. El Dr. Guthrie tenía 33 años cuando hizo la
transición desde la filosofía a la psicología.

La ley de Guthrie sobre la contigüidad estipulaba que una combinación de


estímulos que hubieran acompañado a un movimiento, en su emisión recurrente
tenderían a ser seguidos por ese mismo movimiento. El afirmaba que todo
aprendizaje se basaba en asociaciones estímulo-respuesta.

La teoría de la contigüidad implica, que el olvido es una forma de inhibición


retroactiva o asociativa. La inhibición asociativa ocurre cuando un hábito impide
que otro se manifieste, debido a que posee una estimulación más fuerte. Guthrie
establecía que el olvido es debido a la interferencia, a que el estímulo se habría
asociado con nuevas respuestas. Para romper con un hábito, hay que encontrar
las señales que le dan inicio y practicar respuestas diferentes ante tales señales.

Influencia de la teoría con el aprendizaje.


Esta teoría la podemos observar en la actualidad, por ejemplo en una institución,
podemos ver que los alumnos van a la escuela para obtener algo (acreditación,
titulo, etc.) y para esto tienen que hacer una serie de movimientos los cuales
hacen cotidianamente, (estos se convierten en hábitos), ya sea el traslado de su
casa a la escuela, cuando toman un lugar en el aula, cuando levanta la mano para
participar, (respuesta) todo esto por un solo objetivo, acreditar y por supuesto
aprender,(estimulo).
Cuando aprendemos a tocar un instrumento musical, llámese violín, guitarra, etc.
Demostrando ciertas habilidades, las cuales se van desarrollando ensayo a
ensayo. Todo comienza por un ensayo, si a la primera sale perfectamente se le
denomina como principio de recencia, ya que el aprendizaje se dio por completo
en un solo ensayo, a través de estímulos externos que serían oír o ver las notas,
las cuales generarán movimientos kinestésicos.
Estímulos producidos por movimiento: Permite las integraciones de los hábitos
dentro de una amplia gama de cambios ambientales y de estimulación (los
organismos transmiten estos estímulos).

Aplicaciones y ejemplos de la teoría.


Aprendizaje por reforzamiento: Es el aprendizaje en el cuál la conducta es nueva
para el organismo que aumenta su frecuencia de aparición luego de recibir algún
estímulo reforzante.
Aprendizaje por evitación: Es el aprendizaje donde el organismo adquiere una
conducta nueva que termina o impide la aplicación de algún estímulo aversivo
(desagradable), y aumenta la frecuencia de aparición de esa conducta para que
no regrese.
Aprendizaje supersticioso: Es el aprendizaje donde alguna consecuencia
casualmente reforzante o aversiva aumenta la frecuencia de aparición de alguna
conducta.
Aprendizaje por castigo: Es el aprendizaje donde un organismo aumenta la
frecuencia de aparición de las conductas que no fueron seguidas o que no
recibieron ningún estímulo aversivo o desagradable.
Olvido: Todas las conductas que no reciben o que dejan de recibir reforzamiento
tienden a disminuir su frecuencia de aparición y a desaparecer.

Guthrie rechazaba la Ley del ejercicio de Thorndike. Guthrie creía en el


aprendizaje mediante un solo ensayo, que afirma que un patrón de estímulos
adquiere su fuerza asociativa, en la ocasión primera en que se aparea con una
respuesta.2

Actos y movimientos
Los principios básicos del autor reflejan la idea de contigüidad de estímulos y
respuestas.
Una combinación de estímulos con la cual se logra un movimiento, al recurrir
tendrá a ser seguida por ese movimiento. Los movimientos son conductas que
resultan de contracciones musculares.

Guthrie distinguía a los movimientos de los actos, o clases de movimientos a gran


escala que producen un resultado.
El aprendizaje por contigüidad implica que una conducta en una situación se
repetirá cuando dicha situación se presente de nuevo, ese tipo de aprendizajes es
selectivo.

Fuerza asociativa
Plantea que el aprendizaje ocurre a través del emparejamiento de un estímulo y
una respuesta.
Un patrón de estímulo adquiere toda su fuerza asociativa en el momento de su
primer emparejamiento con una respuesta.

Guthrie no sugiere que las personas aprenden conductas complejas realizándolas


sólo una vez, él creía que desde el inicio quedan asociados uno o más
movimientos. La repetición de una asociación añade movimientos, combina
movimientos en actos y establece el acto en diferentes condiciones ambientales.

Recompensas y castigos
Creía que el aprendizaje no requería que las respuestas fueran recompensadas.
Las recompensas podrían servir para evitar el des aprendizaje (olvido), porque
evitan el asociar respuestas nuevas con las señales de estímulo.

Formación y cambio de hábitos

Los hábitos son disposiciones aprendidas al repetir respuestas previas. La clave


para modificar la conducta consiste en encontrar las señales que inician la acción
y practicar otra respuesta ante ellas.

El castigo no es eficaz para modificar hábitos. El castigo que se aplica mientras se


realiza una conducta podría interrumpir o suprimir el hábito. La amenaza de
castigo podría resultar estimulante y fomentar el hábito. Es mejor modificar los
hábitos negativos reemplazándolos por hábitos deseables.

Potrebbero piacerti anche