Sei sulla pagina 1di 5

El Condicionamiento Clásico

Modo de actuación

El proceso del condicionamiento instrumental u operante requiere la siguiente secuencia:

1. Estímulo, al que llamaremos a partir de ahora Estímulo Discriminativo (ED),


porque va a discriminar con otros la respuesta.
2. Respuesta, a la que denominaremos Respuesta Operante (RO).
3. Refuerzo, que se trata de un Estímulo Reforzante (ER), lo que implica una
asociación con la respuesta operante para potenciarla.

Repetimos lo que nos gusta

La ley del efecto descubierta por Thorndike, afirma un principio muy sencillo que consta de
dos partes. La primera afirma que las respuestas que producen consecuencias satisfactorias se
consolidan, y por consiguiente, se emiten con frecuencia creciente. La segunda presupone que
los organismos aprenden respuestas que permiten evitar o evadir estímulos desagradables.

Los padres utilizan recompensas para moldear los buenos modales en la mesa, elogian el
comportamiento que se asemeja al de los adultos ¿no?, pues esto es un ejemplo claro del
condicionamiento operante.
Motivar para proseguir: el reforzamiento

¿Qué es el reforzador? Es todo lo que aumenta la frecuencia de respuesta. Hay dos tipos de
reforzadores: los positivos y los negativos. Un refuerzo es positivo cuando consolida una
repuesta al ser presentado después de ella y al ser considerado por el sujeto como un premio
(alimento, aprobación, dinero, expresiones de cariño…). Es negativo cuando tiende a ser
eliminado después de la respuesta, lo cual puede ser así consolidarla.

El alimento o la supresión del dolor son reforzadores primarios, entendidos así porque
son innatos. En cambio el dinero, el éxito, los halagos, las calificaciones, el tono agradable de
voz, etc., son secundarios y se aprenden en general relacionados con los primarios.

La inmediatez de un reforzador influye en muchas conductas. De esto saben muchos los


fumadores o consumidores de drogas. En esto se basa el uso de analgésicos que alivian el dolor.
Pero, en general, aprendemos a responder a reforzadores más demorados: el sueldo al terminar
el mes, el triunfo al final de una lucha, las calificaciones trimestrales…y si bien el reforzador
instantáneo acostumbra a ser muy eficaz, para funcionar sólidamente debemos aprender a
postergar las recompensas inmediatas a favor de las de largo plazo, que suelen ser más
contundentes. Se ha comprobado que los niños que aprenden ya de pequeños a aplazar premios
importantes, en contra de recompensas inmediatas, se convierten en adolescentes más
competentes.

Programar es progresar

En la vida cotidiana hay reglas bien definidas que rigen la existencia de cada uno de nosotros,
que programan nuestros premios o castigos. Así, nuestros padres solían decirnos que nos darían
apoyo económico o algún privilegio deseado (por ejemplo, salir de noche) a condición de que
cumpliéramos con nuestros deberes. Estamos sometidos a normas que podemos
denominar programas de reforzamiento parcial o intermitente y que aseguran la
persistencia de una conducta, mucho más que los reforzamientos constantes, que acaban por
extinguir la respuesta por cansancio o rutina. A la larga, el reforzamiento parcial determina una
mayor resistencia a la extinción.
1. Los programas de intervalo fijo están regulados por un tiempo determinado de
antemano, con una pausa igual después de cada refuerzo. Durante este periodo no se
dispone de reforzadores, reforzándose la respuesta siguiente en el momento de
concluir el intervalo fijo. Los ejemplos más claros son nuestro sueldo o los regalos
ofrecidos en un tiempo específico por la tradición, como las Navidades.

2. En los programas de intervalo variable, el lapso está marcado por un valor medio
sometido en parte al azar. Se refuerza la primera respuesta después de intervalos
variables. Por ejemplo, cuando cedemos a las rabietas de los niños en pos de una
tranquilidad que a la larga, puede volverse contra nosotros. Estos programas
tienden a producir una respuesta lenta pero regular.

3. Los programas de razón fija se basan en un refuerzo que aparece después de un


número determinado y prefijado de respuestas. Por ejemplo, los trabajos a destajo:
por cada cincuenta unidades de producción se recibe una prima. Puede considerarse
un sistema eficaz porque suele producir tasas altas de respuesta, con pausas breves y
momentáneas tras cada refuerzo.

4. Los programas de razón variable brindan recompensa después de un número


determinado pero previsible de respuestas. Son los más utilizados en el juego
y responsables de un buen número de adicciones compulsivas, ya que
determinan elevados índices de respuesta, porque los reforzadores aumentan a
medida que se incrementa la respuesta.

La indefensión aprendida

Los organismos sujetos a procesos que estiman incontrolables desarrollarían aprendizajes de no


control, de sucesos considerados independientes de la propia voluntad. La gente puede
resignarse ante condiciones ambientales que indiquen la imposibilidad de controlar los
resultados de sus propias acciones. Entramos en expectativa de indefensión, ya que recibimos
castigo (muchas veces autoinfligido por nuestros propios pensamientos negativos), sea cual
fuese nuestro comportamiento. Ya no escapamos aunque la situación lo permita; incluso
desestimamos las posibilidades de recompensa posible en caso de adoptar una estrategia
adecuada, con lo que caemos en una situación de paralización que a su vez provoca alteraciones
emocionales de desesperanza.

El castigo

El castigo nos dice qué no debemos hacer; el refuerzo lo que debemos hacer. Lo más
efectivo es combinar el castigo con el refuerzo positivo, con lo que se incrementará la eficacia
del método. Si se aplica el castigo, éste debe cumplir con ciertas condiciones para conseguir
una cierta efectividad:

 Debe estar subordinado a la conducta específica.


 No alternar nunca premio y castigo por la misma conducta (evitar las distorsiones
entre padre y madre o entre padres y maestros).
 Proporcionar a los sujetos medios alternativos para conseguir la recompensa.
 No debe generalizarse a rasgos personales (“eres un estúpido”).
 Tenemos que evitar los castigos prolongados.

Ciertos autores sostienen además que el castigo prolongado y excesivo puede desencadenar
la agresividad en el sujeto que lo padece, y ponen como ejemplo la correlación existente
entre delincuentes agresivos con la infancia que tuvieron en hogares demasiado aversivos y
castigadores.

Aprendizaje por imitación

Desde que somos bebés observamos e imitamos las formas de conductas de otros, lo que recibe
el nombre de modelado o aprendizaje vicario. Este proceso es increíblemente eficaz, pues
permite evitar los tediosos procedimientos de tanteo y ensayo-error que acompañan al
condicionamiento instrumental. Gracias a esto también aprendemos sin intentos previos y nos
facilita el amplio repertorio de nuestra conducta social.

El modelado permite explicar las conductas psicosociales que provocan efectos positivos y
solidarios, marcados por nuestros padres, entorno social o por los medios de comunicación.
Superstición

Buena parte de nuestras supersticiones se aprenden al darse un reforzamiento positivo o


negativo de manera casual. En el famoso experimento de Skinner con palomas, a las que se
les reforzaba con comida por picotear en un disco, observó que si una paloma se giraba
casualmente antes de picotear, creía que el giro le servía para obtener comida y, a pesar de que
la comida se le daba por picoteo, independientemente del giro, la paloma aprendía una
conducta supersticiosa y seguía efectuando el giro aunque no le servía para nada. Así es como
aprendemos a atribuir una causa incorrecta a un efecto, porque nuestra mente es así, necesita
tener todo en orden.

Potrebbero piacerti anche