B.F. Skinner | Condicionamiento operante

Por Saul McLeod, actualizado en 2018

El condicionamiento operante, también conocido como condicionamiento instrumental, es un método de aprendizaje normalmente atribuido a BF Skinner, donde las consecuencias de una respuesta determinan la probabilidad de que se repita. A través del condicionamiento operante, la conducta que se refuerza (recompensa) probablemente se repetirá, y la conducta que se castiga ocurrirá con menos frecuencia.

En la década de 1920, John B. Watson había dejado la psicología académica y otros conductistas se estaban convirtiendo en influyente, proponiendo nuevas formas de aprendizaje distintas del condicionamiento clásico. Quizás el más importante de ellos fue Burrhus Frederic Skinner. Aunque, por razones obvias, se le conoce más comúnmente como BF Skinner.

Las opiniones de Skinner eran un poco menos extremas que las de Watson (1913). Skinner creía que sí tenemos una mente , pero que simplemente es más productivo estudiar el comportamiento observable en lugar de los eventos mentales internos.

El trabajo de Skinner se basaba en una visión de que el condicionamiento clásico era demasiado simplista para ser una explicación completa del comportamiento humano complejo . Creía que la mejor manera de comprender el comportamiento es observar las causas de una acción y sus consecuencias. A este enfoque lo llamó condicionamiento operante.

Para ver este video, habilite JavaScript y considere actualizar a un navegador web que admita video HTML5

BF Skinner – Operante C onditioning video

BF Skinner: Operant Conditioning

Skinner es considerado el padre del Operant Conditioning, pero su trabajo se basó en Thorndike ( 1898) ley vigente. De acuerdo con este principio, es probable que se repita el comportamiento seguido de consecuencias agradables, y es menos probable que se repita el comportamiento seguido de consecuencias desagradables.

Skinner introdujo un nuevo término en la Ley del Efecto: Refuerzo . el comportamiento reforzado tiende a repetirse (es decir, reforzado); El comportamiento que no se refuerza tiende a extinguirse o extinguirse (es decir, debilitarse).

Skinner (1948) estudió el condicionamiento operante mediante la realización de experimentos con animales que colocó en una «Caja Skinner» que era similar a la caja de rompecabezas de Thorndike.

Una caja Skinner, también conocida como una cámara de acondicionamiento operante, es un dispositivo que se utiliza para registrar objetivamente el comportamiento de un animal en un marco de tiempo comprimido. Un animal puede ser recompensado o castigado por participar en ciertos comportamientos, como presionar una palanca (para ratas) o picotear teclas (para palomas ).

Skinner identificó tres tipos de respuestas, u operantes, que pueden seguir el comportamiento.

• Operantes neutrales: respuestas del entorno que no aumentan ni disminuyen la probabilidad de que se repita un comportamiento.

• Refuerzos: Respuestas del entorno que aumentan la probabilidad de que un comportamiento se repita. Reinf Los orcers pueden ser positivos o negativos.

• Castigadores: Respuestas del entorno que disminuyen la probabilidad de que se repita un comportamiento. El castigo debilita el comportamiento.

Todos podemos pensar en ejemplos de cómo nuestro propio comportamiento se ha visto afectado por reforzadores y castigadores. De niño probablemente probó varios comportamientos y aprendió de sus consecuencias.

Por ejemplo, si cuando era más joven intentara fumar en la escuela y la principal consecuencia fue que se unió a la multitud con la que siempre quiso pasar el rato, se le habría reforzado positivamente (es decir, recompensado) y es probable que repita el comportamiento.

Sin embargo, si la consecuencia principal fue que te atraparon, azotaron, suspendieron de la escuela y tus padres se involucraron, seguramente habrías sido castigado y en consecuencia, sería mucho menos probable que fume ahora.

Refuerzo positivo

Refuerzo positivo es un término descrito por BF Skinner en su teoría del condicionamiento operante. En el refuerzo positivo, una respuesta o comportamiento se refuerza con recompensas, lo que lleva a la repetición del comportamiento deseado. La recompensa es un estímulo de refuerzo.

Skinner mostró cómo funcionaba el refuerzo positivo al colocar una rata hambrienta en su caja Skinner. La caja contenía una palanca en el costado, y cuando la rata se movía por la caja, accidentalmente golpeaba la palanca. Inmediatamente lo hizo para que un gránulo de comida cayera en un recipiente junto a la palanca.

Las ratas aprendieron rápidamente a ir directamente a la palanca después de un par de veces que las metieron en la caja. La consecuencia de recibir comida si presionaron la palanca aseguró que repetirían la acción una y otra vez.

El refuerzo positivo fortalece un comportamiento al proporcionar una consecuencia que una persona encuentra gratificante. Por ejemplo, si su maestro le da £ 5 cada vez que completa su tarea (es decir, una recompensa), será más probable que repita este comportamiento en el futuro, fortaleciendo así el comportamiento de completar su tarea.

Refuerzo negativo

El refuerzo negativo es la terminación de un estado desagradable después de una respuesta. Esto se conoce como refuerzo negativo porque es la eliminación de un estímulo adverso que es ‘gratificante’ para el animal o la persona. El refuerzo negativo fortalece el comportamiento porque detiene o elimina una experiencia desagradable.

Por ejemplo, si no completas tu tarea, le das a tu profesor £ 5. Completarás tu tarea para evitar pagar £ 5, fortaleciendo así el comportamiento de completar tu tarea.

Skinner mostró cómo funcionaba el refuerzo negativo colocando una rata en su caja Skinner y luego sometiéndola a una corriente eléctrica desagradable que le provocó algunas molestias. Cuando la rata se movía por la caja, golpeaba accidentalmente la palanca. Inmediatamente lo hizo para que se cortara la corriente eléctrica. Las ratas aprendieron rápidamente a ir directamente a la palanca después de un par de veces que las metieron en la caja. La consecuencia de escapar de la corriente eléctrica aseguró que repetirían la acción una y otra vez.

De hecho, Skinner incluso les enseñó a las ratas a evitar la corriente eléctrica encendiendo una luz justo antes de que llegara la corriente eléctrica. Las ratas pronto aprendieron a presionar la palanca cuando se encendió la luz porque sabían que esto detendría el encendido de la corriente eléctrica.

Estas dos respuestas aprendidas se conocen como Aprendizaje de escape y Aprendizaje de evitación.

Castigo (debilita el comportamiento)

El castigo se define como lo opuesto al refuerzo, ya que está diseñado para debilitar o eliminar una respuesta en lugar de aumentarla. Es un evento aversivo que disminuye el comportamiento que sigue.

Al igual que el refuerzo, el castigo puede funcionar aplicando directamente un estímulo desagradable como un choque después de una respuesta o eliminando un estímulo potencialmente gratificante, por ejemplo, deducir el dinero de bolsillo de alguien para castigar un comportamiento indeseable.

Nota: No siempre es fácil distinguir entre castigo y refuerzo negativo.

Hay muchos problemas con usar castigo, como:

El comportamiento castigado no se olvida, se suprime; el comportamiento vuelve cuando el castigo ya no está presente.
Provoca un aumento de la agresión; muestra que la agresión es una forma de lidiar con los problemas.
Crea miedo que puede generalizarse a conductas indeseables, por ejemplo, miedo a la escuela.
No necesariamente guía hacia la conducta deseada – el refuerzo le dice qué hacer hacer, el castigo solo te dice lo que no debes hacer.

Programas de refuerzo

Imagi ne una rata en una «caja Skinner». En el acondicionamiento operante, si no se entrega ningún gránulo de comida inmediatamente después de presionar la palanca, luego de varios intentos la rata deja de presionar la palanca (¿cuánto tiempo continuaría alguien yendo a trabajar si su empleador dejara de pagarle?). El comportamiento se ha extinguido.

Los conductistas descubrieron que diferentes patrones (o programas) de refuerzo tenían diferentes efectos sobre la velocidad del aprendizaje y la extinción. Ferster y Skinner (1957) idearon diferentes formas de proporcionar refuerzo y encontraron que esto tenía efectos en

Skinner encontró que el El refuerzo que produce la tasa más lenta de extinción (es decir, la gente seguirá repitiendo el comportamiento durante más tiempo sin refuerzo) es el refuerzo de relación variable. El tipo de refuerzo que tiene la tasa de extinción más rápida es el refuerzo continuo.

(A) Refuerzo continuo

Un animal / humano es reforzado positivamente cada vez que ocurre un comportamiento específico, por ejemplo, cada vez que se presiona una palanca, se entrega un gránulo y luego se apaga la entrega de alimentos.

La tasa de respuesta es LENTA
La tasa de extinción es RÁPIDA

(B) Refuerzo de proporción fija

El comportamiento se refuerza solo después de que el comportamiento ocurre un número específico de veces. por ejemplo, se da un refuerzo después de tantas respuestas correctas, por ejemplo, después de cada quinta respuesta. Por ejemplo, un niño recibe una estrella por cada cinco palabras escritas correctamente.

La tasa de respuesta es RÁPIDA
La tasa de extinción es MEDIA

(C) Refuerzo de intervalo fijo

Se da un refuerzo después de un intervalo de tiempo fijo siempre que se haya dado al menos una respuesta correcta. Un ejemplo es el pago por hora. Otro ejemplo sería cada 15 minutos (media hora, hora, etc.) que se entrega un pellet (siempre que se haya presionado al menos una palanca) y luego se apaga la entrega de alimentos.

Tasa de respuesta es MEDIA
La tasa de extinción es MEDIA

(D) Refuerzo de relación variable

El comportamiento se refuerza después de un número impredecible de veces. Por ejemplo, juegos de azar o pesca.

La tasa de respuesta es RÁPIDA
La tasa de extinción es LENTA (muy difícil de extinguir debido a la imprevisibilidad)

(E) Intervalo de refuerzo variable

Siempre que se haya dado una respuesta correcta, el refuerzo se da después de que haya pasado una cantidad de tiempo impredecible. por ejemplo, en promedio cada 5 minutos. Un ejemplo es un trabajador autónomo a quien se le paga en momentos impredecibles.

La tasa de respuesta es RÁPIDA
La tasa de extinción es LENTA

Modificación de la conducta

La modificación de la conducta es un conjunto de terapias / técnicas basadas en el condicionamiento operante (Skinner, 1938, 1953). El principio fundamental comprende cambiar los eventos ambientales que están relacionados con el comportamiento de una persona. Por ejemplo, el refuerzo de los comportamientos deseados e ignorar o castigar los no deseados.

Esto no es tan simple como parece, siempre refuerza El comportamiento deseado, por ejemplo, es básicamente un soborno.

Hay diferentes tipos de refuerzos positivos. El refuerzo primario es cuando una recompensa fortalece un comportamiento por sí mismo. El refuerzo secundario es cuando algo fortalece un comportamiento porque conduce a un reforzador primario.

Ejemplos de terapia de modificación de conducta incluyen economía de fichas y modelado de conducta.

Economía de fichas

La economía de fichas es un sistema en el que las conductas específicas se refuerzan con tokens (reforzadores secundarios) y luego intercambiados por recompensas (reforzadores primarios).

Los tokens pueden tener la forma de dinero falso, botones, fichas de póquer, pegatinas, etc. Mientras que las recompensas pueden variar desde bocadillos hasta privilegios o actividades. Por ejemplo, los maestros usan la economía de fichas en la escuela primaria dándoles pegatinas a los niños pequeños para recompensar el buen comportamiento.

Se ha descubierto que la economía de fichas es muy eficaz en el manejo de pacientes psiquiátricos. Sin embargo, los pacientes pueden depender demasiado de las fichas, lo que les dificulta adaptarse a la sociedad una vez que salen de la prisión, el hospital, etc.

El personal que implementa un programa de economía de fichas tiene mucho poder. Es importante que el personal no favorezca ni ignore a ciertas personas para que el programa funcione. Por lo tanto, el personal debe estar capacitado para otorgar tokens de manera justa y constante incluso cuando hay cambios repentinos, como en las prisiones o en un hospital psiquiátrico.

Modelado de la conducta

Otra importante contribución de Skinner (1951) es una noción de comportamiento que se configura a través de aproximaciones sucesivas. Skinner sostiene que los principios del condicionamiento operante se pueden usar para producir un comportamiento extremadamente complejo si las recompensas y los castigos se entregan de tal manera que animen a mover un organismo cada vez más cerca y más cerca del comportamiento deseado.

Para hacer esto, el Las condiciones (o contingencias) necesarias para recibir la recompensa deben cambiar cada vez que el organismo se acerca un paso más al comportamiento deseado.

Según Skinner, la mayoría de los comportamientos animales y humanos (incluido el lenguaje) pueden explicarse como producto de este tipo de aproximación sucesiva.

Aplicaciones educativas

En la situación de aprendizaje convencional, el condicionamiento operante se aplica en gran medida a cuestiones de gestión de la clase y del alumno, más que al contenido de aprendizaje. Es muy relevante para moldear el desempeño de las habilidades.

Una forma sencilla de moldear el comportamiento es proporcionar comentarios sobre el desempeño del alumno, por ejemplo, cumplidos, aprobación, estímulo y afirmación. Una relación variable produce la tasa de respuesta más alta para los estudiantes que están aprendiendo una nueva tarea, por lo que inicialmente el refuerzo (p. Ej., Elogio) ocurre a intervalos frecuentes, y a medida que el desempeño mejora el refuerzo ocurre con menos frecuencia, hasta que finalmente solo se refuerzan los resultados excepcionales.

Por ejemplo, si un profesor quisiera animar a los estudiantes a responder preguntas en clase, debería elogiarlos por cada intento (independientemente de si su respuesta es correcta). Gradualmente, el maestro solo elogiará a los estudiantes cuando su respuesta sea correcta y, con el tiempo, solo se elogiarán las respuestas excepcionales.

Los comportamientos no deseados, como la tardanza y la discusión dominante en la clase, pueden extinguirse si el maestro los ignora (en lugar de reforzarlos al llamar la atención). Esta no es una tarea fácil, ya que el maestro puede parecer poco sincero si piensa demasiado en la forma de comportarse.

El conocimiento del éxito también es importante ya que motiva el aprendizaje futuro. Sin embargo, es importante variar el tipo de refuerzo dado para que el comportamiento se mantenga. Esta no es una tarea fácil, ya que el maestro puede parecer poco sincero si piensa demasiado en la forma de comportarse.

Resumen

Observando los estudios clásicos de Skinner sobre palomas En el comportamiento de rata, podemos identificar algunas de las principales suposiciones del enfoque conductista.

• La psicología debe verse como una ciencia, para ser estudiada de manera científica. El estudio de Skinner sobre el comportamiento en ratas se llevó a cabo en condiciones de laboratorio cuidadosamente controladas.

• El conductismo se preocupa principalmente por el comportamiento observable, en oposición a los eventos internos como el pensamiento y la emoción. Tenga en cuenta que Skinner no dicen que las ratas aprendieron a presionar una palanca porque querían comida. En su lugar, se concentró en describir el comportamiento fácilmente observable que adquirieron las ratas.

• La mayor influencia en el comportamiento humano es aprender de nuestro entorno . En el estudio de Skinner, debido a que la comida siguió un comportamiento particular, las ratas aprendieron a repetir ese comportamiento, por ejemplo, condicionamiento operante.

• Hay poca diferencia entre el aprendizaje que tiene lugar en los seres humanos y que en otros animales. Por lo tanto, la investigación (por ejemplo, condicionamiento operante) se puede llevar a cabo en animales (ratas / palomas) así como en humanos. Skinner propuso que la forma en que los humanos aprenden el comportamiento es muy similar a la forma en que las ratas aprendieron a presionar un palanca.

Entonces, si la idea de psicología de su profano siempre ha sido la de personas en laboratorios con batas blancas y viendo a ratas desventuradas tratar de sortear laberintos para llegar a su cena, entonces usted probablemente estén pensando en la psicología del comportamiento.

El conductismo y sus ramificaciones tienden a estar entre las perspectivas psicológicas más científicas. El énfasis de la psicología del comportamiento está en cómo aprendemos a comportarnos de ciertas maneras.

Todos estamos constantemente aprendiendo nuevos comportamientos y cómo modificar nuestro comportamiento existente. La psicología del comportamiento es el enfoque psicológico que se centra en cómo se lleva a cabo este aprendizaje.

Evaluación crítica

El condicionamiento operante se puede utilizar para explicar una amplia variedad de comportamientos, desde el proceso del aprendizaje, a la adicción y la adquisición del lenguaje. También tiene una aplicación práctica (como la economía de fichas) que se puede aplicar en aulas, prisiones y hospitales psiquiátricos.

Sin embargo, el condicionamiento operante no tiene en cuenta el papel de los factores hereditarios y cognitivos en el aprendizaje, y por lo tanto, es una explicación incompleta del proceso de aprendizaje en humanos y animales.

Por ejemplo, Kohler (1924) encontró que los primates a menudo parecen resolver problemas en un destello de comprensión en lugar de ser un aprendizaje de prueba y error. Además, la teoría del aprendizaje social (Bandura, 1977) sugiere que los humanos pueden aprender automáticamente a través de la observación en lugar de a través de la experiencia personal.

El uso de la investigación con animales en estudios de condicionamiento operante también plantea el problema de la extrapolación. Algunos psicólogos argumentan que no podemos generalizar de los estudios en animales a los humanos, ya que su anatomía y fisiología son diferentes a las de los humanos, y no pueden pensar en sus experiencias e invocar la razón, la paciencia, la memoria o la comodidad propia.

Referencias de estilo APA

Bandura , A. (1977). Teoria de aprendizaje social. Englewood Cliffs, Nueva Jersey: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Horarios de refuerzo. Nueva York: Appleton-Century-Crofts.

Kohler, W. (1924). La mentalidad de los simios. Londres: Routledge & Kegan Paul.

Skinner, B. F. (1938). El comportamiento de los organismos: un análisis experimental. Nueva York: Appleton-Century.

Skinner, B. F. (1948). Superstition «in the pigeon. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). Cómo enseñar a los animales. Freeman.

Skinner, BF (1953). Ciencia y comportamiento humano. SimonandSchuster.com.

Watson, JB (1913 La psicología como la ve el conductista, Psychological Review, 20, 158-177.

Inicio | Acerca de | Índice A-Z | Política de privacidad | Póngase en contacto con nosotros

Esta obra tiene la licencia de Creative Commons Reconocimiento-No comercial-Sin obras derivadas 3.0 Unported.

Número de registro de la empresa: 10521846

informar sobre este anuncio

Mont Blanc

B.F. Skinner – Condicionamiento operante