Par Saul McLeod, mise à jour 2018
Conditionnement opérant, également appelé conditionnement instrumental, est une méthode d’apprentissage normalement attribuée à BF Skinner, où les conséquences d’une réponse déterminent la probabilité qu’elle se répète. Grâce au conditionnement opérant, un comportement renforcé (récompensé) sera probablement répété, et un comportement puni se produira moins fréquemment.
Dans les années 1920, John B. Watson avait quitté la psychologie universitaire, et d’autres comportementalistes devenaient influent, proposant de nouvelles formes d’apprentissage autres que le conditionnement classique. Le plus important d’entre eux était peut-être Burrhus Frederic Skinner. Bien que, pour des raisons évidentes, il soit plus connu sous le nom de BF Skinner.
Les opinions de Skinner étaient légèrement moins extrêmes que celles de Watson (1913). Skinner croyait que nous avons une telle chose comme un esprit , mais qu’il est simplement plus productif d’étudier le comportement observable plutôt que les événements mentaux internes.
Le travail de Skinner était enraciné dans l’idée que le conditionnement classique était beaucoup trop simpliste pour être une explication complète du comportement humain complexe . Il pensait que la meilleure façon de comprendre le comportement était d’examiner les causes d’une action et ses conséquences. Il a appelé cette approche le conditionnement opérant.
Pour visionner cette vidéo, veuillez activer JavaScript et envisager de passer à un navigateur Web prenant en charge la vidéo HTML5
BF Skinner – Opérateur C vidéo onditionnelle
BF Skinner: conditionnement opérant
Skinner est considéré comme le père du conditionnement opérant, mais son travail était basé sur celui de Thorndike ( 1898) loi d’effet. Selon ce principe, un comportement suivi de conséquences agréables est susceptible de se répéter, et un comportement suivi de conséquences désagréables est moins susceptible de se répéter.
Skinner a introduit un nouveau terme dans la loi de l’effet – Renforcement . le comportement qui est renforcé a tendance à être répété (c’est-à-dire renforcé); un comportement qui n’est pas renforcé a tendance à s’éteindre ou à s’éteindre (c’est-à-dire affaibli).
Skinner (1948) a étudié le conditionnement opérant en menant des expériences en utilisant des animaux qu’il a placés dans une « Skinner Box » qui était similaire à la boîte de puzzle de Thorndike.
Une boîte Skinner, également appelée une chambre de conditionnement opérant, est un dispositif utilisé pour enregistrer objectivement le comportement d’un animal dans un laps de temps compressé. Un animal peut être récompensé ou puni pour avoir adopté certains comportements, tels que la pression de levier (pour les rats) ou le picage de touches (pour les pigeons ).
Skinner a identifié trois types de réponses, ou opérants, qui peuvent suivre un comportement.
• Opérants neutres: réponses de l’environnement qui n’augmentent ni ne diminuent la probabilité qu’un comportement se répète.
• Renforceurs: réponses de l’environnement qui augmentent la probabilité qu’un comportement se répète. Reinf les orceurs peuvent être positifs ou négatifs.
• Punishers: Réponses de l’environnement qui diminuent la probabilité qu’un comportement se répète. La punition affaiblit le comportement.
Nous pouvons tous penser à des exemples de la façon dont notre propre comportement a été affecté par des renforçateurs et des punisseurs. En tant qu’enfant, vous avez probablement essayé un certain nombre de comportements et appris de leurs conséquences.
Par exemple, si lorsque vous étiez plus jeune vous aviez essayé de fumer à l’école, et que la principale conséquence était que vous vous trouviez dans la foule avec laquelle vous avez toujours voulu passer du temps, vous auriez été positivement renforcée (c’est-à-dire récompensé) et serait susceptible de répéter le comportement.
Si, cependant, la conséquence principale était que vous étiez attrapé, bastonné, suspendu de l’école et que vos parents se soient impliqués, vous auriez très certainement été puni, et vous seriez donc beaucoup moins enclin à fumer maintenant.
Renforcement positif
Le renforcement positif est un terme décrit par BF Skinner dans sa théorie du conditionnement opérant. En renforcement positif, une réponse ou un comportement est renforcé par des récompenses, conduisant à la répétition du comportement souhaité. La récompense est un stimulus de renforcement.
Skinner a montré comment le renforcement positif fonctionnait en plaçant un rat affamé dans sa boîte Skinner. La boîte contenait un levier sur le côté, et lorsque le rat se déplaçait autour de la boîte, il frappait accidentellement le levier. Immédiatement, il a fait ainsi une pastille alimentaire tomberait dans un récipient à côté du levier.
Les rats ont rapidement appris à aller directement au levier après avoir été mis plusieurs fois dans la boîte. La conséquence de recevoir de la nourriture s’ils appuyaient sur le levier garantissait qu’ils répéteraient l’action encore et encore.
Le renforcement positif renforce un comportement en fournissant une conséquence qu’un individu trouve gratifiante. Par exemple, si votre enseignant vous donne 5 £ chaque fois que vous terminez vos devoirs (c’est-à-dire une récompense), vous serez plus susceptible de répéter ce comportement à l’avenir, renforçant ainsi le comportement de terminer vos devoirs.
Renforcement négatif
Le renforcement négatif est la fin d’un état désagréable suite à une réponse. Ceci est connu sous le nom de renforcement négatif car c’est la suppression d’un stimulus indésirable qui est «gratifiant» pour l’animal ou la personne. Le renforcement négatif renforce le comportement car il arrête ou supprime une expérience désagréable.
Par exemple, si vous ne terminez pas vos devoirs, vous donnez 5 £ à votre professeur. Vous terminerez vos devoirs pour éviter de payer 5 £, renforçant ainsi le comportement de vos devoirs.
Skinner a montré comment le renforcement négatif fonctionnait en plaçant un rat dans sa boîte Skinner puis en le soumettant à un courant électrique désagréable qui lui a causé un certain inconfort. Lorsque le rat se déplaçait dans la boîte, il cognait accidentellement le levier. Immédiatement, il l’a fait pour que le courant électrique soit coupé. Les rats ont rapidement appris à aller directement au levier après avoir été mis plusieurs fois dans la boîte. La conséquence de s’échapper du courant électrique a assuré qu’ils répéteraient l’action encore et encore.
En fait, Skinner a même appris aux rats à éviter le courant électrique en allumant une lumière juste avant que le courant électrique ne s’allume. Les rats ont vite appris à appuyer sur le levier lorsque la lumière s’est allumée, car ils savaient que cela arrêterait l’allumage du courant électrique.
Ces deux réponses apprises sont connues sous le nom d’apprentissage d’évasion et d’apprentissage d’évitement.
Punition (affaiblit le comportement)
La punition est définie comme l’opposé du renforcement puisqu’elle est conçue pour affaiblir ou éliminer une réponse plutôt que pour l’augmenter. C’est un événement aversif qui diminue le comportement qu’il suit.
Comme le renforcement, la punition peut fonctionner soit en appliquant directement un stimulus désagréable comme un choc après une réponse, soit en supprimant un stimulus potentiellement gratifiant, par exemple, déduire l’argent de poche de quelqu’un pour punir un comportement indésirable.
Remarque: Il n’est pas toujours facile de faire la distinction entre punition et renforcement négatif.
Il y a de nombreux problèmes avec en utilisant la punition, comme:
- Le comportement puni n’est pas oublié, il est supprimé – le comportement revient lorsque la punition n’est plus présente.
- Provoque une agression accrue – montre que l’agression est un moyen de faire face aux problèmes.
- Crée une peur qui peut se généraliser à des comportements indésirables, par exemple la peur de l’école.
- Ne guide pas nécessairement vers le comportement souhaité – le renforcement vous indique ce qu’il faut faire, la punition vous dit seulement ce qu’il ne faut pas faire.
Calendriers de renfort
Imagi n un rat dans une « boîte Skinner. » Dans le conditionnement opérant, si aucune pastille alimentaire n’est livrée immédiatement après avoir appuyé sur le levier, après plusieurs tentatives, le rat arrête d’appuyer sur le levier (combien de temps quelqu’un continuerait-il à travailler si son employeur cessait de les payer?) Le comportement a été éteint.
Les comportementalistes ont découvert que différents modèles (ou horaires) de renforcement avaient des effets différents sur la vitesse d’apprentissage et d’extinction. Ferster et Skinner (1957) ont conçu différentes façons de fournir un renforcement et ont constaté que cela avait des effets sur
Skinner a trouvé que le type du renforcement qui produit le taux d’extinction le plus lent (c’est-à-dire que les gens continueront à répéter le comportement le plus longtemps sans renforcement) est le renforcement à rapport variable. Le type de ferraillage qui a le taux d’extinction le plus rapide est le ferraillage continu.
(A) Renfort continu
Un animal / humain est positivement renforcé à chaque fois qu’un comportement spécifique se produit, par exemple, chaque fois qu’un levier est enfoncé, une pastille est livrée, puis la livraison de nourriture est interrompue.
- Le taux de réponse est LENT
- Le taux d’extinction est RAPIDE
(B) Renforcement à rapport fixe
Le comportement est renforcé uniquement après que le comportement se produit un nombre spécifié de fois. Par exemple, un renforcement est donné après autant de réponses correctes, par exemple après chaque 5e réponse. Par exemple, un enfant reçoit une étoile pour chaque cinq mots correctement orthographiés.
- Le taux de réponse est RAPIDE
- Le taux d’extinction est MOYEN
(C) Renfort à intervalle fixe
Un renfort est donné après un intervalle de temps fixe à condition qu’au moins une réponse correcte ait été faite. Un exemple est payé à l’heure. Un autre exemple serait toutes les 15 minutes (demi-heure, heure, etc.) un granulé est livré (à condition qu’au moins une pression à levier ait été faite) puis la livraison de nourriture est interrompue.
- Taux de réponse est MOYEN
- Le taux d’extinction est MOYEN
(D) Renfort à rapport variable
le comportement est renforcé après un nombre de fois imprévisible. Par exemple, le jeu ou la pêche.
- Le taux de réponse est RAPIDE
- Le taux d’extinction est LENT (très difficile à éteindre en raison de l’imprévisibilité)
(E) Renforcement à intervalle variable
Si une réponse correcte a été apportée, le renforcement est donné après un laps de temps imprévisible, par exemple, en moyenne toutes les 5 minutes. Par exemple, un travailleur indépendant est payé à des moments imprévisibles.
- Le taux de réponse est RAPIDE
- Le taux d’extinction est LENT
Modification du comportement
La modification du comportement est un ensemble de thérapies / techniques basées sur le conditionnement opérant (Skinner, 1938, 1953). Le principe principal consiste à modifier les événements environnementaux liés au comportement d’une personne. Par exemple, le renforcement des comportements souhaités et ignorer ou punir ceux qui ne le sont pas.
Ce n’est pas aussi simple que cela puisse paraître – toujours renforcer le comportement souhaité, par exemple, est essentiellement de la corruption.
Il existe différents types de renforcements positifs. Le renforcement primaire est lorsqu’une récompense renforce un comportement par elle-même. Le renforcement secondaire est lorsque quelque chose renforce un comportement parce qu’il conduit à un principal renforçateur.
Les exemples de thérapie de modification du comportement incluent l’économie de jetons et la mise en forme du comportement.
L’économie de jetons
L’économie de jetons est un système dans lequel les comportements ciblés sont renforcés par jetons (renforçateurs secondaires) et plus tard échangés contre des récompenses (renforçateurs primaires).
Les jetons peuvent être sous la forme de faux billets, de boutons, de jetons de poker, d’autocollants, etc. Tandis que les récompenses peuvent aller des collations aux privilèges ou activités. Par exemple, les enseignants utilisent l’économie de jetons à l’école primaire en donnant des autocollants aux jeunes enfants pour récompenser les bons comportements.
L’économie de jetons s’est avérée très efficace dans la gestion des patients psychiatriques. Cependant, les patients peuvent devenir trop dépendants des jetons, ce qui les empêche de s’adapter à la société une fois qu’ils quittent la prison, l’hôpital, etc.
Le personnel qui met en œuvre un programme d’économie de jetons a beaucoup de pouvoir. Il est important que le personnel ne favorise pas ou n’ignore pas certaines personnes si le programme doit fonctionner. Par conséquent, le personnel doit être formé pour donner des jetons de manière équitable et cohérente, même en cas de changements, comme dans les prisons ou dans un hôpital psychiatrique.
Behavior Shaping
Une autre contribution importante de Skinner (1951) est le mouvement de mise en forme du comportement par rapprochement successif. Skinner soutient que les principes du conditionnement opérant peuvent être utilisés pour produire un comportement extrêmement complexe si des récompenses et des punitions sont délivrées de manière à encourager à déplacer un organisme plus près et plus près du comportement souhaité à chaque fois.
Pour ce faire, le les conditions (ou contingences) requises pour recevoir la récompense doivent changer chaque fois que l’organisme se rapproche du comportement souhaité.
Selon Skinner, la plupart des comportements animaux et humains (y compris le langage) peuvent être expliqués comme un produit de ce type d’approximations successives.
Applications pédagogiques
Dans la situation d’apprentissage conventionnelle, le conditionnement opérant s’applique en grande partie aux problèmes de gestion de classe et d’élève, plutôt qu’au contenu d’apprentissage. Il est très pertinent pour façonner les performances des compétences.
Un moyen simple de façonner le comportement consiste à fournir des commentaires sur les performances de l’apprenant, par exemple, des compliments, de l’approbation, des encouragements et des affirmations. Un rapport variable produit le taux de réponse le plus élevé pour les élèves apprenant une nouvelle tâche, dans laquelle le renforcement initial (par exemple, les éloges) se produit à des intervalles fréquents, et à mesure que la performance s’améliore, le renforcement se produit moins fréquemment, jusqu’à ce que finalement seuls les résultats exceptionnels soient renforcés.
Par exemple, si un enseignant souhaite encourager les élèves à répondre aux questions en classe, il doit les féliciter pour chaque tentative (que leur réponse soit correcte ou non). Peu à peu, l’enseignant ne fera l’éloge des élèves que lorsque leur réponse est correcte, et au fil du temps, seules les réponses exceptionnelles seront louées.
Les comportements indésirables, tels que le retard et la domination de la discussion en classe, peuvent être éteints en étant ignorés par l’enseignant (plutôt que d’être renforcés en attirant l’attention sur eux). Ce n’est pas une tâche facile, car l’enseignant peut sembler peu sincère s’il pense trop à la façon de se comporter.
La connaissance du succès est également importante car elle motive l’apprentissage futur. Cependant, il est important de faire varier le type de ferraillage donné pour que le comportement soit conservé. Ce n’est pas une tâche facile, car l’enseignant peut sembler peu sincère s’il / elle pense trop à la façon de se comporter.
Résumé
En regardant les études classiques de Skinner sur les pigeons Le comportement de ‘/ rat « nous pouvons identifier certaines des hypothèses majeures de l’approche comportementaliste.
• La psychologie doit être considérée comme une science à étudier de manière scientifique. L’étude de Skinner sur le comportement des rats a été menée dans des conditions de laboratoire soigneusement contrôlées.
• Le comportementalisme concerne principalement le comportement observable, par opposition aux événements internes comme la pensée et l’émotion. Notez que Skinner ne l’a pas fait. disent que les rats ont appris à appuyer sur un levier parce qu’ils voulaient de la nourriture. Il s’est plutôt concentré sur la description du comportement facilement observé que les rats ont acquis.
• L’influence majeure sur le comportement humain est d’apprendre de notre environnement . Dans l’étude Skinner, parce que la nourriture suivait un comportement particulier, les rats ont appris à répéter ce comportement, par exemple, le conditionnement opérant.
• Il y a peu de différence entre l’apprentissage qui a lieu chez l’homme et celui chez d’autres animaux. Par conséquent, la recherche (par exemple, le conditionnement opérant) peut être menée sur des animaux (rats / pigeons) ainsi que sur des humains. Skinner a proposé que la façon dont les humains apprennent le comportement est sensiblement la même que la façon dont les rats ont appris à appuyer sur un levier.
Donc, si l’idée de votre profane de la psychologie a toujours été de personnes dans les laboratoires portant des blouses blanches et regardant des rats malheureux essayer de négocier des labyrinthes pour se rendre à leur dîner, alors vous pensent probablement à la psychologie comportementale.
Le comportementalisme et ses ramifications ont tendance à être parmi les plus scientifiques des perspectives psychologiques. La psychologie comportementale met l’accent sur la façon dont nous apprenons à nous comporter de certaines manières.
Nous apprenons tous constamment de nouveaux comportements et comment modifier notre comportement existant. la psychologie comportementale est l’approche psychologique qui se concentre sur la façon dont cet apprentissage se déroule.
Évaluation critique
Le conditionnement opérant peut être utilisé pour expliquer une grande variété de comportements, à partir du processus d’apprentissage, à la dépendance et à l’acquisition du langage. Il a également une application pratique (comme l’économie de jetons) qui peut être appliquée dans les salles de classe, les prisons et les hôpitaux psychiatriques.
Cependant, le conditionnement opérant ne prend pas en compte le rôle des facteurs héréditaires et cognitifs dans l’apprentissage, et est donc une explication incomplète du processus d’apprentissage chez les humains et les animaux.
Par exemple, Kohler (1924) a découvert que les primates semblent souvent résoudre les problèmes en un éclair plutôt que d’être un apprentissage par essais et erreurs. De plus, la théorie de l’apprentissage social (Bandura, 1977) suggère que les humains peuvent apprendre automatiquement par l’observation plutôt que par l’expérience personnelle.
L’utilisation de la recherche animale dans les études de conditionnement opérant soulève également la question de l’extrapolation. Certains psychologues affirment que nous ne pouvons pas généraliser les études sur les animaux aux humains car leur anatomie et leur physiologie sont différentes de celles des humains, et ils ne peuvent pas penser à leurs expériences et invoquer la raison, la patience, la mémoire ou le confort de soi.
Références de style APA
Bandura , A. (1977). Théorie de l’apprentissage social. Englewood Cliffs, NJ: Prentice Hall.
Ferster, C. B., & Skinner, B. F. (1957). Horaires de renfort. New York: Appleton-Century-Crofts.
Kohler, W. (1924). La mentalité des singes. Londres: Routledge & Kegan Paul.
Skinner, B. F. (1938). Le comportement des organismes: une analyse expérimentale. New York: Appleton-Century.
Skinner, B. F. (1948). Superstition « dans le pigeon. Journal of Experimental Psychology, 38, 168-172.
Skinner, BF (1951). Comment enseigner les animaux. Freeman.
Skinner, BF (1953). Science et comportement humain. SimonandSchuster.com.
Watson, JB (1913 La psychologie telle que la conçoit le comportementaliste, Psychological Review, 20, 158–177.
Accueil | À propos | Index A-Z | Politique de confidentialité | Contactez-nous
Ce travail est concédé sous une licence Creative Commons Paternité-Pas d’Utilisation Commerciale-Pas de Travaux dérivés 3.0 Unported License.
Numéro d’enregistrement de l’entreprise: 10521846
signaler cette annonce