B. F. Skinner | Operante Konditionierung

Von Saul McLeod, aktualisiert 2018

Operante Konditionierung, auch als instrumentelle Konditionierung bekannt. ist eine Lernmethode, die normalerweise BF Skinner zugeschrieben wird, wobei die Konsequenzen einer Antwort die Wahrscheinlichkeit bestimmen, dass sie wiederholt wird. Durch operantes Konditionierungsverhalten wird sich das verstärkte (belohnte) Verhalten wahrscheinlich wiederholen, und das bestrafte Verhalten wird seltener auftreten.

In den 1920er Jahren hatte John B. Watson die akademische Psychologie verlassen, und andere Behavioristen wurden einflussreich und schlägt andere Formen des Lernens vor als die klassische Konditionierung. Das vielleicht wichtigste davon war Burrhus Frederic Skinner. Obwohl er aus offensichtlichen Gründen eher als BF Skinner bekannt ist.

Skinners Ansichten waren etwas weniger extrem als die von Watson (1913). Skinner glaubte, dass wir so etwas wie einen Verstand haben , aber dass es einfach produktiver ist, beobachtbares Verhalten zu untersuchen, als interne mentale Ereignisse.

Die Arbeit von Skinner beruhte auf der Ansicht, dass die klassische Konditionierung viel zu einfach war, um eine vollständige Erklärung für komplexes menschliches Verhalten zu sein Er glaubte, dass der beste Weg, Verhalten zu verstehen, darin besteht, die Ursachen einer Handlung und ihre Folgen zu untersuchen. Er nannte diesen Ansatz operante Konditionierung.

Um dieses Video anzuzeigen, aktivieren Sie bitte JavaScript und erwägen Sie ein Upgrade auf einen Webbrowser, der HTML5-Videos unterstützt.

BF Skinner – Operant C. onditioning video

BF Skinner: Operante Konditionierung

Skinner gilt als der Vater der operanten Konditionierung, aber seine Arbeit basierte auf Thorndikes ( 1898) Wirkungsgesetz. Nach diesem Prinzip wird sich Verhalten, dem angenehme Konsequenzen folgen, wahrscheinlich wiederholen, und Verhalten, dem unangenehme Konsequenzen folgen, wird sich seltener wiederholen.

Skinner hat einen neuen Begriff in das Gesetz der Wirkung – Verstärkung eingeführt . verstärktes Verhalten wird tendenziell wiederholt (d. h. verstärkt); Verhalten, das nicht verstärkt wird, neigt dazu, auszusterben oder ausgelöscht (dh geschwächt) zu werden.

Skinner (1948) untersuchte die Konditionierung von Operanten, indem er Experimente mit Tieren durchführte, die er in eine „Skinner Box“ legte, die ähnlich war zu Thorndikes Puzzle-Box.

Eine Skinner-Box, auch bekannt als Eine operative Konditionierungskammer ist ein Gerät, mit dem das Verhalten eines Tieres in einem komprimierten Zeitrahmen objektiv aufgezeichnet wird. Ein Tier kann für bestimmte Verhaltensweisen belohnt oder bestraft werden, z. B. durch Drücken des Hebels (für Ratten) oder Schlüsselpicken (für Tauben) ).

Skinner identifizierte drei Arten von Antworten oder Operanten, die dem Verhalten folgen können.

• Neutrale Operanten: Antworten aus der Umgebung, die die Wahrscheinlichkeit einer Wiederholung eines Verhaltens weder erhöhen noch verringern.

• Verstärker: Antworten aus der Umgebung, die die Wahrscheinlichkeit einer Wiederholung eines Verhaltens erhöhen. Reinf Krebserkrankungen können entweder positiv oder negativ sein.

• Bestrafer: Reaktionen aus der Umgebung, die die Wahrscheinlichkeit einer Wiederholung eines Verhaltens verringern. Bestrafung schwächt das Verhalten.

Wir können uns alle Beispiele vorstellen, wie unser eigenes Verhalten durch Verstärker und Bestrafer beeinflusst wurde. Als Kind haben Sie wahrscheinlich eine Reihe von Verhaltensweisen ausprobiert und aus deren Folgen gelernt.

Wenn Sie zum Beispiel in Ihrer Jugend versucht hätten, in der Schule zu rauchen, und die Hauptfolge war, dass Sie mit der Menge in Kontakt gekommen sind, mit der Sie immer abhängen wollten, wären Sie positiv gestärkt worden (dh belohnt) und würde das Verhalten wahrscheinlich wiederholen.

Wenn jedoch die Hauptfolge wäre, dass Sie erwischt, verprügelt, von der Schule suspendiert und Ihre Eltern beteiligt wurden, wären Sie mit Sicherheit bestraft worden, und Sie würden folglich jetzt viel weniger wahrscheinlich rauchen.

Positive Verstärkung

Positive Verstärkung ist ein Begriff, den BF Skinner in seiner Theorie der operanten Konditionierung beschrieben hat. Bei positiver Verstärkung wird eine Reaktion oder ein Verhalten durch Belohnungen verstärkt, was zur Wiederholung des gewünschten Verhaltens führt. Die Belohnung ist ein verstärkender Anreiz.

Skinner zeigte, wie positive Verstärkung funktioniert, indem er eine hungrige Ratte in seine Skinner-Box legte. Die Box enthielt einen Hebel an der Seite, und wenn sich die Ratte über die Box bewegte, klopfte sie versehentlich gegen den Hebel. Sofort fiel ein Lebensmittelpellet in einen Behälter neben dem Hebel.

Die Ratten lernten schnell, direkt zum Hebel zu gehen, nachdem sie einige Male in die Schachtel gelegt worden waren. Die Konsequenz des Erhaltens von Nahrung, wenn sie den Hebel drückten, stellte sicher, dass sie die Aktion immer wieder wiederholen würden.

Positive Verstärkung stärkt ein Verhalten, indem sie eine Konsequenz liefert, die eine Person als lohnend empfindet. Wenn Ihr Lehrer Ihnen beispielsweise jedes Mal, wenn Sie Ihre Hausaufgaben erledigen (dh eine Belohnung), £ 5 gibt, ist es wahrscheinlicher, dass Sie dieses Verhalten in Zukunft wiederholen, wodurch das Verhalten beim Erledigen Ihrer Hausaufgaben verstärkt wird.

Negative Verstärkung

Negative Verstärkung ist die Beendigung eines unangenehmen Zustands nach einer Reaktion. Dies wird als negative Verstärkung bezeichnet, da die Entfernung eines nachteiligen Stimulus das Tier oder die Person „belohnt“. Negative Verstärkung stärkt das Verhalten, da sie eine unangenehme Erfahrung stoppt oder beseitigt.

Wenn Sie beispielsweise Ihre Hausaufgaben nicht erledigen, geben Sie Ihrem Lehrer 5 £. Sie werden Ihre Hausaufgaben erledigen, um zu vermeiden, dass Sie 5 £ bezahlen, wodurch das Verhalten beim Erledigen Ihrer Hausaufgaben verstärkt wird.

Skinner zeigte, wie negative Verstärkung funktioniert, indem Sie eine Ratte in seine Skinner-Box legen und sie dann unterwerfen ein unangenehmer elektrischer Strom, der ihm Unbehagen bereitete. Wenn sich die Ratte über die Kiste bewegte, klopfte sie versehentlich auf den Hebel. Sofort wurde der elektrische Strom abgeschaltet. Die Ratten lernten schnell, direkt zum Hebel zu gehen, nachdem sie einige Male in die Schachtel gelegt worden waren. Die Folge des Entweichens des elektrischen Stroms stellte sicher, dass sie die Aktion immer wieder wiederholten.

Tatsächlich brachte Skinner den Ratten sogar bei, den elektrischen Strom zu vermeiden, indem er kurz vor dem Einschalten des elektrischen Stroms ein Licht einschaltete. Die Ratten lernten bald, den Hebel zu drücken, als das Licht aufleuchtete, weil sie wussten, dass dies das Einschalten des elektrischen Stroms stoppen würde.

Diese beiden gelernten Reaktionen werden als Fluchtlernen und Vermeidungslernen bezeichnet.

Bestrafung (schwächt das Verhalten)

Bestrafung wird als das Gegenteil von Verstärkung definiert, da sie eine Reaktion schwächen oder eliminieren soll, anstatt sie zu erhöhen. Es ist ein aversives Ereignis, das das Verhalten, dem es folgt, verringert.

Wie bei der Verstärkung kann die Bestrafung entweder durch direktes Anlegen eines unangenehmen Stimulus wie eines Schocks nach einer Reaktion oder durch Entfernen eines potenziell lohnenden Stimulus erfolgen, z. Das Taschengeld einer Person abziehen, um unerwünschtes Verhalten zu bestrafen.

Hinweis: Es ist nicht immer einfach, zwischen Bestrafung und negativer Verstärkung zu unterscheiden.

Es gibt viele Probleme mit Verwenden von Bestrafung, wie zum Beispiel:

Bestraftes Verhalten wird nicht vergessen, es wird unterdrückt – Verhalten kehrt zurück, wenn keine Bestrafung mehr vorhanden ist.
Verursacht erhöhte Aggression – zeigt diese Aggression ist ein Weg, um mit Problemen umzugehen.
Erzeugt Angst, die sich auf unerwünschte Verhaltensweisen verallgemeinern lässt, z. B. Angst vor der Schule.
Führt nicht unbedingt zum gewünschten Verhalten – Verstärkung sagt Ihnen, was zu tun ist Tun Sie, Bestrafung sagt Ihnen nur, was Sie nicht tun sollen.

Zeitpläne der Verstärkung

Imagi ne eine Ratte in einer „Skinner Box“. Wenn bei der operanten Konditionierung unmittelbar nach dem Drücken des Hebels kein Lebensmittelpellet abgegeben wird, hört die Ratte nach mehreren Versuchen auf, den Hebel zu drücken (wie lange würde jemand weiter zur Arbeit gehen, wenn sein Arbeitgeber die Zahlung einstellen würde?). Das Verhalten wurde ausgelöscht.

Behavioristen stellten fest, dass unterschiedliche Verstärkungsmuster (oder -pläne) unterschiedliche Auswirkungen auf die Lern- und Auslöschungsgeschwindigkeit hatten. Ferster und Skinner (1957) entwickelten verschiedene Methoden zur Bereitstellung von Verstärkung und stellten fest, dass dies Auswirkungen auf

hatte. Skinner stellte fest, dass der Typ Die Verstärkung, die die langsamste Extinktionsrate erzeugt (dh die Menschen wiederholen das Verhalten am längsten ohne Verstärkung), ist eine Verstärkung mit variablem Verhältnis. Die Art der Bewehrung mit der schnellsten Extinktionsrate ist die kontinuierliche Bewehrung.

(A) Kontinuierliche Bewehrung

Ein Tier / Mensch wird jedes Mal positiv verstärkt, wenn ein bestimmtes Verhalten auftritt, z. B. jedes Mal, wenn ein Hebel gedrückt wird, wird ein Pellet abgegeben, und dann wird die Nahrungsabgabe abgeschaltet.

Die Rücklaufquote ist LANGSAM
Die Extinktionsrate ist SCHNELL

(B) Verstärkung mit festem Verhältnis

Das Verhalten wird erst verstärkt, nachdem das Verhalten eine bestimmte Anzahl von Malen aufgetreten ist. B. wird eine Verstärkung nach so vielen korrekten Antworten gegeben, z. B. nach jeder fünften Antwort. Zum Beispiel erhält ein Kind für jeweils fünf richtig geschriebene Wörter einen Stern.

Antwortrate ist SCHNELL
Extinktionsrate ist MITTEL

(C) Verstärkung mit festem Intervall

Eine Verstärkung wird nach einem festen Zeitintervall gegeben, sofern mindestens eine korrekte Antwort erfolgt ist. Ein Beispiel wird stundenweise bezahlt. Ein anderes Beispiel wäre, alle 15 Minuten (halbe Stunde, Stunde usw.) ein Pellet zu liefern (vorausgesetzt, es wurde mindestens ein Hebel gedrückt), dann wird die Nahrungszufuhr abgeschaltet.

Rücklaufquote ist MITTEL
Die Extinktionsrate ist MITTEL

(D) Verstärkung mit variablem Verhältnis

Verhalten wird nach einer unvorhersehbaren Anzahl von Malen verstärkt. Zum Beispiel Glücksspiel oder Angeln.

Die Rücklaufquote ist SCHNELL
Die Aussterberate ist LANGSAM (aufgrund der Unvorhersehbarkeit sehr schwer zu löschen).

(E) Verstärkung mit variablem Intervall

Sofern eine korrekte Antwort erfolgt ist, erfolgt die Verstärkung nach Ablauf einer unvorhersehbaren Zeitspanne. zB durchschnittlich alle 5 Minuten. Ein Beispiel ist eine selbständige Person, die zu unvorhersehbaren Zeiten bezahlt wird.

Die Rücklaufquote ist SCHNELL
Die Aussterberate ist LANGSAM

Verhaltensänderung

Verhaltensänderung ist eine Reihe von Therapien / Techniken, die auf operanter Konditionierung basieren (Skinner, 1938, 1953). Das Hauptprinzip besteht darin, Umweltereignisse zu ändern, die mit dem Verhalten einer Person zusammenhängen. Zum Beispiel die Verstärkung gewünschter Verhaltensweisen und das Ignorieren oder Bestrafen unerwünschter Verhaltensweisen.

Dies ist nicht so einfach, wie es sich anhört – immer zu verstärken Das gewünschte Verhalten ist beispielsweise im Grunde genommen Bestechung.

Es gibt verschiedene Arten positiver Verstärkungen. Primäre Verstärkung ist, wenn eine Belohnung ein Verhalten von selbst stärkt. Sekundäre Verstärkung ist, wenn etwas ein Verhalten stärkt, weil es zu a führt Primärverstärker.

Beispiele für eine Therapie zur Verhaltensänderung sind Token Economy und Verhaltensformung.

Token Economy

Token Economy ist ein System, mit dem gezielte Verhaltensweisen verstärkt werden Token (sekundäre Verstärker) und später gegen Belohnungen (primäre Verstärker) eingetauscht.

Token können in Form von Falschgeld, Knöpfen, Pokerchips, Aufklebern usw. vorliegen. Die Belohnungen können von Snacks bis zu reichen Privilegien oder Aktivitäten Beispielsweise verwenden Lehrer die Token Economy in der Grundschule, indem sie kleinen Kindern Aufkleber geben, um gutes Verhalten zu belohnen.

Die Token Economy hat sich bei der Behandlung psychiatrischer Patienten als sehr effektiv erwiesen. Die Patienten können jedoch übermäßig auf die Token angewiesen sein, was es für sie schwierig macht, sich an die Gesellschaft anzupassen, wenn sie das Gefängnis, das Krankenhaus usw. verlassen.

Mitarbeiter, die ein Token-Economy-Programm implementieren, haben viel Macht. Es ist wichtig, dass die Mitarbeiter bestimmte Personen nicht bevorzugen oder ignorieren, wenn das Programm funktionieren soll. Daher muss das Personal geschult werden, um Token fair und konsistent zu geben, selbst wenn sich die Situation ändert, beispielsweise in Gefängnissen oder in einer psychiatrischen Klinik.

Verhaltensformung

Ein weiterer wichtiger Beitrag von Skinner (1951) ist eine Bewegung der Verhaltensformung durch sukzessive Annäherung. Skinner argumentiert, dass die Prinzipien der operanten Konditionierung verwendet werden können, um ein äußerst komplexes Verhalten zu erzeugen, wenn Belohnungen und Bestrafungen so geliefert werden, dass ein Organismus jedes Mal näher und näher an das gewünschte Verhalten herangeführt wird.

Um dies zu tun, muss der Die Bedingungen (oder Eventualitäten), die erforderlich sind, um die Belohnung zu erhalten, sollten sich jedes Mal ändern, wenn der Organismus dem gewünschten Verhalten einen Schritt näher kommt.

Laut Skinner können die meisten tierischen und menschlichen Verhaltensweisen (einschließlich der Sprache) als Produkt von erklärt werden Diese Art der sukzessiven Approximation.

Bildungsanwendungen

In der konventionellen Lernsituation bezieht sich die Operantenkonditionierung hauptsächlich auf Fragen des Klassen- und Studentenmanagements und nicht auf Lerninhalte. Dies ist sehr wichtig für die Gestaltung der Fähigkeitsleistung.

Eine einfache Möglichkeit, das Verhalten zu gestalten, besteht darin, Feedback zur Leistung der Lernenden zu geben, z. B. Komplimente, Zustimmung, Ermutigung und Bestätigung. Ein variables Verhältnis führt zu der höchsten Rücklaufquote für Schüler, die eine neue Aufgabe lernen, wobei anfänglich in regelmäßigen Abständen eine Verstärkung (z. B. Lob) erfolgt und die Verstärkung mit zunehmender Leistungsverbesserung seltener erfolgt, bis schließlich nur noch außergewöhnliche Ergebnisse verstärkt werden. P. >

Wenn ein Lehrer beispielsweise die Schüler ermutigen möchte, Fragen im Unterricht zu beantworten, sollte er sie für jeden Versuch loben (unabhängig davon, ob ihre Antwort richtig ist). Allmählich wird der Lehrer die Schüler nur dann loben, wenn ihre Antwort richtig ist, und im Laufe der Zeit werden nur außergewöhnliche Antworten gelobt.

Unerwünschte Verhaltensweisen wie Verspätung und dominierende Klassendiskussion können ausgelöscht werden, indem sie vom Lehrer ignoriert werden (anstatt durch Aufmerksamkeit verstärkt zu werden). Dies ist keine leichte Aufgabe, da der Lehrer unaufrichtig erscheinen kann, wenn er zu viel über das Verhalten nachdenkt.

Das Wissen über den Erfolg ist ebenfalls wichtig, da es das zukünftige Lernen motiviert. Es ist jedoch wichtig, die Art der Bewehrung zu variieren, damit das Verhalten erhalten bleibt. Dies ist keine leichte Aufgabe, da der Lehrer unaufrichtig erscheinen kann, wenn er zu viel über das Verhalten nachdenkt.

Zusammenfassung

Betrachten Sie Skinners klassische Studien über Tauben Mit dem Verhalten von ‚/ rat können wir einige der Hauptannahmen des behaviouristischen Ansatzes identifizieren.

• Psychologie sollte als zu untersuchende Wissenschaft angesehen werden auf wissenschaftliche Weise. Skinners Verhaltensstudie an Ratten wurde unter sorgfältig kontrollierten Laborbedingungen durchgeführt.

• Behaviorismus befasst sich hauptsächlich mit beobachtbarem Verhalten im Gegensatz zu internen Ereignissen wie Denken und Emotionen. Beachten Sie, dass Skinner dies nicht tat sagen, dass die Ratten gelernt haben, einen Hebel zu drücken, weil sie Nahrung wollten. Stattdessen konzentrierte er sich darauf, das leicht zu beobachtende Verhalten der Ratten zu beschreiben.

• Der Haupteinfluss auf das menschliche Verhalten besteht darin, aus unserer Umwelt zu lernen In der Skinner-Studie lernten die Ratten, weil das Essen einem bestimmten Verhalten folgte, dieses Verhalten zu wiederholen, z. B. die Konditionierung der Operanten.

• Es gibt kaum einen Unterschied zwischen dem Lernen beim Menschen und dem Daher kann die Forschung (z. B. operante Konditionierung) sowohl an Tieren (Ratten / Tauben) als auch an Menschen durchgeführt werden. Skinner schlug vor, dass die Art und Weise, wie Menschen Verhalten lernen, der Art und Weise entspricht, wie die Ratten gelernt haben, a zu drücken Hebel.

Wenn die Vorstellung Ihres Laien von Psychologie immer von Menschen in Labors stammt, die weiße Kittel tragen und unglückliche Ratten beobachten, die versuchen, Labyrinthe zu verhandeln, um zu ihrem Abendessen zu gelangen, dann Sie denken wahrscheinlich an Verhaltenspsychologie.

Behaviorismus und seine Ableger gehören zu den wissenschaftlichsten psychologischen Perspektiven. Der Schwerpunkt der Verhaltenspsychologie liegt darauf, wie wir lernen, uns auf bestimmte Weise zu verhalten.

Wir alle lernen ständig neue Verhaltensweisen und wie wir unser bestehendes Verhalten ändern können. Verhaltenspsychologie ist der psychologische Ansatz, der sich darauf konzentriert, wie dieses Lernen stattfindet.

Kritische Bewertung

Operante Konditionierung kann verwendet werden, um eine Vielzahl von Verhaltensweisen aus dem Prozess zu erklären des Lernens, der Sucht und des Spracherwerbs. Es hat auch praktische Anwendung (wie Token Economy), die in Klassenzimmern, Gefängnissen und psychiatrischen Krankenhäusern angewendet werden kann.

Bei der operanten Konditionierung wird jedoch die Rolle ererbter und kognitiver Faktoren beim Lernen nicht berücksichtigt Dies ist eine unvollständige Erklärung des Lernprozesses bei Menschen und Tieren.

Kohler (1924) stellte beispielsweise fest, dass Primaten Probleme häufig in einem Augenblick der Einsicht zu lösen scheinen, anstatt Versuch und Irrtum zu lernen. Die Theorie des sozialen Lernens (Bandura, 1977) legt nahe, dass Menschen automatisch durch Beobachtung und nicht durch persönliche Erfahrung lernen können.

Die Verwendung von Tierforschung in operanten Konditionierungsstudien wirft auch das Problem der Extrapolation auf. Einige Psychologen argumentieren, wir können nicht von Tierstudien auf Menschen verallgemeinern, da sich ihre Anatomie und Physiologie von denen des Menschen unterscheidet, und sie können nicht über ihre Erfahrungen nachdenken und sich auf Vernunft, Geduld, Gedächtnis oder Selbstkomfort berufen.

APA-Stilreferenzen

Bandura A. (1977). Theorie des sozialen Lernens. Englewood Cliffs, NJ: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Bewehrungspläne. New York: Appleton-Century-Crofts.

Kohler, W. (1924). Die Mentalität der Affen. London: Routledge & Kegan Paul.

Skinner, B. F. (1938). Das Verhalten von Organismen: Eine experimentelle Analyse. New York: Appleton-Jahrhundert.

Skinner, B. F. (1948). Aberglaube „in der Taube. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). Wie man Tiere unterrichtet. Freeman. P. >

Skinner, BF (1953). Wissenschaft und menschliches Verhalten. SimonandSchuster.com.

Watson, JB (1913) ). Psychologie, wie der Behaviorist sie sieht. Psychological Review, 20, 158–177.

Startseite | Über | A-Z Index | Datenschutzerklärung | Kontaktieren Sie uns

Dieses Werk unterliegt den Bestimmungen einer Creative Commons Namensnennung-Keine kommerzielle Nutzung-Keine Ableitung 3.0 Unported-Lizenz.

Firmenregistrierungsnummer: 10521846

Diese Anzeige melden

Mont Blanc

B.F. Skinner – Operante Konditionierung