B.F. Skinner | Operatörskonditionering

Av Saul McLeod, uppdaterad 2018

Operant conditioning, även känd som instrumental conditioning, är en inlärningsmetod som normalt tillskrivs BF Skinner, där konsekvenserna av ett svar avgör sannolikheten för att det upprepas. Genom operant konditioneringsbeteende som förstärks (belönas) kommer sannolikt att upprepas, och beteende som straffas kommer att inträffa mindre ofta.

Vid 1920-talet hade John B. Watson lämnat akademisk psykologi, och andra beteendevetare blev inflytelserika och föreslår nya former av lärande än klassisk konditionering. Den kanske viktigaste av dessa var Burrhus Frederic Skinner. Även om han av uppenbara skäl är mer allmänt känd som BF Skinner.

Skinners åsikter var något mindre extrema än Watsons (1913). Skinner trodde att vi har en sådan sak som ett sinne , men att det helt enkelt är mer produktivt att studera observerbart beteende snarare än inre mentala händelser.

Skinners arbete var förankrat i en uppfattning att klassisk konditionering var alldeles för enkel för att vara en fullständig förklaring av komplexa mänskliga beteenden Han trodde att det bästa sättet att förstå beteende är att titta på orsakerna till en åtgärd och dess konsekvenser. Han kallade detta tillvägagångssätt operant konditionering.

För att se den här videon, aktivera JavaScript och överväg att uppgradera till en webbläsare som stöder HTML5-video

BF Skinner – Operant C onditioning video

BF Skinner: Operant Conditioning

Skinner betraktas som fadern till Operant Conditioning, men hans arbete baserades på Thorndikes ( 1898) verkan. Enligt denna princip kommer beteende som följs av trevliga konsekvenser sannolikt att upprepas, och beteende följt av obehagliga konsekvenser är mindre sannolikt att upprepas.

Skinner introducerade en ny term i lagen om effekt – förstärkning . beteende som förstärks tenderar att upprepas (dvs förstärkas); beteende som inte förstärks tenderar att dö ut eller släckas (dvs försvagas).

Skinner (1948) studerade operantkonditionering genom att genomföra experiment med djur som han placerade i en ”Skinner Box” som var liknande till Thorndikes pusselruta.

En Skinner-box, även känd som en operant konditioneringskammare, är en anordning som används för att objektivt registrera ett djurs beteende i en komprimerad tidsram. Ett djur kan belönas eller straffas för att engagera sig i vissa beteenden, såsom spaktryckning (för råttor) eller nyckelpickning (för duvor ).

Skinner identifierade tre typer av svar, eller operant, som kan följa beteende.

• Neutrala operanter: svar från miljön som varken ökar eller minskar sannolikheten för att ett beteende upprepas.

• Förstärkare: Svar från miljön som ökar sannolikheten för att ett beteende upprepas. Reinf orcers kan vara antingen positiva eller negativa.

• Punishers: Svar från miljön som minskar sannolikheten för att ett beteende upprepas. Straff försvagar beteendet.

Vi kan alla tänka på exempel på hur vårt eget beteende har påverkats av förstärkare och straffare. Som barn testade du förmodligen ett antal beteenden och lärde dig av deras konsekvenser.

Om du till exempel försökte röka i skolan när du var yngre, och den främsta konsekvensen var att du kom in med publiken som du alltid ville umgås med, skulle du ha blivit positivt förstärkt (dvs. belönas) och skulle sannolikt upprepa beteendet.

Om dock den huvudsakliga konsekvensen var att du blev fångad, rottad, avstängd från skolan och dina föräldrar blev involverade skulle du säkert ha blivit straffad och du skulle följaktligen vara mycket mindre benägna att röka nu.

Positiv förstärkning

Positiv förstärkning är en term som beskrivs av BF Skinner i sin teori om operantkonditionering. I positiv förstärkning förstärks ett svar eller beteende genom belöningar, vilket leder till upprepning av önskat beteende. Belöningen är en förstärkande stimulans.

Skinner visade hur positiv förstärkning fungerade genom att placera en hungrig råtta i sin Skinner-låda. Lådan innehöll en spak på sidan, och när råttan rörde sig runt lådan skulle den av misstag slå på spaken. Omedelbart gjorde det så att en matpellet skulle falla ner i en behållare bredvid spaken.

Råttorna lärde sig snabbt att gå direkt till spaken efter att ha satts i lådan några gånger. Konsekvensen av att få mat om de tryckte på spaken säkerställde att de skulle upprepa åtgärden om och om igen.

Positiv förstärkning stärker ett beteende genom att ge en konsekvens som en individ finner givande. Till exempel, om din lärare ger dig £ 5 varje gång du gör dina läxor (dvs. en belöning) är det mer sannolikt att du upprepar detta beteende i framtiden och därmed förstärker beteendet för att slutföra dina läxor.

Negativ förstärkning

Negativ förstärkning är avslutandet av ett obehagligt tillstånd efter ett svar. Detta kallas negativ förstärkning eftersom det är avlägsnandet av en ogynnsam stimulans som är ”givande” för djuret eller personen. Negativ förstärkning stärker beteendet eftersom det stoppar eller tar bort en obehaglig upplevelse.

Om du till exempel inte slutför läxorna ger du din lärare 5 £. Du kommer att slutföra dina läxor för att undvika att betala £ 5, vilket stärker beteendet för att slutföra dina läxor.

Skinner visade hur negativ förstärkning fungerade genom att placera en råtta i sin Skinner-låda och sedan utsätta den för en obehaglig elektrisk ström som orsakade det lite obehag. När råttan rörde sig runt lådan skulle den av misstag slå på spaken. Omedelbart gjorde det så att den elektriska strömmen skulle stängas av. Råttorna lärde sig snabbt att gå direkt till spaken efter att ha ställts i lådan några gånger. Konsekvensen av att komma undan den elektriska strömmen säkerställde att de skulle upprepa åtgärden om och om igen.

Faktiskt lärde Skinner till och med råttorna att undvika den elektriska strömmen genom att sätta på ett ljus strax innan den elektriska strömmen kom på. Råttorna lärde sig snart att trycka på spaken när lampan tändes eftersom de visste att detta skulle stoppa den elektriska strömmen som slås på.

Dessa två inlärda svar kallas Escape Learning and Avoidance Learning.

Bestraffning (försvagar beteende)

Bestraffning definieras som motsatsen till förstärkning eftersom den är utformad för att försvaga eller eliminera ett svar snarare än att öka det. Det är en aversiv händelse som minskar beteendet som följer.

Liksom förstärkning kan straff fungera antingen genom att direkt tillämpa en obehaglig stimulans som en chock efter ett svar eller genom att ta bort en potentiellt givande stimulans, till exempel dra av någons fickpengar för att straffa oönskat beteende.

Obs: Det är inte alltid lätt att skilja mellan straff och negativ förstärkning.

Det finns många problem med att använda straff, till exempel:

Straffat beteende glöms inte bort, det undertrycks – beteendet återkommer när straffet inte längre finns.
Orsakar ökad aggression – visar att aggression är ett sätt att hantera problem.
Skapar rädsla som kan generaliseras till oönskade beteenden, t.ex. rädsla för skolan.
Styr inte nödvändigtvis mot önskat beteende – förstärkning säger vad du ska gör, straff säger bara vad du inte ska göra.

Scheman för förstärkning

Imagi ne en råtta i en ”Skinner box.” Om ingen matpellet levereras omedelbart efter att spaken trycks ned, slutar råttan efter flera försök att trycka på spaken (hur länge skulle någon fortsätta att arbeta om deras arbetsgivare slutade betala dem?). Beteendet har släckts.

Behaviorists upptäckte att olika mönster (eller scheman) för förstärkning hade olika effekter på inlärningshastigheten och utrotningen. Ferster och Skinner (1957) utformade olika sätt att leverera förstärkning och fann att detta hade effekter på

Skinner fann att typen av förstärkning som ger den långsammaste utrotningsgraden (dvs. människor kommer att fortsätta att upprepa beteendet längst utan förstärkning) är förstärkning med variabelt förhållande. Den typ av förstärkning som har den snabbaste utrotningsgraden är kontinuerlig förstärkning.

(A) Kontinuerlig förstärkning

Ett djur / människa förstärks positivt varje gång ett specifikt beteende inträffar, t.ex. varje gång en spak trycks in levereras en pellets och därefter stängs matleveransen av.

Svarsfrekvensen är LÅNG
Utrotningsgraden är FAST

(B) Förstärkning med fast förhållande

Beteendet förstärks först efter att beteendet inträffar ett visst antal gånger. till exempel en förstärkning ges efter varje så många korrekta svar, t.ex. efter varje 5: e svar. Till exempel får ett barn en stjärna för varje fem ord som stavas korrekt.

Svarsfrekvensen är SNABB
Utrotningsgraden är MEDIUM

(C) Fast intervallförstärkning

En förstärkning ges efter ett fast tidsintervall, vilket ger åtminstone ett korrekt svar. Ett exempel betalas per timme. Ett annat exempel skulle vara var 15: e minut (halvtimme, timme osv.) En pellets levereras (förutsatt att minst en spakpress har gjorts) stängs sedan matleveransen.

Svarsfrekvens är MEDIUM
Utrotningsgraden är MEDIUM

(D) Förstärkning av variabelt förhållande

beteende förstärks efter ett oförutsägbart antal gånger. Exempel på spel eller fiske.

Svarsfrekvensen är SNABB
Utrotningsgraden är LÅNG (mycket svår att släcka på grund av oförutsägbarhet)

(E) Variabel intervallförstärkning

Om ett korrekt svar har gjorts, får förstärkning efter en oförutsägbar tid, t.ex. i genomsnitt var 5: e minut. Ett exempel är att en egenföretagare får betalt vid oförutsägbara tider.

Svarsfrekvensen är SNABB
Utrotningsgraden är LÅNG

Beteendemodifiering

Beteendemodifiering är en uppsättning terapier / tekniker baserade på operant konditionering (Skinner, 1938, 1953). Huvudprincipen omfattar förändrade miljöhändelser som är relaterade till en persons beteende. Till exempel förstärkning av önskat beteende och ignorering eller bestraffning av oönskade.

Detta är inte så enkelt som det låter – förstärker alltid önskat beteende, till exempel, är i grunden mutor.

Det finns olika typer av positiva förstärkningar. Primär förstärkning är när en belöning stärker ett beteende i sig själv. Sekundär förstärkning är när något stärker ett beteende eftersom det leder till en primär förstärkare.

Exempel på beteendemodifieringsbehandling inkluderar tokenekonomi och beteendeformning.

Token Economy

Token economy är ett system där riktat beteende förstärks med tokens (sekundära förstärkare) och senare bytas mot belöningar (primära förstärkare).

Tokens kan vara i form av falska pengar, knappar, pokermarker, klistermärken etc. Medan belöningarna kan variera var som helst från snacks till privilegier eller aktiviteter lärare använder exempelvis token-ekonomi i grundskolan genom att ge små barn klistermärken för att belöna bra beteende.

Token-ekonomi har visat sig vara mycket effektivt för att hantera psykiatriska patienter. Patienterna kan dock bli alltför beroende av poletterna, vilket gör det svårt för dem att anpassa sig till samhället när de lämnar fängelset, sjukhuset etc.

Personal som genomför ett program för tokenekonomi har mycket makt. Det är viktigt att personalen inte gynnar eller ignorerar vissa individer om programmet ska fungera. Därför måste personalen utbildas för att ge tokens rättvist och konsekvent även när det sker förändringar i fängelser eller på ett psykiatriskt sjukhus.

Behavior Shaping

Ytterligare ett viktigt bidrag från Skinner (1951) är en känsla av beteendeformning genom successiv tillnärmning. Skinner hävdar att principerna för operatörskonditionering kan användas för att producera extremt komplexa beteenden om belöningar och straff levereras på ett sådant sätt att de uppmuntrar att flytta en organism närmare och närmare det önskade beteendet varje gång.

För att göra detta, villkor (eller oförutsedda utgifter) som krävs för att ta emot belöningen bör flyttas varje gång organismen rör sig ett steg närmare det önskade beteendet.

Enligt Skinner kan de flesta djur- och mänskliga beteenden (inklusive språk) förklaras som en produkt av denna typ av successiv approximation.

Utbildningsapplikationer

I den konventionella inlärningssituationen gäller operantkonditionering till stor del för frågor om klass- och studenthantering snarare än för inlärningsinnehåll. Det är mycket relevant för att forma skicklighetsprestanda.

Ett enkelt sätt att forma beteende är att ge feedback om elevernas prestationer, t.ex. komplimanger, godkännande, uppmuntran och bekräftelse. Ett variabelt förhållande ger den högsta svarsfrekvensen för studenter som lär sig en ny uppgift, varigenom förstärkning (t.ex. beröm) initialt inträffar med frekventa intervaller och när prestandan förbättras förstärker sig mindre ofta tills så småningom endast exceptionella resultat förstärks. >

Om en lärare till exempel vill uppmuntra eleverna att svara på frågor i klassen bör de berömma dem för varje försök (oavsett om deras svar är korrekt). Gradvis kommer läraren att berömma eleverna bara när deras svar är korrekt, och med tiden kommer endast exceptionella svar att berömas.

Oönskade beteenden, som långsamhet och dominerande klassdiskussion, kan släckas genom att ignoreras av läraren (snarare än att förstärkas genom att uppmärksamma dem). Det här är ingen lätt uppgift, eftersom läraren kan verka uppriktig om han / hon tänker för mycket på sättet att bete sig.

Kunskap om framgång är också viktig eftersom det motiverar framtida lärande. Det är dock viktigt att variera typen av förstärkning som ges så att beteendet bibehålls. Det här är ingen lätt uppgift, eftersom läraren kan verka uppriktig om han / hon tänker för mycket på sättet att bete sig.

Sammanfattning

Tittar på Skinners klassiska studier om duvor. ’/ råttas beteende kan vi identifiera några av de viktigaste antagandena för beteendemässigt tillvägagångssätt.

• Psykologi bör ses som en vetenskap som ska studeras på ett vetenskapligt sätt. Skinners studie av beteende hos råttor genomfördes under noggrant kontrollerade laboratorieförhållanden.

• Behaviorism handlar främst om observerbart beteende, i motsats till interna händelser som tänkande och känslor. Observera att Skinner inte gjorde det säg att råttorna lärde sig att trycka på en spak för att de ville ha mat. Han koncentrerade sig istället på att beskriva det lätt observerade beteendet som råttorna förvärvade.

• Det största inflytandet på mänskligt beteende är att lära av vår miljö. I Skinner-studien, eftersom mat följde ett visst beteende, lärde sig råttorna att upprepa detta beteende, t.ex. operant konditionering.

• Det finns liten skillnad mellan det lärande som sker hos människor och att hos andra djur. Därför kan forskning (t.ex. operant konditionering) utföras på djur (råttor / duvor) såväl som på människor. Skinner föreslog att sättet människor lär sig beteende är ungefär samma sätt som råttorna lärde sig att trycka på spak.

Så, om din lekmannas idé om psykologi alltid har handlat om människor i laboratorier som bär vita rockar och ser olyckliga råttor försöka förhandla om labyrinter för att komma till middagen, tänker antagligen på beteendepsykologi.

Behaviorism och dess utslag tenderar att vara bland de mest vetenskapliga av de psykologiska perspektiven. Betoningen hos beteendepsykologi ligger på hur vi lär oss att bete oss på vissa sätt.

Vi lär oss alla ständigt nya beteenden och hur vi kan ändra vårt befintliga beteende. beteendepsykologi är det psykologiska tillvägagångssättet som fokuserar på hur detta lärande sker.

Kritisk utvärdering

Operativ konditionering kan användas för att förklara en mängd olika beteenden, från processen lärande, beroende och språkförvärv. Den har också praktisk tillämpning (som symbolisk ekonomi) som kan användas i klassrum, fängelser och psykiatriska sjukhus.

Operativ konditionering tar dock inte hänsyn till rollen som ärvda och kognitiva faktorer i inlärningen, och sålunda är en ofullständig förklaring av inlärningsprocessen hos människor och djur.

Kohler (1924) fann till exempel att primater ofta verkar lösa problem i en glimt av insikt snarare än att vara inlärning av försök och fel. Dessutom föreslår social inlärningsteori (Bandura, 1977) att människor kan lära sig automatiskt genom observation snarare än genom personlig erfarenhet.

Användningen av djurforskning i operativa konditioneringsstudier väcker också frågan om extrapolering. Vissa psykologer hävdar att vi inte kan generalisera från studier på djur till människor eftersom deras anatomi och fysiologi skiljer sig från människor, och de kan inte tänka på sina erfarenheter och åberopa förnuft, tålamod, minne eller självkomfort.

APA-stilreferenser

Bandura A. (1977). Social inlärningsteori. Englewood Cliffs, NJ: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Scheman för förstärkning. New York: Appleton-Century-Crofts.

Kohler, W. (1924). Aparnas mentalitet. London: Routledge & Kegan Paul.

Skinner, B. F. (1938). Organismernas beteende: En experimentell analys. New York: Appleton-Century.

Skinner, B. F. (1948). Vidskepelse ”i duvan. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). Hur man undervisar djur. Freeman.

Skinner, BF (1953). Vetenskap och mänskligt beteende. SimonandSchuster.com.

Watson, JB (1913 Psykologi som beteendevetaren ser det. Psykologisk granskning, 20, 158–177.

Hem | Om | A-Z Index | Sekretesspolicy | Kontakta oss

Detta arbete är licensierat under en Creative Commons Erkännande-Icke-kommersiell-Ingen Derivative Works 3.0 Unported License. p>

Företagsregistreringsnummer: 10521846

rapportera den här annonsen

Mont Blanc

B.F. Skinner – operatörskonditionering