B.F. Skinner | Operant Conditioning

Af Saul McLeod, opdateret 2018

Operant conditioning, også kendt som instrumental conditioning, er en metode til læring, der normalt tilskrives BF Skinner, hvor konsekvenserne af et svar bestemmer sandsynligheden for, at det gentages. Gennem operant konditioneringsadfærd, som er forstærket (belønnet), vil sandsynligvis gentages, og adfærd, der straffes, vil forekomme sjældnere.

I 1920’erne havde John B. Watson forladt akademisk psykologi, og andre adfærdsmænd blev ved at blive indflydelsesrige og foreslår nye former for læring end klassisk konditionering. Måske den vigtigste af disse var Burrhus Frederic Skinner. Skønt han af åbenlyse grunde er mere almindeligt kendt som BF Skinner.

Skinners synspunkter var lidt mindre ekstreme end Watson (1913). Skinner mente, at vi har sådan noget som et sind , men at det simpelthen er mere produktivt at studere observerbar adfærd snarere end interne mentale begivenheder.

Skinners arbejde var forankret i en opfattelse af, at klassisk konditionering var alt for forenklet til at være en fuldstændig forklaring på kompleks menneskelig adfærd Han mente, at den bedste måde at forstå adfærd på er at se på årsagerne til en handling og dens konsekvenser. Han kaldte denne tilgang operant betingelse.

For at se denne video skal du aktivere JavaScript og overveje at opgradere til en aweb-browser, der understøtter HTML5-video

BF Skinner – Operant C onditioneringsvideo

BF Skinner: Operant Conditioning

Skinner betragtes som far til Operant Conditioning, men hans arbejde var baseret på Thorndikes ( 1898) virkningslov. Ifølge dette princip gentages adfærd, der efterfølges af behagelige konsekvenser, sandsynligvis gentagne gange, og adfærd efterfulgt af ubehagelige konsekvenser er mindre tilbøjelige til at blive gentaget.

Skinner introducerede et nyt udtryk i loven om effekt – forstærkning . opførsel, der forstærkes, har tendens til at blive gentaget (dvs. styrket); adfærd, der ikke er forstærket, har tendens til at dø ud eller blive slukket (dvs. svækket).

Skinner (1948) studerede operant konditionering ved at udføre eksperimenter ved hjælp af dyr, som han placerede i en “Skinner Box”, som var ens til Thorndikes puslespilskasse.

En Skinner-boks, også kendt som et operant konditioneringskammer, er en anordning, der bruges til objektivt at registrere et dyrs opførsel i en komprimeret tidsramme. Et dyr kan belønnes eller straffes for at engagere sig i visse opførsler, såsom tryk på håndtaget (for rotter) eller nøglehugning (for duer ).

Skinner identificerede tre typer svar eller operanter, der kan følge adfærd.

• Neutrale operanter: svar fra miljøet, der hverken øger eller mindsker sandsynligheden for, at en adfærd gentages.

• Forstærkere: Svar fra miljøet, der øger sandsynligheden for, at en adfærd gentages. orcers kan være enten positive eller negative.

• Punishers: Svar fra miljøet, der mindsker sandsynligheden for, at en adfærd gentages. Straf svækker adfærd.

Vi kan alle tænke på eksempler på, hvordan vores egen opførsel er blevet påvirket af forstærkere og straffere. Som barn prøvede du sandsynligvis en række adfærd og lærte af deres konsekvenser.

Hvis du for eksempel prøvede at ryge i skolen, da du var yngre, og den væsentligste konsekvens var, at du kom ind med den skare, som du altid ville være sammen med, ville du have været positivt forstærket (dvs. belønnet) og vil sandsynligvis gentage adfærden.

Hvis hovedkonsekvensen imidlertid var, at du blev fanget, spærret, suspenderet fra skolen, og dine forældre blev involveret, ville du helt sikkert have været straffet, og du ville derfor være meget mindre tilbøjelige til at ryge nu.

Positiv forstærkning

Positiv forstærkning er et udtryk beskrevet af BF Skinner i hans teori om operant konditionering. I positiv forstærkning styrkes et svar eller en adfærd ved belønninger, hvilket fører til gentagelse af ønsket adfærd. Belønningen er en forstærkende stimulus.

Skinner viste, hvordan positiv forstærkning fungerede ved at placere en sulten rotte i sin Skinner-boks. Kassen indeholdt et håndtag på siden, og når rotten bevægede sig rundt om kassen, ville den ved et uheld banke håndtaget. Straks gjorde det, så en fødevarepille skulle falde ned i en beholder ved siden af armen.

Rotterne lærte hurtigt at gå direkte til armen efter et par gange at være sat i kassen. Konsekvensen af at modtage mad, hvis de trykkede på håndtaget, sikrede, at de gentog handlingen igen og igen.

Positiv forstærkning styrker en adfærd ved at give en konsekvens, som et individ finder givende. For eksempel, hvis din lærer giver dig £ 5 hver gang du gennemfører dit hjemmearbejde (dvs. en belønning), er det mere sandsynligt, at du gentager denne adfærd i fremtiden og dermed styrker adfærden ved at færdiggøre dine lektier.

Negativ forstærkning

Negativ forstærkning er afslutningen på en ubehagelig tilstand efter et svar. Dette er kendt som negativ forstærkning, fordi det er fjernelsen af en ugunstig stimulus, der er ‘givende’ for dyret eller personen. Negativ forstærkning styrker adfærd, fordi den stopper eller fjerner en ubehagelig oplevelse.

For eksempel, hvis du ikke fuldfører dine lektier, giver du din lærer £ 5. Du vil fuldføre dit hjemmearbejde for at undgå at betale £ 5 og dermed styrke adfærden ved at fuldføre dit hjemmearbejde.

Skinner viste, hvordan negativ forstærkning fungerede ved at placere en rotte i sin Skinner-boks og derefter udsætte den for en ubehagelig elektrisk strøm, der forårsagede ubehag. Da rotten bevægede sig rundt om kassen, bankede den ved et uheld. Straks gjorde det, så den elektriske strøm ville blive slukket. Rotterne lærte hurtigt at gå direkte til armen efter et par gange at være sat i kassen. Konsekvensen af at undslippe den elektriske strøm sikrede, at de gentog handlingen igen og igen.

Faktisk lærte Skinner endda rotterne at undgå den elektriske strøm ved at tænde et lys lige før den elektriske strøm kom på. Rotterne lærte snart at trykke på håndtaget, når lyset tændte, fordi de vidste, at dette ville stoppe den elektriske strøm, der blev tændt.

Disse to lærte svar er kendt som Escape Learning og Avoidance Learning.

Straf (svækker adfærd)

Straf defineres som det modsatte af forstærkning, da den er designet til at svække eller eliminere et svar snarere end at øge det. Det er en aversiv begivenhed, der mindsker den adfærd, den følger.

Ligesom forstærkning kan straf arbejde enten ved direkte at anvende en ubehagelig stimulus som et chok efter et svar eller ved at fjerne en potentielt givende stimulus, for eksempel trække andres lommepenge til at straffe uønsket adfærd.

Bemærk: Det er ikke altid let at skelne mellem straf og negativ forstærkning.

Der er mange problemer med ved hjælp af straf, såsom:

Straffet adfærd glemmes ikke, det undertrykkes – adfærd vender tilbage, når straf ikke længere er til stede.
Forårsager øget aggression – viser, at aggression er en måde at tackle problemer på.
Skaber frygt, der kan generalisere til uønsket adfærd, fx skoleskræk.
Vejviser ikke nødvendigvis mod ønsket adfærd – forstærkning fortæller dig, hvad du skal gør, straf fortæller dig kun, hvad du ikke skal gøre.

Forstærkningsplaner

Imagi ne en rotte i en “Skinner-boks.” Ved operant konditionering, hvis der ikke leveres madpille umiddelbart efter at håndtaget er trykket ned, stopper rotten efter flere forsøg med at trykke på håndtaget (hvor længe vil nogen fortsætte med at gå på arbejde, hvis deres arbejdsgiver stopper med at betale dem?). Adfærden er blevet slukket.

Behaviorists opdagede, at forskellige mønstre (eller tidsplaner) for forstærkning havde forskellige virkninger på læringshastigheden og udryddelsen. Ferster og Skinner (1957) udtænkte forskellige måder at levere forstærkning på og fandt ud af, at dette havde virkninger på

Skinner fandt, at typen af forstærkning, der producerer den langsomste udryddelseshastighed (dvs. folk vil fortsætte med at gentage adfærd i længst tid uden forstærkning) er forstærkning med variabelt forhold. Den type armering, der har den hurtigste udryddelseshastighed, er kontinuerlig armering.

(A) Kontinuerlig armering

Et dyr / menneske forstærkes positivt hver gang en bestemt adfærd opstår, fx hver gang der trykkes på en håndtag, leveres en pille, og derefter afleveres mad.

Svarprocent er langsom
Udryddelsesrate er HURTIG

(B) Forstærkning af fast forhold

Adfærd forstærkes kun, efter at adfærden forekommer et bestemt antal gange. fx en forstærkning gives efter hvert så mange korrekte svar, fx efter hvert 5. svar. For eksempel modtager et barn en stjerne for hver fem ord, der er stavet korrekt.

Svarprocent er HURTIG
Udryddelsesrate er MEDIUM

(C) Fast intervalforstærkning

Én forstærkning gives efter et fast tidsinterval, der giver mindst et korrekt svar. Et eksempel betales pr. Time. Et andet eksempel ville være hvert 15. minut (en halv time, time osv.), Hvor en pille leveres (forudsat at der er foretaget mindst et håndtag), hvorefter madforsyningen lukkes.

Svarprocent er MEDIUM
Udryddelsesrate er MEDIUM

(D) Variabel forholdsforstærkning

adfærd forstærkes efter et uforudsigeligt antal gange. Eksempler på hasardspil eller fiskeri.

Svarprocent er HURTIG
Udryddelsesrate er langsom (meget svær at slukke på grund af uforudsigelighed)

(E) Variabel intervalforstærkning

Hvis der er foretaget et korrekt svar, gives forstærkning efter uforudsigelig tid, f.eks. i gennemsnit hvert 5. minut. Et eksempel er, at en selvstændig erhvervsdrivende får løn på uforudsigelige tidspunkter.

Svarprocent er HURTIG
Udryddelsesfrekvensen er SLOW

Adfærdsmodifikation

Adfærdsmodifikation er et sæt terapier / teknikker baseret på operant konditionering (Skinner, 1938, 1953). Hovedprincippet består i at ændre miljøhændelser, der er relateret til en persons adfærd. For eksempel forstærkning af ønsket adfærd og ignorering eller straf af uønskede.

Dette er ikke så simpelt som det lyder – altid forstærkende ønsket adfærd er for eksempel grundlæggende bestikkelse.

Der er forskellige typer positive forstærkninger. Primær forstærkning er, når en belønning styrker en adfærd i sig selv. Sekundær forstærkning er, når noget styrker en adfærd, fordi det fører til en primær forstærker.

Eksempler på adfærdsmodifikationsterapi inkluderer tokenøkonomi og adfærdsformning.

Tokenøkonomi

Tokenøkonomi er et system, hvor målrettet adfærd forstærkes med tokens (sekundære forstærkere) og senere byttes mod belønninger (primære forstærkere).

Tokens kan være i form af falske penge, knapper, pokerchips, klistermærker osv. Mens belønningerne kan variere alt fra snacks til privilegier eller aktiviteter Eksempelvis bruger lærere tokenøkonomi i folkeskolen ved at give små børn klistermærker til belønning af god opførsel.

Tokenøkonomi har vist sig at være meget effektiv til styring af psykiatriske patienter. Patienterne kan dog blive alt for afhængige af poletterne, hvilket gør det vanskeligt for dem at tilpasse sig samfundet, når de forlader fængsel, hospital osv.

Personale, der implementerer et token-økonomiprogram, har meget magt. Det er vigtigt, at personalet ikke favoriserer eller ignorerer bestemte personer, hvis programmet skal arbejde. Derfor skal personalet trænes i at give tokens retfærdigt og konsekvent, selv når der sker ændringer i fx fængsler eller på et psykiatrisk hospital.

Behavior Shaping

Et yderligere vigtigt bidrag fra Skinner (1951) er følelsen af adfærdsformning gennem successiv tilnærmelse. Skinner hævder, at principperne for operatørkonditionering kan bruges til at producere ekstremt kompleks adfærd, hvis belønninger og straffe leveres på en sådan måde, at de tilskynder til at flytte en organisme tættere på og tættere på den ønskede adfærd hver gang. betingelser (eller beredskaber), der kræves for at modtage belønningen, skal skifte hver gang organismen bevæger sig et skridt nærmere den ønskede adfærd.

Ifølge Skinner kan de fleste dyre- og menneskelige adfærd (inklusive sprog) forklares som et produkt af denne type successive tilnærmelse.

Uddannelsesapplikationer

I den konventionelle indlæringssituation gælder operant-betingelse i vid udstrækning for emner inden for klasse- og studenterledelse snarere end til læringsindhold. Det er meget relevant at forme færdighedens ydeevne.

En enkel måde at forme adfærd på er at give feedback om elevernes præstationer, f.eks. Komplimenter, godkendelse, opmuntring og bekræftelse. Et variabelt forhold giver den højeste svarprocent for studerende, der lærer en ny opgave, hvor oprindelig forstærkning (f.eks. Ros) forekommer med hyppige intervaller, og efterhånden som præstationen forbedres, forekommer forstærkning sjældnere, indtil i sidste ende kun ekstraordinære resultater forstærkes. >

Hvis en lærer for eksempel vil tilskynde eleverne til at besvare spørgsmål i klassen, skal de rose dem for hvert forsøg (uanset om deres svar er korrekt). Gradvist vil læreren kun rose eleverne, når deres svar er korrekt, og over tid vil kun ekstraordinære svar blive rost.

Uønsket adfærd, som forsinkelse og dominerende klassediskussion, kan slukkes ved at blive ignoreret af læreren (snarere end at blive forstærket ved at få opmærksomhed mod dem). Dette er ikke en let opgave, da læreren kan synes at være oprigtig, hvis han / hun tænker for meget på måden at opføre sig på.

Viden om succes er også vigtig, da den motiverer fremtidig læring. Det er dog vigtigt at variere typen af forstærkning, der er givet, så adfærden opretholdes. Dette er ikke en let opgave, da læreren kan synes at være oprigtig, hvis han / hun tænker for meget på måden at opføre sig på.

Resumé

Ser man på Skinners klassiske studier af duer ‘/ rotts adfærd kan vi identificere nogle af de største antagelser om den adfærdsmæssige tilgang.

• Psykologi skal ses som en videnskab, der skal studeres på en videnskabelig måde. Skinners undersøgelse af adfærd hos rotter blev udført under omhyggeligt kontrollerede laboratorieforhold.

• Behaviorisme handler primært om observerbar adfærd i modsætning til interne begivenheder som tænkning og følelser. Bemærk at Skinner ikke gjorde det siger, at rotterne lærte at trykke på en håndtag, fordi de ønskede mad. Han koncentrerede sig i stedet om at beskrive den let observerede adfærd, som rotterne erhvervede.

• Den største indflydelse på menneskelig adfærd er at lære af vores miljø. I Skinner-undersøgelsen lærte rotterne at gentage denne adfærd, fordi mad fulgte en bestemt adfærd, f.eks. Operant konditionering.

• Der er ringe forskel mellem den læring, der finder sted hos mennesker, og at i andre dyr. Derfor kan forskning (f.eks. operant konditionering) udføres på dyr (rotter / duer) såvel som på mennesker. Skinner foreslog, at den måde, mennesker lærer opførsel på, er meget den samme som den, rotterne lærte at trykke på løftestang.

Så hvis din lægmands idé om psykologi altid har været folk i laboratorier, der bærer hvide frakker og ser ulykkelige rotter prøve at forhandle labyrinter for at komme til deres middag, så tænker sandsynligvis på adfærdsmæssig psykologi.

Behaviorisme og dens udfald er en af de mest videnskabelige af de psykologiske perspektiver. Vægten i adfærdspsykologi er på, hvordan vi lærer at opføre os på bestemte måder.

Vi lærer alle konstant nye adfærd, og hvordan vi kan ændre vores eksisterende adfærd. adfærdsmæssig psykologi er den psykologiske tilgang, der fokuserer på, hvordan denne læring finder sted.

Kritisk evaluering

Operatørkonditionering kan bruges til at forklare en bred vifte af adfærd fra processen af læring, afhængighed og sprogtilegnelse. Det har også praktisk anvendelse (såsom token-økonomi), som kan anvendes i klasselokaler, fængsler og psykiatriske hospitaler.

Operativ konditionering tager dog ikke hensyn til den rolle, som arvelige og kognitive faktorer spiller i læring, og således er en ufuldstændig forklaring på læringsprocessen hos mennesker og dyr.

F.eks. fandt Kohler (1924), at primater ofte ser ud til at løse problemer i et glimt af indsigt snarere end at være prøve- og fejlindlæring. Også social læringsteori (Bandura, 1977) antyder, at mennesker kan lære automatisk gennem observation snarere end gennem personlig erfaring.

Brug af dyreforskning i operante konditioneringsstudier rejser også spørgsmålet om ekstrapolering. Nogle psykologer hævder, at vi ikke kan generalisere fra undersøgelser af dyr til mennesker, da deres anatomi og fysiologi er forskellig fra mennesker, og de kan ikke tænke på deres oplevelser og påberåbe sig fornuft, tålmodighed, hukommelse eller selvkomfort.

APA Style Referencer

Bandura A. (1977). Social læringsteori. Englewood Cliffs, NJ: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Tidsplaner for forstærkning. New York: Appleton-Century-Crofts.

Kohler, W. (1924). Abernes mentalitet. London: Routledge & Kegan Paul.

Skinner, B. F. (1938). Organismenes opførsel: En eksperimentel analyse. New York: Appleton-Century.

Skinner, B. F. (1948). Overtro “i duen. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). Sådan lærer du dyr. Freeman.

Skinner, BF (1953). Videnskab og menneskelig adfærd. SimonandSchuster.com.

Watson, JB (1913 Psykologi, som adfærdsforskeren ser det. Psykologisk gennemgang, 20, 158–177.

Hjem | Om | AZ-indeks | Fortrolighedspolitik | Kontakt os

Dette arbejde er licenseret under en Creative Commons-tilskrivning-ikke-kommerciel-ingen afledte arbejder 3.0 ikke-porteret licens.

Virksomhedsregistreringsnummer: 10521846

rapporter denne annonce

Mont Blanc

B.F. Skinner – Operant Conditioning