B.F. Skinner | Operant Conditioning

Av Saul McLeod, oppdatert 2018

Operant condition, også kjent som instrumental conditioning, er en læringsmetode som normalt tilskrives BF Skinner, hvor konsekvensene av et svar avgjør sannsynligheten for at det blir gjentatt. Gjennom operant kondisjon vil oppførsel som er forsterket (belønnet) sannsynligvis bli gjentatt, og atferd som straffes vil forekomme sjeldnere.

På 1920-tallet hadde John B. Watson forlatt akademisk psykologi, og andre atferdsmenn var i ferd med å bli innflytelsesrike, og foreslår nye former for læring enn klassisk kondisjonering. Den kanskje viktigste av disse var Burrhus Frederic Skinner. Selv om han av åpenbare grunner er mer kjent som BF Skinner.

Skinners synspunkter var litt mindre ekstreme enn Watson (1913). Skinner mente at vi har en slik ting som et sinn , men at det rett og slett er mer produktivt å studere observerbar oppførsel snarere enn indre mentale hendelser.

Skinner-arbeidet var forankret i et syn på at klassisk kondisjonering var altfor forenklet til å være en fullstendig forklaring på kompleks menneskelig atferd Han mente at den beste måten å forstå atferd på er å se på årsakene til en handling og dens konsekvenser. Han kalte denne tilnærmingen operant condition.

For å se denne videoen må du aktivere JavaScript, og vurdere å oppgradere til en nettleser som støtter HTML5-video

BF Skinner – Operant C onditioning video

BF Skinner: Operant Conditioning

Skinner regnes som far til Operant Conditioning, men hans arbeid var basert på Thorndikes ( 1898) lov om virkning. I følge dette prinsippet vil oppførsel som følges av behagelige konsekvenser sannsynligvis gjentas, og atferd etterfulgt av ubehagelige konsekvenser er mindre sannsynlig å bli gjentatt.

Skinner introduserte et nytt begrep i loven om effekt – forsterkning . atferd som forsterkes har en tendens til å bli gjentatt (dvs. styrket); atferd som ikke er forsterket, har en tendens til å dø ut eller bli slukket (dvs. svekket).

Skinner (1948) studerte operantkondisjonering ved å utføre eksperimenter ved bruk av dyr som han plasserte i en «Skinner Box» som var lik til Thorndikes puslespillboks.

En Skinner-boks, også kjent som et operant kondisjonskammer, er en innretning som brukes til å objektivt registrere et dyrs oppførsel i en komprimert tidsramme. Et dyr kan belønnes eller straffes for å engasjere seg i visse atferd, for eksempel å trykke på spaken (for rotter) eller nøkkelhakke (for duer ).

Skinner identifiserte tre typer svar, eller operant, som kan følge oppførsel.

• Nøytrale operanter: svar fra miljøet som verken øker eller reduserer sannsynligheten for at en atferd blir gjentatt.

• Forsterkere: Svar fra miljøet som øker sannsynligheten for at en atferd blir gjentatt. Reinf orcers kan være enten positive eller negative.

• Punishers: Svar fra omgivelsene som reduserer sannsynligheten for at en atferd blir gjentatt. Straff svekker atferd.

Vi kan alle tenke på eksempler på hvordan vår egen oppførsel har blitt påvirket av forsterkere og straffere. Som barn prøvde du sannsynligvis en rekke oppførsler og lærte av konsekvensene.

Hvis du for eksempel prøvde å røyke på skolen når du var yngre, og den viktigste konsekvensen var at du kom inn med mengden du alltid ønsket å henge med, ville du ha blitt positivt forsterket (dvs. belønnet) og vil sannsynligvis gjenta oppførselen.

Hvis imidlertid den viktigste konsekvensen var at du ble fanget, stukket, suspendert fra skolen og foreldrene dine ble involvert, ville du absolutt blitt straffet, og du ville følgelig ha mye mindre sannsynlighet for å røyke nå.

Positiv forsterkning

Positiv forsterkning er et begrep beskrevet av BF Skinner i hans teori om operant kondisjonering. I positiv forsterkning styrkes respons eller oppførsel av belønninger, noe som fører til gjentakelse av ønsket oppførsel. Belønningen er en forsterkende stimulans.

Skinner viste hvordan positiv forsterkning fungerte ved å plassere en sulten rotte i Skinner-boksen. Boksen inneholdt en spak på siden, og når rotten beveget seg rundt boksen, ville den ved et uhell banke på spaken. Umiddelbart gjorde det slik at en matpellet skulle falle ned i en container ved siden av spaken.

Rotter lærte raskt å gå rett til spaken etter noen ganger å ha blitt satt i esken. Konsekvensen av å motta mat hvis de trykket på spaken sørget for at de ville gjenta handlingen igjen og igjen.

Positiv forsterkning styrker en oppførsel ved å gi en konsekvens som et individ finner givende. For eksempel, hvis læreren din gir deg £ 5 hver gang du fullfører leksene dine (dvs. en belønning), vil du være mer sannsynlig å gjenta denne oppførselen i fremtiden, og dermed styrke oppførselen til å fullføre leksene dine.

Negativ forsterkning

Negativ forsterkning er avslutningen på en ubehagelig tilstand etter et svar. Dette er kjent som negativ forsterkning fordi det er fjerning av en uønsket stimulans som er «givende» for dyret eller personen. Negativ forsterkning styrker oppførselen fordi den stopper eller fjerner en ubehagelig opplevelse.

Hvis du for eksempel ikke fullfører leksene dine, gir du læreren din 5 £. Du vil fullføre leksene dine for å unngå å betale £ 5, og dermed styrke oppførselen til å fullføre leksene dine.

Skinner viste hvordan negativ forsterkning fungerte ved å plassere en rotte i Skinner-boksen og deretter utsette den for en ubehagelig elektrisk strøm som forårsaket noe ubehag. Når rotten beveget seg rundt boksen, ville den ved et uhell banke i spaken. Straks gjorde det slik at den elektriske strømmen ville bli slått av. Rotter lærte raskt å gå rett til spaken etter noen ganger å ha blitt satt i esken. Konsekvensen av å unnslippe den elektriske strømmen sørget for at de ville gjenta handlingen igjen og igjen.

Faktisk lærte Skinner til og med rottene å unngå elektrisk strøm ved å slå på et lys like før den elektriske strømmen kom på. Rotter lærte snart å trykke på spaken når lyset tente fordi de visste at dette ville stoppe den elektriske strømmen som ble slått på.

Disse to lærte svarene er kjent som Escape Learning and Avoidance Learning.

Straff (svekker oppførsel)

Straff er definert som det motsatte av forsterkning siden den er utformet for å svekke eller eliminere en respons i stedet for å øke den. Det er en aversiv hendelse som reduserer oppførselen den følger.

Som forsterkning kan straff fungere enten ved direkte å bruke en ubehagelig stimulus som et sjokk etter et svar eller ved å fjerne en potensielt givende stimulans, for eksempel, trekke andres lommepenger for å straffe uønsket oppførsel.

Merk: Det er ikke alltid lett å skille mellom straff og negativ forsterkning.

Det er mange problemer med ved hjelp av straff, for eksempel:

Straffet atferd glemmes ikke, det undertrykkes – atferd kommer tilbake når straff ikke lenger er tilstede.
Gir økt aggresjon – viser at aggresjon er en måte å takle problemer på.
Skaper frykt som kan generaliseres til uønsket atferd, f.eks. redsel for skolen.
Guider ikke nødvendigvis mot ønsket atferd – forsterkning forteller deg hva du skal gjør, straff forteller deg bare hva du ikke skal gjøre.

Tidsplaner for forsterkning

Imagi ne en rotte i en «Skinner-boks.» Hvis ingen matpellets blir levert umiddelbart etter at spaken er trykket, stopper rotten etter flere forsøk ved å trykke på spaken (hvor lenge vil noen fortsette å gå på jobb hvis arbeidsgiveren slutter å betale dem?). Atferden er slukket.

Behaviorists oppdaget at forskjellige mønstre (eller tidsplaner) for forsterkning hadde forskjellige effekter på hastigheten på læring og utryddelse. Ferster og Skinner (1957) utviklet forskjellige måter å levere forsterkning på og fant ut at dette hadde effekter på

Skinner fant at typen av forsterkning som gir den tregeste hastigheten på utryddelse (dvs. folk vil fortsette å gjenta oppførselen lengst uten forsterkning) er forsterkning med variabelt forhold. Den typen armering som har den raskeste utryddelsesgraden, er kontinuerlig armering.

(A) Kontinuerlig armering

Et dyr / menneske blir forsterket positivt hver gang en spesifikk oppførsel oppstår, for eksempel hver gang en spak trykkes, leveres en pellet, og deretter blir matleveringen avslått.

Svarprosenten er SLOW
Utryddelsesfrekvensen er RASKT

(B) Forsterkning av fast forhold

Atferd forsterkes bare etter at oppførselen skjer et spesifisert antall ganger. f.eks. gis en forsterkning etter hvert så mange riktige svar, f.eks. etter hvert 5. svar. For eksempel mottar et barn en stjerne for hvert femte ord som er stavet riktig.

Svarprosenten er RASKT
Utryddelsesfrekvensen er MEDIUM

(C) Fast intervallforsterkning

Én forsterkning gis etter et fast tidsintervall som gir minst ett riktig svar. Et eksempel blir betalt per time. Et annet eksempel vil være hvert 15. minutt (en halv time, time osv.) En pellet blir levert (forutsatt at minst ett spak er blitt laget), og deretter blir matleveringen stengt.

Svarprosent er MEDIUM
Ekstinksjonsrate er MEDIUM

(D) Variabel forholdsforsterkning

atferd forsterkes etter et uforutsigbart antall ganger. Eksempler på gambling eller fiske.

Svarprosenten er RASK
Utryddelsesfrekvensen er SLOW (veldig vanskelig å slukke på grunn av uforutsigbarhet)

(E) Variabel intervallforsterkning

Forutsatt at ett riktig svar er gjort, blir forsterkning gitt etter at uforutsigbar tid har gått, f.eks. i gjennomsnitt hvert 5. minutt. Et eksempel er at en selvstendig næringsdrivende får lønn på uforutsigbare tider.

Svarprosenten er RASK
Utryddelsesfrekvensen er SOM

Atferdsmodifisering

Atferdsmodifisering er et sett med terapier / teknikker basert på operant kondisjonering (Skinner, 1938, 1953). Hovedprinsippet består i å endre miljøhendelser som er relatert til en persons oppførsel. For eksempel forsterkning av ønsket atferd og ignorering eller straff av uønskede.

Dette er ikke så enkelt som det høres ut – alltid forsterkende ønsket oppførsel er for eksempel i utgangspunktet bestikkelse.

Det finnes forskjellige typer positive forsterkninger. Primær forsterkning er når en belønning styrker en oppførsel av seg selv. Sekundær forsterkning er når noe styrker en oppførsel fordi det fører til en primærforsterker.

Eksempler på atferdsendringsbehandling inkluderer tokenøkonomi og atferdsforming.

Token Economy

Tokenøkonomi er et system der målrettet atferd forsterkes med tokens (sekundære forsterkere) og senere byttet mot belønninger (primære forsterkere).

Tokens kan være i form av falske penger, knapper, pokersjips, klistremerker osv. Mens belønningen kan variere alt fra snacks til privilegier eller aktiviteter For eksempel bruker lærere tokenøkonomi på grunnskolen ved å gi små barn klistremerker for å belønne god oppførsel.

Tokenøkonomi har vist seg å være svært effektiv i å håndtere psykiatriske pasienter. Imidlertid kan pasientene bli altfor avhengige av tokens, noe som gjør det vanskelig for dem å tilpasse seg samfunnet når de forlater fengsel, sykehus osv.

Ansatte som implementerer et token-økonomiprogram har mye makt. Det er viktig at personalet ikke favoriserer eller ignorerer visse personer hvis programmet skal fungere. Derfor trenger personalet å bli opplært til å gi tokens rett og konsekvent, selv når det skjer endringer som i fengsler eller på et psykiatrisk sykehus.

Behavior Shaping

Et ytterligere viktig bidrag fra Skinner (1951) er en følelse av atferd som formes gjennom suksessiv tilnærming. Skinner argumenterer for at prinsippene for operatørkondisjonering kan brukes til å produsere ekstremt kompleks oppførsel hvis belønninger og straffer leveres på en slik måte at de oppfordrer til å flytte en organisme nærmere og nærmere ønsket oppførsel hver gang.

For å gjøre dette, forholdene (eller beredskapene) som kreves for å motta belønningen, bør skifte hver gang organismen beveger seg et skritt nærmere ønsket oppførsel.

Ifølge Skinner kan de fleste dyre- og menneskelige atferd (inkludert språk) forklares som et produkt av denne typen suksessive tilnærming.

Pedagogiske applikasjoner

I den konvensjonelle læringssituasjonen gjelder operant betingelse i stor grad spørsmål om klasse- og studentledelse, snarere enn for læringsinnhold. Det er veldig relevant for å forme ferdighetsprestasjoner.

En enkel måte å forme atferd på er å gi tilbakemelding på elevens prestasjoner, for eksempel komplimenter, godkjenning, oppmuntring og bekreftelse. Et variabelt forhold gir den høyeste svarprosenten for studenter som lærer en ny oppgave, hvor opprinnelig forsterkning (f.eks. Ros) skjer med hyppige intervaller, og etter hvert som ytelsen forbedres, skjer forsterkning sjeldnere, til til slutt bare eksepsjonelle resultater forsterkes.

Hvis en lærer for eksempel vil oppmuntre elevene til å svare på spørsmål i klassen, bør de rose dem for hvert forsøk (uavhengig av om svaret er riktig). Gradvis vil læreren bare rose elevene når svaret er riktig, og over tid vil bare eksepsjonelle svar bli hyllet.

Uønsket atferd, som forsinkelse og dominerende klassediskusjon, kan slukkes ved å bli ignorert av læreren (snarere enn å bli forsterket ved å få oppmerksomhet mot dem). Dette er ikke en lett oppgave, da læreren kan virke oppriktig hvis han / hun tenker for mye på måten å oppføre seg på.

Kunnskap om suksess er også viktig ettersom det motiverer fremtidig læring. Det er imidlertid viktig å variere typen armering som er gitt slik at oppførselen opprettholdes. Dette er ikke en enkel oppgave, da læreren kan virke oppriktig hvis han / hun tenker for mye på måten å oppføre seg på.

Sammendrag

Ser på Skinners klassiske studier på duer ‘/ rat «s atferd kan vi identifisere noen av de viktigste forutsetningene for atferdsmessige tilnærminger.

• Psykologi bør sees på som en vitenskap, som skal studeres på en vitenskapelig måte. Skinners studie av atferd hos rotter ble utført under nøye kontrollerte laboratorieforhold.

• Behaviorisme er primært opptatt av observerbar atferd, i motsetning til interne hendelser som tenkning og følelser. Merk at Skinner ikke si at rottene lærte å trykke på en spak fordi de ønsket mat. Han konsentrerte seg i stedet om å beskrive den lett observerte oppførselen som rottene fikk.

• Den største innflytelsen på menneskelig atferd er å lære av miljøet vårt. I Skinner-studien, fordi mat fulgte en bestemt oppførsel, lærte rottene å gjenta den oppførselen, f.eks. Operant kondisjonering.

• Det er liten forskjell mellom læringen som foregår hos mennesker og at hos andre dyr. Derfor kan forskning (f.eks. operant kondisjonering) utføres på dyr (rotter / duer) så vel som på mennesker. Skinner foreslo at måten mennesker lærer oppførsel på er mye det samme som rottene lærte å trykke på spak.

Så hvis lekmannen din har hatt en idé om psykologi om mennesker i laboratorier som har på seg hvite strøk og ser ulykkelige rotter prøve å forhandle labyrinter for å komme til middagen, så tenker sannsynligvis på atferdspsykologi.

Behaviorisme og dens utspring har en tendens til å være blant de mest vitenskapelige av de psykologiske perspektivene. Vekten av atferdspsykologi er på hvordan vi lærer å oppføre oss på bestemte måter.

Vi lærer hele tiden ny atferd og hvordan vi kan endre vår eksisterende atferd. atferdssykologi er den psykologiske tilnærmingen som fokuserer på hvordan denne læringen foregår.

Kritisk evaluering

Operatørkondisjonering kan brukes til å forklare et bredt spekter av atferd, fra prosessen av læring, til avhengighet og språkoppkjøp. Den har også praktisk anvendelse (som symboløkonomi) som kan brukes i klasserom, fengsler og psykiatriske sykehus.

Operativ kondisjonering tar imidlertid ikke hensyn til rollen som arvelige og kognitive faktorer i læring, og dermed er en ufullstendig forklaring på læringsprosessen hos mennesker og dyr.

Kohler (1924) fant for eksempel at primater ofte ser ut til å løse problemer i et blikk av innsikt i stedet for å være prøving og feiling. Også sosial læringsteori (Bandura, 1977) antyder at mennesker kan lære automatisk gjennom observasjon snarere enn gjennom personlig erfaring.

Bruk av dyreforskning i operante kondisjoneringsstudier reiser også spørsmålet om ekstrapolering. Noen psykologer hevder at vi ikke kan generalisere fra studier på dyr til mennesker, ettersom deres anatomi og fysiologi er forskjellig fra mennesker, og de kan ikke tenke på sine erfaringer og påkalle fornuft, tålmodighet, hukommelse eller selvkomfort.

APA Style Referanser

Bandura A. (1977). Sosial læringsteori. Englewood Cliffs, NJ: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Tidsplaner for forsterkning. New York: Appleton-Century-Crofts.

Kohler, W. (1924). Apenes mentalitet. London: Routledge & Kegan Paul.

Skinner, B. F. (1938). Organismers atferd: En eksperimentell analyse. New York: Appleton-Century.

Skinner, B. F. (1948). Superstition «in the pigeon. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). Hvordan lære dyr. Freeman.

Skinner, BF (1953). Vitenskap og menneskelig atferd. SimonandSchuster.com.

Watson, JB (1913 Psykologi slik atferdsmannen ser på den. Psykologisk gjennomgang, 20, 158–177.

Hjem | Om | A-Z indeks | Personvern | Kontakt oss

Dette arbeidet er lisensiert under en Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License.

Firma registrering nr: 10521846

rapporter denne annonsen

Mont Blanc

B.F. Skinner – Operant Conditioning (Norsk)