B.F. Skinner | Condicionamento operante

Por Saul McLeod, atualizado em 2018

Condicionamento operante, também conhecido como condicionamento instrumental, é um método de aprendizagem normalmente atribuído a BF Skinner, onde as consequências de uma resposta determinam a probabilidade de ela se repetir. Por meio do condicionamento operante, o comportamento reforçado (recompensado) provavelmente se repetirá, e o comportamento punido ocorrerá com menos frequência.

Na década de 1920, John B. Watson havia deixado a psicologia acadêmica e outros behavioristas estavam se tornando influente, propondo novas formas de aprendizagem além do condicionamento clássico. Talvez o mais importante deles tenha sido Burrhus Frederic Skinner. Embora, por razões óbvias, ele seja mais comumente conhecido como BF Skinner.

As opiniões de Skinner eram um pouco menos radicais do que as de Watson (1913). Skinner acreditava que temos uma coisa como uma mente , mas que é simplesmente mais produtivo estudar o comportamento observável em vez de eventos mentais internos.

O trabalho de Skinner estava enraizado em uma visão de que o condicionamento clássico era simplista demais para ser uma explicação completa do comportamento humano complexo . Ele acreditava que a melhor maneira de entender o comportamento é examinar as causas de uma ação e suas consequências. Ele chamou essa abordagem de condicionamento operante.

Para visualizar este vídeo, habilite o JavaScript e considere a possibilidade de atualizar para um navegador que suporte vídeo HTML5

BF Skinner – Operante C vídeo de condicionamento

BF Skinner: Condicionamento Operante

Skinner é considerado o pai do Condicionamento Operante, mas seu trabalho foi baseado no de Thorndike ( 1898) lei do efeito. De acordo com este princípio, o comportamento que é seguido por consequências agradáveis tende a se repetir, e o comportamento seguido por consequências desagradáveis tem menos probabilidade de se repetir.

Skinner introduziu um novo termo na Lei do Efeito – Reforço . o comportamento que é reforçado tende a ser repetido (isto é, fortalecido); comportamento que não é reforçado tende a morrer ou ser extinto (isto é, enfraquecido).

Skinner (1948) estudou o condicionamento operante conduzindo experimentos com animais que ele colocou em uma “Caixa de Skinner” que era semelhante à caixa de quebra-cabeça de Thorndike.

Uma caixa de Skinner, também conhecida como uma câmara de condicionamento operante, é um dispositivo usado para registrar objetivamente o comportamento de um animal em um período de tempo reduzido. Um animal pode ser recompensado ou punido por se envolver em certos comportamentos, como pressionar a alavanca (para ratos) ou bicar chave (para pombos ).

Skinner identificou três tipos de respostas, ou operantes, que podem seguir o comportamento.

• Operantes neutros: respostas do ambiente que não aumentam nem diminuem a probabilidade de um comportamento se repetir.

• Reforçadores: Respostas do ambiente que aumentam a probabilidade de um comportamento se repetir. orcers podem ser positivos ou negativos.

• Punidores: respostas do ambiente que diminuem a probabilidade de um comportamento ser repetido. A punição enfraquece o comportamento.

Todos nós podemos pensar em exemplos de como nosso próprio comportamento foi afetado por reforçadores e punidores. Provavelmente, quando criança, você experimentou vários comportamentos e aprendeu com suas consequências.

Por exemplo, se quando você era mais jovem, você tentou fumar na escola, e a principal consequência foi que você entrou no grupo com quem sempre quis sair, você teria sido positivamente reforçado (ou seja, recompensado) e provavelmente repetiria o comportamento.

Se, no entanto, a principal consequência fosse você ter sido pego, espancado, suspenso da escola e seus pais se envolverem, você certamente teria sido punido e conseqüentemente, você teria muito menos probabilidade de fumar agora.

Reforço positivo

O reforço positivo é um termo descrito por BF Skinner em sua teoria do condicionamento operante. No reforço positivo, uma resposta ou comportamento é fortalecido por recompensas, levando à repetição do comportamento desejado. A recompensa é um estímulo de reforço.

Skinner mostrou como o reforço positivo funcionava colocando um rato faminto em sua caixa de Skinner. A caixa continha uma alavanca lateral e, conforme o rato se movia, ele acidentalmente batia na alavanca. Imediatamente, uma bolinha de comida cairia em um recipiente próximo à alavanca.

Os ratos aprenderam rapidamente a ir direto para a alavanca após algumas vezes de serem colocados na caixa. A consequência de receber comida se eles pressionassem a alavanca garantiu que eles repetissem a ação continuamente.

O reforço positivo fortalece um comportamento ao fornecer uma consequência que um indivíduo considera gratificante. Por exemplo, se o seu professor lhe der £ 5 cada vez que você terminar o dever de casa (ou seja, uma recompensa), você terá mais probabilidade de repetir esse comportamento no futuro, fortalecendo assim o comportamento de fazer o dever de casa.

Reforço negativo

O reforço negativo é o término de um estado desagradável após uma resposta. Isso é conhecido como reforço negativo porque é a remoção de um estímulo adverso que é ‘recompensador’ para o animal ou pessoa. O reforço negativo fortalece o comportamento porque interrompe ou remove uma experiência desagradável.

Por exemplo, se você não concluir sua lição de casa, você dará ao seu professor £ 5. Você completará seu dever de casa para evitar o pagamento de £ 5, fortalecendo assim o comportamento de completar seu dever de casa.

Skinner mostrou como o reforço negativo funcionava colocando um rato em sua caixa de Skinner e, em seguida, submetendo-o a uma corrente elétrica desagradável que lhe causou algum desconforto. Conforme o rato se movia pela caixa, ele acidentalmente batia na alavanca. Imediatamente, a corrente elétrica seria desligada. Os ratos rapidamente aprenderam a ir direto para a alavanca após algumas vezes de serem colocados na caixa. A consequência de escapar da corrente elétrica garantiu que eles repetissem a ação continuamente.

Na verdade, Skinner até ensinou os ratos a evitar a corrente elétrica acendendo uma luz pouco antes de a corrente elétrica chegar. Os ratos logo aprenderam a apertar a alavanca quando a luz acendeu, porque sabiam que isso interromperia a ligação da corrente elétrica.

Essas duas respostas aprendidas são conhecidas como Aprendizado de fuga e Aprendizado de evitação.

Punição (enfraquece o comportamento)

A punição é definida como o oposto do reforço, pois é projetada para enfraquecer ou eliminar uma resposta ao invés de aumentá-la. É um evento aversivo que diminui o comportamento que segue.

Assim como o reforço, a punição pode funcionar aplicando diretamente um estímulo desagradável como um choque após uma resposta ou removendo um estímulo potencialmente recompensador, por exemplo, deduzir a mesada de alguém para punir comportamentos indesejáveis.

Observação: nem sempre é fácil distinguir entre punição e reforço negativo.

Existem muitos problemas com usando punição, como:

O comportamento punido não é esquecido, é suprimido – o comportamento retorna quando a punição não está mais presente.
Causa aumento da agressão – mostra que a agressão é uma maneira de lidar com os problemas.
Cria medo que pode generalizar para comportamentos indesejáveis, por exemplo, medo da escola.
Não orienta necessariamente para o comportamento desejado – o reforço diz a você o que fazer, punição só diz o que não fazer.

Programações de reforço

Imagi m um rato em uma “caixa de Skinner”. No condicionamento operante, se nenhum pellet de comida é entregue imediatamente após a alavanca ser pressionada, então, após várias tentativas, o rato para de pressionar a alavanca (por quanto tempo alguém continuaria a trabalhar se seu empregador parasse de pagá-lo?). O comportamento foi extinto.

Os behavioristas descobriram que diferentes padrões (ou esquemas) de reforço tinham diferentes efeitos na velocidade de aprendizado e extinção. Ferster e Skinner (1957) desenvolveram diferentes maneiras de fornecer reforço e descobriram que isso teve efeitos sobre

Skinner descobriu que o tipo de reforço que produz a taxa mais lenta de extinção (isto é, as pessoas continuarão repetindo o comportamento por mais tempo sem reforço) é o reforço de razão variável. O tipo de armadura que tem a taxa de extinção mais rápida é a armadura contínua.

(A) Armadura contínua

Um animal / humano é positivamente reforçado toda vez que ocorre um comportamento específico, por exemplo, toda vez que uma alavanca é pressionada, uma bolinha é distribuída e, em seguida, a entrega de comida é desligada.

A taxa de resposta é LENTA
A taxa de extinção é RÁPIDA

(B) Reforço de proporção fixa

O comportamento é reforçado apenas depois de ocorrer um determinado número de vezes. por exemplo, um reforço é dado após cada tantas respostas corretas, por exemplo, após cada 5ª resposta. Por exemplo, uma criança recebe uma estrela para cada cinco palavras soletradas corretamente.

A taxa de resposta é RÁPIDA
A taxa de extinção é MÉDIA

(C) Reforço de intervalo fixo

Um reforço é dado após um intervalo de tempo fixo, desde que pelo menos uma resposta correta tenha sido dada. Um exemplo é o pagamento por hora. Outro exemplo seria a cada 15 minutos (meia hora, hora, etc.) um pellet é entregue (desde que pelo menos uma alavanca tenha sido feita) e a entrega de comida é desligada.

Taxa de resposta é MÉDIA
Taxa de extinção é MÉDIA

(D) Reforço de razão variável

comportamento é reforçado após um número imprevisível de vezes. Por exemplo, jogos de azar ou pesca.

A taxa de resposta é RÁPIDA
A taxa de extinção é LENTA (muito difícil de extinguir por causa da imprevisibilidade)

(E) Reforço de intervalo variável

Fornecendo uma resposta correta, o reforço é dado após um período imprevisível de tempo ter passado, por exemplo, em média a cada 5 minutos. Um exemplo é uma pessoa autônoma sendo paga em horários imprevisíveis.

A taxa de resposta é RÁPIDA
A taxa de extinção é LENTA

Modificação do comportamento

A modificação do comportamento é um conjunto de terapias / técnicas baseadas no condicionamento operante (Skinner, 1938, 1953). O princípio básico compreende a mudança de eventos ambientais relacionados ao comportamento de uma pessoa. Por exemplo, o reforço de comportamentos desejados e ignorar ou punir os indesejados.

Isso não é tão simples quanto parece – sempre reforçando o comportamento desejado, por exemplo, é basicamente suborno.

Existem diferentes tipos de reforços positivos. O reforço primário é quando uma recompensa fortalece um comportamento por si só. O reforço secundário é quando algo fortalece um comportamento porque leva a um reforçador primário.

Exemplos de terapia de modificação de comportamento incluem economia simbólica e modelagem de comportamento.

Economia simbólica

A economia simbólica é um sistema no qual comportamentos direcionados são reforçados com fichas (reforçadores secundários) e posteriormente trocados por recompensas (reforços primários).

As fichas podem ser na forma de dinheiro falso, botões, fichas de pôquer, adesivos, etc. Enquanto as recompensas podem variar de lanches a privilégios ou atividades. Por exemplo, os professores usam a economia de fichas na escola primária, dando adesivos para crianças pequenas para recompensar o bom comportamento.

A economia de fichas tem se mostrado muito eficaz no gerenciamento de pacientes psiquiátricos. No entanto, os pacientes podem se tornar excessivamente dependentes dos tokens, tornando difícil para eles se ajustarem à sociedade depois de deixarem a prisão, o hospital, etc.

A equipe que implementa um programa de economia de tokens tem muito poder. É importante que a equipe não favoreça ou ignore certos indivíduos para que o programa funcione. Portanto, a equipe precisa ser treinada para dar fichas de forma justa e consistente, mesmo quando há mudanças de deslocamento, como em prisões ou em um hospital psiquiátrico.

Modelagem de comportamento

Outra contribuição importante feita por Skinner (1951) é o movimento da modelagem do comportamento por meio de sucessivas aproximações. Skinner argumenta que os princípios do condicionamento operante podem ser usados para produzir um comportamento extremamente complexo se recompensas e punições forem entregues de forma a encorajar a mover um organismo cada vez mais perto do comportamento desejado.

Para fazer isso, o as condições (ou contingências) necessárias para receber a recompensa devem mudar cada vez que o organismo se aproxima do comportamento desejado.

De acordo com Skinner, a maior parte do comportamento animal e humano (incluindo a linguagem) pode ser explicado como um produto de este tipo de aproximação sucessiva.

Aplicações educacionais

Na situação de aprendizagem convencional, o condicionamento operante se aplica amplamente a questões de gerenciamento de classe e aluno, ao invés de conteúdo de aprendizagem. É muito relevante para moldar o desempenho das habilidades.

Uma maneira simples de moldar o comportamento é fornecer feedback sobre o desempenho do aluno, por exemplo, elogios, aprovação, incentivo e afirmação. Uma razão variável produz a maior taxa de resposta para alunos que aprendem uma nova tarefa, pela qual inicialmente o reforço (por exemplo, elogio) ocorre em intervalos frequentes e, conforme o desempenho melhora, o reforço ocorre com menos frequência, até que, eventualmente, apenas resultados excepcionais são reforçados. >

Por exemplo, se um professor quiser encorajar os alunos a responderem a perguntas em sala de aula, ele deve elogiá-los por cada tentativa (independentemente de sua resposta estar correta). Gradualmente, o professor só elogiará os alunos quando a resposta deles for correta e, com o tempo, apenas respostas excepcionais serão elogiadas.

Comportamentos indesejados, como atrasos e discussões dominantes na classe podem ser extintos sendo ignorados pelo professor (em vez de serem reforçados por ter a atenção direcionada para eles). Esta não é uma tarefa fácil, pois o professor pode parecer insincero se pensar muito sobre a maneira de se comportar.

O conhecimento do sucesso também é importante, pois motiva a aprendizagem futura. Entretanto, é importante variar o tipo de reforço dado para que o comportamento seja mantido. Esta não é uma tarefa fácil, pois o professor pode parecer insincero se pensar muito sobre a maneira de se comportar.

Resumo

Observando os estudos clássicos de Skinner sobre pombos Podemos identificar alguns dos principais pressupostos da abordagem behaviorista.

• A psicologia deve ser vista como uma ciência a ser estudada de uma maneira científica. O estudo de Skinner sobre o comportamento em ratos foi conduzido sob condições de laboratório cuidadosamente controladas.

• O behaviorismo está principalmente preocupado com o comportamento observável, em oposição a eventos internos como pensamento e emoção. Observe que Skinner não dizem que os ratos aprenderam a pressionar uma alavanca porque queriam comida. Em vez disso, ele se concentrou em descrever o comportamento facilmente observado que os ratos adquiriram.

• A maior influência no comportamento humano é aprender com nosso ambiente . No estudo de Skinner, como a comida seguia um comportamento particular, os ratos aprenderam a repetir esse comportamento, por exemplo, condicionamento operante.

• Há pouca diferença entre o aprendizado que ocorre em humanos e aquele em outros animais. Portanto, a pesquisa (por exemplo, condicionamento operante) pode ser realizada em animais (Ratos / Pombos), bem como em humanos. Skinner propôs que a forma como os humanos aprendem o comportamento é muito semelhante à maneira como os ratos aprenderam a pressionar um alavanca.

Então, se a ideia de psicologia do seu leigo sempre foi de pessoas em laboratórios vestindo jalecos brancos e observando ratos infelizes tentando negociar labirintos para chegar ao seu jantar, então você provavelmente estão pensando em psicologia comportamental.

O Behaviorismo e seus desdobramentos tendem a estar entre as mais científicas das perspectivas psicológicas. A ênfase da psicologia comportamental está em como aprendemos a nos comportar de certas maneiras.

Estamos todos aprendendo constantemente novos comportamentos e como modificar nosso comportamento existente. psicologia comportamental é a abordagem psicológica que foca em como essa aprendizagem ocorre.

Avaliação crítica

O condicionamento operante pode ser usado para explicar uma ampla variedade de comportamentos, desde o processo da aprendizagem, ao vício e à aquisição da linguagem. Ele também tem aplicação prática (como economia de fichas) que pode ser aplicada em salas de aula, prisões e hospitais psiquiátricos.

No entanto, o condicionamento operante não leva em consideração o papel dos fatores hereditários e cognitivos na aprendizagem, e portanto, é uma explicação incompleta do processo de aprendizagem em humanos e animais.

Por exemplo, Kohler (1924) descobriu que os primatas muitas vezes parecem resolver problemas em um lampejo de percepção, em vez de uma aprendizagem por tentativa e erro. Além disso, a teoria da aprendizagem social (Bandura, 1977) sugere que os humanos podem aprender automaticamente por meio da observação, em vez da experiência pessoal.

O uso da pesquisa animal em estudos de condicionamento operante também levanta a questão da extrapolação. Alguns psicólogos argumentam que não podemos generalizar a partir de estudos em animais para humanos, pois sua anatomia e fisiologia são diferentes das humanas, e eles não podem pensar sobre suas experiências e invocar a razão, paciência, memória ou autoconforto.

Referências de estilo APA

Bandura , A. (1977). Teoria da aprendizagem social. Englewood Cliffs, NJ: Prentice Hall.

Ferster, C. B., & Skinner, B. F. (1957). Programações de reforço. Nova York: Appleton-Century-Crofts.

Kohler, W. (1924). A mentalidade dos macacos. Londres: Routledge & Kegan Paul.

Skinner, B. F. (1938). O comportamento dos organismos: uma análise experimental. Nova York: Appleton-Century.

Skinner, B. F. (1948). Superstition “in the pigeon. Journal of Experimental Psychology, 38, 168-172.

Skinner, BF (1951). How to teach animals. Freeman.

Skinner, BF (1953). Ciência e comportamento humano. SimonandSchuster.com.

Watson, JB (1913 ). A psicologia como o behaviorista a vê. Psychological Review, 20, 158-177

Home | Sobre | Índice A-Z | Política de privacidade | Fale Conosco

Este trabalho está licenciado sob a Licença Creative Commons Atribuição-Não Comercial-Sem Obras Derivadas 3.0 Unported.

Nº de registro da empresa: 10521846

denuncie este anúncio

Mont Blanc

B.F. Skinner – Condicionamento operante