Condicionamento operante: principais conceitos e técnicas
Dentro dos procedimentos comportamentais, o condicionamento operante ou instrumental é provavelmente aquele com as aplicações mais numerosas e variadas.
Do tratamento de fobias até superar vícios como fumar ou o alcoolismo, o esquema operante permite conceituar e modificar praticamente qualquer hábito a partir da intervenção sobre alguns elementos.
Mas O que exatamente é o condicionamento operante? Neste artigo, revisamos os principais conceitos para entender esse paradigma e detalhamos suas aplicações mais frequentes, tanto para aumentar comportamentos quanto para reduzi-los.
Antecedentes do condicionamento operante
O condicionamento operante como o conhecemos foi formulado e sistematizado por Burrhus Frederic Skinner com base nas ideias levantadas anteriormente por outros autores.
Ivan Pavlov Y John B. Watson eles descreveram o condicionamento clássico, também conhecido como condicionamento simples ou Pavlovian.
Por sua vez, Edward Thorndike introduziu a lei do efeito, o antecedente mais claro do condicionamento operante. A lei do efeito afirma que se um comportamento tiver consequências positivas para a pessoa que o executa, será é mais provável que se repita, ao passo que, se tiver consequências negativas, essa probabilidade diminuirá. No contexto do trabalho de Thorndike, o condicionamento operante é chamado de “instrumental”.
- Artigo relacionado: "Behaviorismo: história, conceitos e principais autores”
Diferença entre condicionamento clássico e operante
A principal diferença entre o condicionamento clássico e operante é que o primeiro se refere ao aprendizado de informações sobre um estímulo, enquanto o último envolve aprender sobre as consequências da resposta.
Skinner acreditava que o comportamento era muito mais fácil de modificar se suas consequências fossem manipuladas do que se os estímulos estivessem simplesmente associados a ele, como é o caso no condicionamento clássico. O condicionamento clássico é baseado na aquisição de respostas reflexas, o que explica uma menor quantidade de a aprendizagem e seus usos são mais limitados do que os do operante, uma vez que se refere a comportamentos que o sujeito pode controle à vontade.
- Artigo relacionado: "O condicionamento clássico e seus experimentos mais importantes”
Conceitos de condicionamento operante
A seguir iremos definir os conceitos básicos de condicionamento operante para melhor compreender este procedimento e suas aplicações.
Muitos desses termos são compartilhados por orientações comportamentais em geral, embora possam ter conotações específicas dentro do paradigma operante.
Resposta instrumental ou operante
Este termo designa qualquer comportamento que acarrete uma certa consequência e é suscetível a alterações com base nele. Seu nome indica que serve para obter algo (instrumental) e que atua sobre o médium (operante) em vez de ser desencadeado por ele, como é o caso do condicionamento clássico ou respondente.
Na teoria behaviorista, a palavra "resposta" é basicamente equivalente a "comportamento" e "ação", embora "resposta" pareça referir-se em maior medida à presença de estímulos fundo.
Consequência
Na psicologia comportamental e cognitivo-comportamental, uma consequência é o resultado de uma resposta. A consequência pode ser positiva (reforço) ou negativa (punição) para o sujeito que realiza a conduta; no primeiro caso, a probabilidade de a resposta ser dada aumentará e, no segundo, diminuirá.
É importante ter em mente que as consequências afetam a resposta e, portanto, a condicionamento operante, o que é reforçado ou punido é o dito comportamento, não a pessoa ou animal que realizada. Em todos os momentos você trabalha com a intenção de influenciam a forma como os estímulos e as respostas estão relacionadosJá a filosofia behaviorista evita partir de uma visão essencialista das pessoas, colocando mais ênfase no que pode mudar do que no que parece sempre permanecer o mesmo.
Reforço
Este termo designa o consequências dos comportamentos quando eles os tornam mais prováveis que eles aconteçam novamente. O reforço pode ser positivo, caso em que estaremos falando sobre a obtenção de uma recompensa ou prêmio pela execução de uma resposta, ou negativa, que inclui o desaparecimento de estímulos aversivos.
Reforço negativo interno podemos distinguir entre as respostas de evasão e fuga. Os comportamentos de evitação previnem ou previnem o aparecimento de um estímulo aversivo; por exemplo, uma pessoa com agorafobia que ele não sai de casa porque não se sente assim ansiedade você está evitando essa emoção. Em vez disso, as respostas de fuga fazem o estímulo desaparecer quando já está presente.
A diferença com a palavra "reforçador" é que ela se refere ao evento que ocorre como consequência do comportamento, e não ao procedimento de recompensar ou punir. Portanto, "reforçador" é um termo mais próximo de "recompensa" e "recompensa" do que de "reforço".
Punição
Uma punição é qualquer consequência de um determinado comportamento que diminui a probabilidade para que seja repetido.
Assim como o reforço, a punição pode ser positiva ou negativa. A punição positiva corresponde à apresentação de um estímulo aversivo após a ocorrência do resposta, enquanto a punição negativa é a retirada de um estímulo apetitivo como consequência do conduta.
A punição positiva pode estar relacionada ao uso geral da palavra “punição”, enquanto a punição negativa se refere mais a algum tipo de sanção ou multa. Se uma criança não para de gritar e recebe um tapa da mãe para se calar, ela estará aplicando um punição positiva, ao passo que se você tirar o console que está jogando, receberá uma punição negativo.
- Artigo relacionado: "8 razões para não usar castigo físico contra crianças”
Estímulo discriminativo e estímulo delta
Em psicologia, a palavra "estímulo" é usada para designar eventos que provocam uma resposta de uma pessoa ou animal. Dentro do paradigma operante, o estímulo discriminativo é aquele cuja presença indica ao sujeito aprendiz que se ele realizar um determinado comportamento, será conseqüência o aparecimento de um reforçador ou uma punição.
Em contrapartida, a expressão "estímulo delta" refere-se aos sinais que, quando presentes, informam que a execução da resposta não terá consequências.
O que é condicionamento operante?
O condicionamento instrumental ou operante é um procedimento de aprendizagem que se baseia na probabilidade de ocorrer uma determinada resposta depende das consequências esperado. No condicionamento operante, o comportamento é controlado por estímulos discriminativos presentes em a situação de aprendizagem que transmite informações sobre as prováveis consequências do responder.
Por exemplo, uma placa "Abra" em uma porta nos diz que, se tentarmos girar a maçaneta, muito provavelmente ela abrirá. Nesse caso, o pôster seria o estímulo discriminativo e a abertura da porta funcionaria como um reforço positivo da resposta instrumental de girar a maçaneta.
A análise comportamental aplicada de B. F. Skinner
Skinner desenvolveu técnicas de condicionamento operante que estão incluídos no que conhecemos como "análise aplicada do comportamento". Isso tem sido particularmente eficaz na educação de crianças, com ênfase especial em crianças com dificuldades de desenvolvimento.
O esquema básico da análise comportamental aplicada é o seguinte. Em primeiro lugar, é definida uma meta comportamental, que consistirá em aumentar ou reduzir certos comportamentos. Com base nisso, os comportamentos a serem desenvolvidos serão reforçados e os incentivos existentes para realizar os comportamentos a serem inibidos serão reduzidos.
Em geral a retirada dos reforçadores é mais desejável do que a punição positivo, pois gera menos rejeição e hostilidade por parte do sujeito. No entanto, a punição pode ser útil nos casos em que o comportamento problemático é muito perturbador e requer uma redução rápida, por exemplo, se houver violência.
Ao longo de todo o processo é imprescindível monitorar sistematicamente o andamento para poder verificar de forma objetiva se os objetivos desejados estão sendo alcançados. Isso é feito principalmente por meio do registro de dados.
Técnicas operantes para desenvolver comportamentos
Dada a importância e eficácia do reforço positivo, as técnicas operantes para aumentar os comportamentos têm se mostrado úteis. A seguir, descreveremos os mais relevantes desses procedimentos.
1. Técnicas de instigação
Técnicas de instigação são aquelas que dependem da manipulação de estímulos discriminativos para aumentar a probabilidade de ocorrência de um comportamento.
Este termo inclui instruções que aumentam determinados comportamentos, orientação física, que consiste em mover ou colocar partes do corpo de a pessoa treinada, e a modelagem, na qual um modelo é observado realizando um comportamento para poder imitá-lo e aprender o que é consequências. Esses três procedimentos têm em comum que eles se concentram em ensine o sujeito diretamente como realizar uma ação determinado, verbalmente ou fisicamente.
2. Moldagem
Consiste em aproximar gradativamente determinado comportamento do comportamento objetivo, partindo de uma resposta relativamente semelhante que o sujeito pode dar e modificando-a aos poucos. É realizado por etapas (aproximações sucessivas) às quais o reforço é aplicado.
A modelagem é considerada especialmente útil para estabelecer comportamentos em indivíduos que não podem se comunicar verbalmente, como pessoas com deficiência intelectual profunda ou animais.
3. Desbotando
Desvanecimento refere-se ao retirada gradual de ajudas ou instigadores que tinha sido usado para reforçar um comportamento alvo. Pretende-se que o sujeito consolide uma resposta e possa posteriormente realizá-la sem necessidade de ajuda externa.
É um dos conceitos-chave do condicionamento operantepois permite que o progresso feito na terapia ou treinamento seja generalizado para muitas outras áreas da vida.
Este procedimento consiste basicamente em substituir um estímulo discriminativo por um diferente.
4. Encadeamento
Uma cadeia comportamental, ou seja, um comportamento composto de vários comportamentos simples, é separada em diferentes etapas (links). A seguir, o sujeito deve aprender a executar os elos um a um até que consiga realizar a cadeia completa.
O encadeamento pode ser feito para frente ou para trás e tem a particularidade de cada elo reforça o anterior e funciona como um estímulo discriminativo próximo.
Em certos aspectos, boa parte das habilidades que são consideradas talentos por apresentarem um alto grau de habilidade e especialização nas mesmas (como tocar um instrumento muito bem musical, dançar muito bem, etc.) pode ser considerado o resultado de alguma forma de cadeia, já que desde as habilidades básicas se progride até chegar a outras muito mais trabalhado.
5. Programas de reforço
Em um procedimento de aprendizagem operante, os programas de reforço são os diretrizes que estabelecem quando o comportamento será recompensado e quando não.
Existem dois tipos básicos de programas de reforço: razão e intervalo. Em programas de razão, o reforçador é obtido após um determinado número de respostas serem dadas, enquanto em Isso acontece após um certo tempo ter passado desde o último comportamento reforçado e ele começa novamente. Se entregue.
Ambos os tipos de programa podem ser fixos ou variáveis, indicando que o número de respostas ou o intervalo o tempo necessário para obter o reforçador pode ser constante ou oscilar em torno de um valor média. Eles também podem ser contínuos ou intermitentes; Isso significa que a recompensa pode ser dada a cada vez que o sujeito realizar o comportamento-alvo ou de vez em quando (embora sempre como consequência de uma emissão da resposta desejada).
O reforço contínuo é mais útil para estabelecer comportamentos e o piscar para mantê-los. Assim, teoricamente, um cão aprenderá a dar patadas mais rápido se dermos uma guloseima cada vez que ele pata, mas uma vez que o comportamento é aprendido, será mais difícil para ele parar de fazê-lo se dermos a ele o reforço de um em três ou cinco Tentativas.
Técnicas operantes para reduzir ou eliminar comportamentos
Ao aplicar técnicas operantes para reduzir comportamentos, deve-se ter em mente que, uma vez que esses procedimentos pode ser desagradável para os assuntos, é sempre preferível usar o menos aversivo quando possível. Além disso essas técnicas são preferíveis a punições positivas.
Aqui está uma lista dessas técnicas em ordem do menor ao maior potencial para gerar aversão.
1. Extinção
O comportamento reforçado não é mais recompensado com anterioridade. Isso diminui a probabilidade de que a resposta ocorra novamente. Formalmente, a extinção é o oposto do reforço positivo.
Extinção de longo prazo é mais eficaz na eliminação de respostas do que punição e o resto das técnicas operantes para reduzir comportamentos, embora possam ser mais lentas.
Um exemplo básico de extinção é fazer uma criança parar de chutar, simplesmente ignorando-o até que ela perceba que seu O comportamento não tem as consequências desejadas (por exemplo, raiva dos pais, que funcionaria como um reforço) e você se cansa.
2. Pular treinamento
Nesse procedimento, o comportamento do sujeito é seguido pela ausência de recompensa; quer dizer, se a resposta for dada, o reforçador não será obtido. Um exemplo de treinamento de salto pode ser os pais impedindo a filha de assistir televisão naquela noite porque ela falou desrespeitosamente com eles. Outro exemplo seria o fato de não ir comprar os brinquedos que as crianças pedem, caso se comportem mal.
Em ambientes educacionais, também serve para promover que os esforços que outras pessoas fazem são mais valorizados para agradar aos mais pequenos e que estes, habituados a estes tratamentos, não valorizem.
3. Programas de reforço diferencial
Eles são um subtipo especial de programa de reforço usado para reduzir (não eliminar) comportamentos alvo, aumentando outros respostas alternativas. Por exemplo, uma criança pode ser recompensada por ler e se exercitar, e não por jogar console, se o último comportamento tiver a intenção de perder valor reforçador.
No reforço diferencial de baixa taxa, a resposta é reforçada se um certo período de tempo ocorrer após a última vez que ocorreu. No reforço diferencial de omissão, o reforço é obtido se, após um determinado período de tempo, a resposta não tiver ocorrido. O reforço diferencial de comportamentos incompatíveis consiste em reforçar respostas incompatíveis com o comportamento do problema; Este último procedimento se aplica a tiques e onicofagia, entre outros transtornos.
4. Custo de resposta
Variante de punição negativa em que a execução do comportamento problemático causa a perda de um reforçador. O cartão de pontos para motoristas, lançado na Espanha há alguns anos, é um bom exemplo de programa de custo de resposta.
5. Tempo fora
O castigo consiste em isolar o sujeito, geralmente crianças, em um ambiente não estimulante, caso ocorra o comportamento problemático. Também uma variante da punição negativa, difere do custo de resposta porque o que se perde é a possibilidade de acessar o reforço, não o intensificador em si.
6. Saciedade
O reforço obtido para a realização do comportamento é tão intenso ou grande que perde valor Eu tinha por assunto. Isso pode ocorrer por saciedade de resposta ou prática em massa (repetindo o comportamento até deixar de ter apetite) ou por saciedade do estímulo (o reforçador perde o apetite por excesso).
7. Hipercorreção
A sobrecorreção consiste em aplicar um punição positiva relacionada ao comportamento problemático. Por exemplo, é muito utilizado em casos de enurese, em que a criança é solicitada a lavar os lençóis após urinar em si mesma durante a noite.
Técnicas de organização de contingência
Os sistemas de organização de contingências são procedimentos complexos através dos quais você pode reforçar alguns comportamentos e punir outros.
A economia de tokens é um exemplo bem conhecido desse tipo de técnica. Consiste em entregar fichas (ou outros reforçadores genéricos equivalentes) como recompensa pelo desempenho dos comportamentos alvo; Posteriormente, os participantes podem trocar seus tokens por prêmios de valor variável. É usado em escolas, prisões e hospitais psiquiátricos.
Contratos comportamentais ou contingenciais são acordos entre várias pessoas, geralmente duas, por meio dos quais concordam em realizar (ou não realizar) determinados comportamentos. Os contratos detalham as consequências caso as condições acordadas sejam atendidas ou violadas.