Conditionnement opérant: principaux concepts et techniques
Au sein des procédures comportementales, le conditionnement opérant ou instrumental est probablement celui dont les applications sont les plus nombreuses et les plus variées.
Du traitement de phobies jusqu'à surmonter des dépendances telles que fumeur ou la alcoolisme, le schéma opérant permet de conceptualiser et de modifier pratiquement n'importe quelle habitude à partir de l'intervention sur quelques éléments.
Mais Qu'est-ce que le conditionnement opérant exactement ? Dans cet article, nous passons en revue les concepts clés pour comprendre ce paradigme et détailler ses applications les plus fréquentes, à la fois pour augmenter les comportements et pour les réduire.
Antécédents du conditionnement opérant
Le conditionnement opérant tel que nous le connaissons a été formulé et systématisé par Burrhus Frédéric Skinner sur la base des idées précédemment soulevées par d'autres auteurs.
Ivan Pavlov Oui Jean B. Watson ils avaient décrit le conditionnement classique, également appelé conditionnement simple ou Pavlovien.
Pour sa part, Edward Thorndike a introduit la loi de l'effet, l'antécédent le plus clair du conditionnement opérant. La loi des effets stipule que si un comportement a des conséquences positives pour la personne qui l'exécute, il sera plus susceptible de se répéter, tandis que si cela a des conséquences négatives, cette probabilité diminuera. Dans le contexte des travaux de Thorndike, le conditionnement opérant est dit « instrumental ».
- Article associé: "Behaviorisme: histoire, concepts et principaux auteurs”
Différence entre le conditionnement classique et opérant
La principale différence entre le conditionnement classique et opérant est que le premier fait référence à l'apprentissage d'informations sur un stimulus, tandis que le second implique l'apprentissage des conséquences de la réponse.
Skinner croyait que le comportement était beaucoup plus facile à modifier si ses conséquences étaient manipulées que si des stimuli y étaient simplement associés, comme c'est le cas dans le conditionnement classique. Le conditionnement classique est basé sur l'acquisition de réponses réflexes, ce qui explique une moindre quantité de l'apprentissage et ses usages sont plus limités que ceux de l'opérant, puisqu'il renvoie à des comportements que le sujet peut contrôler à volonté.
- Article associé: "Le conditionnement classique et ses expériences les plus importantes”
Concepts de conditionnement opérant
Ensuite, nous définirons les concepts de base du conditionnement opérant pour mieux comprendre cette procédure et ses applications.
Beaucoup de ces termes sont partagés par les orientations comportementales en général, bien qu'ils puissent avoir des connotations spécifiques au sein du paradigme opérant.
Réponse instrumentale ou opérante
Ce terme désigne tout comportement qui entraîne une certaine conséquence et est susceptible de changer en fonction de celui-ci. Son nom indique qu'il sert à obtenir quelque chose (instrumental) et qu'il agit sur le médium (opérant) plutôt que d'être déclenchée par elle, comme dans le cas du conditionnement classique ou intimé.
Dans la théorie comportementaliste, le mot « réponse » est fondamentalement équivalent à « comportement » et « action », bien que « réponse » semble se référer dans une plus grande mesure à la présence de stimuli antécédents.
Conséquence
En psychologie comportementale et cognitivo-comportementale, une conséquence est le résultat d'une réponse. La conséquence peut être positive (renforcement) ou négative (punition) pour le sujet qui exécute la conduite; dans le premier cas, la probabilité que la réponse soit donnée augmentera et dans le second, elle diminuera.
Il est important de garder à l'esprit que les conséquences affectent la réponse et, par conséquent, dans le conditionnement opérant ce qui est renforcé ou puni est ledit comportement, pas la personne ou l'animal qui il arrive au bout. À tout moment, vous travaillez avec l'intention de influencer la façon dont les stimuli et les réponses sont liés, puisque la philosophie behavioriste évite de partir d'une vision essentialiste des personnes, mettant davantage l'accent sur ce qui peut changer que sur ce qui semble toujours rester le même.
Renforcement
Ce terme désigne le conséquences des comportements lorsqu'ils le rendent plus probable qu'ils se reproduisent. Le renforcement peut être positif, auquel cas on parlera d'obtention d'une récompense ou récompense pour l'exécution d'une réponse, ou négative, qui comprend la disparition des stimuli aversifs.
Renforcement négatif à l'intérieur nous pouvons distinguer les réponses d'évitement et d'évasion. Les comportements d'évitement préviennent ou empêchent l'apparition d'un stimulus aversif; par exemple, une personne avec agoraphobie qu'il ne quitte pas la maison parce qu'il ne se sent pas comme ça anxiété vous évitez cette émotion. Au lieu de cela, les réponses d'échappement font disparaître le stimulus lorsqu'il est déjà présent.
La différence avec le mot « renforçant » est qu'il fait référence à l'événement qui se produit à la suite du comportement plutôt qu'à la procédure de récompense ou de punition. Par conséquent, « renforçant » est un terme plus proche de « récompense » et « récompense » que de « renforcement ».
Châtiment
Une punition est toute conséquence d'un comportement déterminé qui diminue la probabilité pour qu'il soit répété.
Comme le renforcement, la punition peut être positive ou négative. La punition positive correspond à la présentation d'un stimulus aversif après l'apparition de la réponse, tandis que la punition négative est le retrait d'un stimulus appétitif à la suite de la conduite.
La punition positive peut être liée à l'utilisation générale du mot « punition », tandis que la punition négative fait davantage référence à un certain type de sanction ou d'amende. Si un enfant n'arrête pas de crier et reçoit une gifle de sa mère pour se taire, il appliquera un punition positive, alors que si vous enlevez la console à laquelle vous jouez, vous recevrez une punition négatif.
- Article associé: "8 raisons de ne pas utiliser les châtiments corporels envers les enfants”
Stimulus discriminant et stimulus delta
En psychologie, le mot "stimulus" est utilisé pour désigner des événements qui provoquent une réponse d'une personne ou d'un animal. Dans le paradigme opérant, le stimulus discriminant est celui dont la présence indique au sujet apprenant que s'il adopte un certain comportement, il aura comme conséquence l'apparition d'un renforcement ou d'une punition.
En revanche, l'expression "stimulus delta" fait référence aux signaux qui, lorsqu'ils sont présents, informent que l'exécution de la réponse n'entraînera pas de conséquences.
Qu'est-ce que le conditionnement opérant ?
Le conditionnement instrumental ou opérant est une procédure d'apprentissage basée sur la probabilité qu'il se produise une réponse donnée dépend des conséquences attendu. Dans le conditionnement opérant, le comportement est contrôlé par des stimuli discriminants présents dans la situation d'apprentissage qui transmettent des informations sur les conséquences probables de la répondre.
Par exemple, un panneau « Open » sur une porte nous indique que si nous essayons de tourner le bouton, il s'ouvrira très probablement. Dans ce cas, le signe serait le stimulus discriminant et l'ouverture de la porte fonctionnerait comme un renforcement positif de la réponse instrumentale de la rotation du bouton.
L'analyse comportementale appliquée de B. F. Dépeceur
Skinner a développé des techniques de conditionnement opérant qui sont inclus dans ce que nous appelons "l'analyse comportementale appliquée". Cela a été particulièrement efficace dans l'éducation des enfants, avec un accent particulier sur les enfants avec difficultés de développement.
Le schéma de base de l'analyse comportementale appliquée est le suivant. Dans un premier temps, un objectif comportemental est fixé, qui consistera à augmenter ou à réduire certains comportements. Sur cette base, les comportements à développer seront renforcés et les incitations existantes à adopter les comportements à inhiber seront réduites.
En général le retrait des renforçateurs est plus souhaitable que la punition positif puisqu'il génère moins de rejet et d'hostilité de la part du sujet. Cependant, la punition peut être utile dans les cas où le comportement problématique est très perturbateur et nécessite une réduction rapide, par exemple en cas de violence.
Tout au long du processus, il est essentiel de suivre systématiquement les progrès afin de pouvoir vérifier objectivement si les objectifs souhaités sont atteints. Cela se fait principalement en enregistrant des données.
Techniques opératoires pour développer des comportements
Compte tenu de l'importance et de l'efficacité du renforcement positif, les techniques opérantes pour augmenter les comportements se sont avérées utiles. Ci-dessous, nous décrirons les plus pertinentes de ces procédures.
1. Techniques d'incitation
Les techniques d'incitation sont celles qui dépendent de la manipulation de stimuli discriminants augmenter la probabilité qu'un comportement se produise.
Ce terme comprend les consignes qui augmentent certains comportements, le guidage physique, qui consiste à déplacer ou placer des parties du corps de la personne entraînée, et la modélisation, dans laquelle un modèle est observé en train d'exécuter un comportement afin de pouvoir l'imiter et d'apprendre ce qu'il conséquences. Ces trois procédures ont en commun de se concentrer sur enseigner directement au sujet comment effectuer une action déterminé, verbalement ou physiquement.
2. Moulage
Elle consiste à rapprocher progressivement un certain comportement du comportement objectif, en partant d'une réponse relativement similaire que peut faire le sujet et en la modifiant petit à petit. Elle est réalisée par étapes (approximations successives) auxquelles l'armature est appliquée.
La mise en forme est considérée comme particulièrement utile pour établir des comportements chez des sujets qui ne peuvent pas communiquer verbalement, comme les personnes ayant une déficience intellectuelle profonde ou les animaux.
3. Décoloration
La décoloration fait référence à la retrait progressif des aides ou instigateurs qui avait été utilisé pour renforcer un comportement cible. Il est prévu que le sujet consolide une réponse et puisse la réaliser par la suite sans avoir besoin d'une aide extérieure.
C'est l'un des concepts clés du conditionnement opérantcar il permet de généraliser les progrès réalisés en thérapie ou en formation à de nombreux autres domaines de la vie.
Cette procédure consiste essentiellement à substituer un stimulus discriminant à un autre.
4. Chaînage
Une chaîne comportementale, c'est-à-dire un comportement composé de plusieurs comportements simples, est séparée en différentes étapes (liens). Ensuite, le sujet doit apprendre à exécuter les maillons un par un jusqu'à ce qu'il puisse réaliser la chaîne complète.
Le chaînage peut être effectué en avant ou en arrière et a la particularité que chaque lien renforce le précédent et fonctionne comme un stimulus discriminant les prochains.
Dans certains aspects, une bonne partie des compétences qui sont considérées comme des talents parce qu'elles montrent un degré élevé de compétence et de spécialisation (comme jouer très bien d'un instrument musical, danse très bien, etc.) peut être considéré comme le résultat d'une certaine forme de chaîne, car des compétences de base progressent jusqu'à atteindre les autres beaucoup plus travaillé.
5. Programmes de renforcement
Dans une procédure d'apprentissage opérant, les programmes de renforcement sont les des lignes directrices qui établissent quand le comportement sera récompensé et quand non.
Il existe deux types de base de programmes de renforcement: raison et intervalle. Dans les programmes de raison, le renforçateur est obtenu après qu'un nombre spécifié de réponses soient donnés, tandis que dans Cela se produit après qu'un certain temps s'est écoulé depuis le dernier comportement renforcé et cela recommence. Donnez-vous.
Les deux types de programmes peuvent être fixes ou variables, indiquant que le nombre de réponses ou l'intervalle le temps nécessaire pour obtenir le renfort peut être constant ou osciller autour d'une valeur moyenne. Ils peuvent également être continus ou intermittents; Cela signifie que la récompense peut être donnée à chaque fois que le sujet exécute le comportement cible ou de temps en temps (bien que toujours en conséquence d'une émission de la réponse souhaitée).
Le renforcement continu est plus utile pour établir des comportements et le clignotant pour les garder. Ainsi, théoriquement, un chien apprendra à taper plus vite si nous lui donnons une friandise à chaque fois qu'il tape, mais une fois le comportement appris, il lui sera plus difficile d'arrêter de le faire si on lui donne le renforçateur un sur trois ou cinq Tentatives.
Techniques opératoires pour réduire ou éliminer les comportements
Lors de l'application de techniques opérantes pour réduire les comportements, il convient de garder à l'esprit que, puisque ces procédures peut être désagréable pour les sujets, il est toujours préférable d'utiliser le moins aversif quand possible. en plus ces techniques sont préférables aux punitions positives.
Voici une liste de ces techniques classées du moins au plus grand potentiel de génération d'aversion.
1. Extinction
Un comportement renforcé n'est plus récompensé précédemment. Cela diminue la probabilité que la réponse se reproduise. Formellement, l'extinction est le contraire du renforcement positif.
Extinction à long terme est plus efficace pour éliminer les réponses que la punition et le reste des techniques opérantes pour réduire les comportements, même si cela peut être plus lent.
Un exemple de base d'extinction est d'amener un enfant à arrêter de donner des coups de pied en l'ignorant simplement jusqu'à ce qu'il se rende compte que son Le comportement n'a pas les conséquences souhaitées (par exemple, la colère parentale, qui fonctionnerait comme un renforçateur) et vous en avez marre.
2. Ignorer la formation
Dans cette procédure, le comportement du sujet est suivi de l'absence de récompense; c'est-à-dire, si la réponse est donnée, le renforçateur ne sera pas obtenu. Un exemple d'entraînement de saut pourrait être que des parents empêchent leur fille de regarder la télévision ce soir-là parce qu'elle leur a parlé de manière irrespectueuse. Un autre exemple serait le fait de ne pas aller acheter les jouets que les enfants demandent, s'ils se conduisent mal.
Dans les milieux éducatifs, il sert également à promouvoir que les efforts que font les autres sont plus valorisés pour faire plaisir aux plus petits et que ceux-ci, habitués à ces traitements, ne valorisent pas.
3. Programmes de renforcement différentiel
Il s'agit d'un sous-type spécial de programme de renforcement utilisé pour réduire (pas éliminer) les comportements cibles en augmentant les autres réponses alternatives. Par exemple, un enfant pourrait être récompensé pour avoir lu et fait de l'exercice et non pour jouer à la console si ce dernier comportement est destiné à perdre sa valeur renforçante.
Dans le renforcement différentiel à faible taux, la réponse est renforcée si une certaine période de temps se produit après la dernière fois qu'elle s'est produite. Dans le renforcement différentiel d'omission, le renforcement est obtenu si, après un certain temps, la réponse n'a pas eu lieu. Le renforcement différentiel des comportements incompatibles consiste à renforcer les réponses incompatibles avec le comportement problématique; Cette dernière procédure s'applique aux tics et onychophagie, entre autres troubles.
4. Coût de réponse
Variante de la peine négative dans laquelle l'exécution de la un comportement problématique entraîne la perte d'un renforçateur. La carte à points pour les conducteurs qui a été introduite en Espagne il y a quelques années est un bon exemple de programme de coût de réponse.
5. Temps dehors
Le temps mort consiste à isoler le sujet, généralement des enfants, dans un environnement non stimulant au cas où le comportement problématique surviendrait. Également une variante de la punition négative, elle diffère du coût de réponse en ce que ce qui est perdu c'est la possibilité d'accéder au renfort, pas l'amplificateur lui-même.
6. rassasiement
Le renfort obtenu pour réaliser le comportement est si intense ou grand qu'il perd de la valeur J'avais pour sujet. Cela peut se produire par satiété de réponse ou pratique de masse (répéter le comportement jusqu'à ce que cesser d'être appétit) ou par satiété de stimulus (le renforçateur perd son appétit en excès).
7. Surcorrection
La surcorrection consiste à appliquer une punition positive liée au comportement problématique. Par exemple, il est largement utilisé dans les cas d'énurésie, où l'on demande à l'enfant de laver les draps après avoir uriné sur lui-même pendant la nuit.
Techniques d'organisation de contingence
Les systèmes d'organisation d'urgence sont des procédures complexes grâce auxquelles vous pouvez renforcer certains comportements et en punir d'autres.
L'économie du token est un exemple bien connu de ce type de technique. Elle consiste à délivrer des tokens (ou autres renforçateurs génériques équivalents) en récompense de la performance des comportements cibles; Par la suite, les sujets peuvent échanger leurs jetons contre des prix de valeur variable. Il est utilisé dans les écoles, les prisons et les hôpitaux psychiatriques.
Les contrats de comportement ou de contingence sont des accords entre plusieurs personnes, généralement deux, par lesquels ils acceptent d'exercer (ou de ne pas effectuer) certains comportements. Les contrats détaillent les conséquences en cas de respect ou de non-respect des conditions convenues.