Le conditionnement : processus d’apprentissage fondé sur l’association d’un stimulus et d’un comportement qui apparait en réaction à celui-ci.
2 types de conditionnement :
- Le conditionnement répondant (classique ou pavlovien)
- Le conditionnement instrumental (opérant ou skinnerien)
Technique du conditionnement répondant
1) La réaction inconditionnelle (R.I)
C’est la réponse d’un organisme, suscitée de façon constante par un stimulus approprié provenant du milieu.
Ex : La salivation
2) Le stimulus inconditionnel (S.I)
C’est un évènement du milieu qui suscite de façon constante la R.I.
Ex : la viande pour la salivation
3) Le stimulus neutre (S.N)
C’est un autre événement du milieu qui ne suscite pas la R.I étudiée
Ex : Une sonnerie
Après un certain nombre de répétition de cette séquence S.I + S.N (renforcement), si l’on présente à nouveau S.N Sans le S.I on constate l’apparition d’une réaction : la salivation. Le S.N est devenu actif il est devenu :
4) Le stimulus conditionnel (S.C)
Même stimulus que le précédent (S.N) mais il est maintenant capable de suscité une réaction.
5) La réponse conditionnelle (R.C) sortie de la réponse inconditionnelle (R.I) par la même évolution qui a transformé le stimulus neutre (S.N) en stimulus conditionnel (S.C)
Le conditionnement classique consiste à apprendre à un être vivant à produire une réponse conditionnelle à chaque fois qu’on lui présente le stimulus conditionnel correspondant (ex : saliver lorsque l’on entend la sonnerie)
Schéma :
Avant : SI RI
S N Pas de réponse
SN + SI = RI
Après : SC RC
L’extinction
Une fois que la réponse conditionnelle est installée, si on présente un certain nombre de fois le stimulus conditionnel sans son renforcement (SI), on observe l’extinction (disparition) progressive de la RC. Par la suite, la réapparition du SI entrainera le recouvrement quasi immédiat et partiel ou total de la RC.
L’extinction sera plus lente si celle-ci aura été renforcée de nombreuse fois. On considère que la force de la liaison conditionnelle entre le SC et la RC est fonction du nombre de renforcement qui on eu lieu.
Si l’on procède a un renforcement intermittent le conditionnement est plus lent a se mettre ne place
La discrimination conditionnelle est un processus, lié à l’extinction, par lequel un organisme ne répond plus au stimulus conditionnel, non suivis du stimulus inconditionnel, pour ne plus fournir de réponse qu’au stimulus conditionnel suivi du stimulus inconditionnel.
Exemple : On met un vibreur à la place de la cloche, le chien salivera au vibreur et plus à la cloche.
La généralisation conditionnelle est un processus par lequel l’organisme émet une réponse conditionnelle pour tous les stimuli ou toutes les situations similaire au stimulus conditionnel.
Conditionnement opérant (Instrumental ou Skinnerien)
La loi de l’effet : le comportement est fonction de ses conséquences
Le conditionnement opérant dit positif ou appétitif : En gros c’est lorsque l’on place un rat affamé dans une boite de skinner et qu’il doit abaisser le levier pour avoir a mangé
Le conditionnement opérant dit négatif ou aversif : On met un rat dans une boite de skinner, seulement le plancher est électrifier, lorsque la lampe s’allume, quelques seconde âpres le plancher envoie une décharge, le rat doit apprendre à baisser le levier pour couper le courant.
Les lois liées à l’apprentissage par le conditionnement instrumental
Dans le conditionnement opérant, le comportement qu’on désire installer est déterminé par ses conséquences. Deux types de conséquence : Le renforcement et la punition.
Les renforcements positif et négatif
Un renforcement positif est un processus par lequel la présentation du stimulus rend le comportement que l’on désir installer plus probable de se produire.
Un renforçateur positif est un stimulus ou un événement qui utilisé dans une procédure de renforcement entraine une augmentation de la probabilité d’apparition du comportement souhait. Il doit être une sensation de plaisir, la satisfaction d’un besoin, une récompense, un compliment,…
Un renforcement négatif est la suppression d’un stimulus désagréable à la suite de l’exécution par le sujet du comportement qu’on désir installer chez lui. Le renforcement négatif récompense donc lui aussi le comportement attendu.
Les punitions positives et négatives
Dans le conditionnement la punition n’a aucune signification morale : c’est un simple moyen mis en œuvre dans le cadre d’un apprentissage. La punition diminue la probabilité de l’apparition d’un comportement indésirable.
Positive : Le sujet doit faire quelque chose qui est désagréable pour lui.
Négative : Le sujet est privé de quelque chose d’agréable pour lui.
Renforcement Punition
Positif Négatif Positif Négatif
Stimulus Présentation d’un stimulus désirable Suppression d’un stimulus indésirable Présentation d’un stimulus indésirable Présentation d’un stimulus désirable
Modification Augmentation de la probabilité du comportement désirable Augmentation de la probabilité du comportement désirable Diminution de la probabilité du comportement indésirable Diminution de la probabilité du comportement indésirable
Exemple Si tu rentres avec un beau bulletin vendredi soir, tu auras un nouveau jeu « Gameboy ». Si tu rentres avec un beau bulletin vendredi soir, tu ne devras pas faire la vaisselle. Luc rentre avec un mauvais bulletin, il devra faire la vaisselle pendant la semaine. Luc rentre avec un mauvais bulletin, plus de « Gameboy » pendant une semaine
L’apprentissage sélectif
Expérience de Hull
Dispositif
Boite à Skinner avec :
- Soit un levier vertical
- Soit un levier horizontal
- Soit les 2 à la fois
Premier préapprentissage : levier vertical renforcé 15 fois
Deuxième préapprentissage : levier horizontal renforcé 60 fois
Apprentissage proprement dit : Présentation simultanée des 2 leviers mais seul le vertical est récompensé.
Observation :
- 1ierement les animaux on tendance à actionner le levier horizontal, mais les réponses n’étant pas renforcées, elles deviennent de plus en plus distantes.
- Les animaux se mettent alors à appuyer sur le levier vertical et chacun de ces actions est récompensée
- Sous l’effet de la récompense les animaux se remettent à actionner le levier vertical et il s’instaure alors un cycle d’alternance entre l’appui sur le levier verticale et sur le levier horizontal.
- Seul l’appui sur le levier vertical étant récompensé, cette séquence apparait de plus en plus souvent et devient de plus en plus longue, celle-ci fini par s’imposer complètement. Inversement, le fait d’actionner le levier horizontal n’étant plus jamais récompensé cette action qui au départ était la plus forte, diminue progressivement jusqu'à disparition complète.
Conclusion : Il est donc possible, par apprentissage sélectif, de renforcer un comportement adapté en éliminant peu à peu un autre comportement qui lui est inadapté.
Voila ma synthèse en gros
pour ceux que sa interesse