Reinforcement learning, Part II: punishment
We have already seen some aspect of reward, and how you can change the behaviors learned, and talk of habits in particular, changing reward. This is a very powerful mechanism, even if unconscious. And it is a basic mechanism for education. The question often in this context, what is the valore della punizione. Se, infatti, la ricompensa è il feedback positivo che ci insegna a ripetere comportamenti che ci procurano soddisfazione, la punizione certifica, per il cervello, che è sconveniente ripetere l'azione.
Faccio subito una precisazione: bisogna distinguere, sebbene in natura siano mescolati, l'apprendimento per feedback negativo da quello di natura emotiva. L'apprendimento per feedback negativo non è che l'altra faccia del rinforzo positivo: facendo numerosi errori pian piano impariamo ad aggiustare il tiro. Abbiamo bisogno, per questo, di diverse occasioni di errore. L'apprendimento emotivo, invece, necessita di una singola occasione: mangio cibo avariato, sto male, eviterò in futuro di mangiarne yet. Transferred to the education plan, this mechanism can regulate behavior through fear. A father delivers a slap to a child: this is at first surprised and scared. The mechanism of fear is linked to the concept of deterrence, that is not a crime to avoid an unpleasant future. Learning through punishment, however, the episode is repeated and you experience negative consequences.
This distinction is important, because you do not misunderstand what follows.
Allan Collins in his lecture he spoke of an experiment in niconitici act on the receptors, which in itself has great promise to facilitate smoking cessation. We said that there are receptors responsabili del piacere conseguente al fumo, e ce ne sono altri responsabili di conseguenze negative sull'apparato digerente. Ebbene, pare siano allo studio farmaci specifici per bloccare i recettori positivi , così da renderli insensibili alla nicotina, intaccando poco o nulla quelli negativi! Dopo la somministrazione del farmaco il soggetto è invitato a... fumare! Non traendo più rinforzo positivo dal fumo, ma sperimentandone solo gli inconvenienti, il soggetto pian piano perde il vizio.
Benchè i risultati siano migliori di quelli ottenuti tramite applicazioni cutanee di nicotina (cerotti), lo zoccolo duro dei fumatori non smette, probabilmente perchè resta un'associazione psicologica molto forte tra i gestures made in the act of smoking and the reward, or other individual characteristics. Luckily it this way: human complexity can not be reduced to a handful of molecules!
The mechanism for the punishment can also be used for learning, as when one plays darts and missing repeatedly refines the intended target. But that for which it is probably insostibuile unlearn.
who wishes to deepen the topic can be found, among other items Michael J. Frank .
0 comments:
Post a Comment