読者です 読者をやめる 読者になる 読者になる

人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習・Deep Learningに関する記事が多いです。



Reward Punish

強化学習

働くみんなのモティベーション論 (NTT出版ライブラリーレゾナント)

働くみんなのモティベーション論 (NTT出版ライブラリーレゾナント)

モティベーション(動機づけ)を扱った心理学本を読んでたところReward Punishという面白い概念を知った。Reward Punishとは、外発的動機づけ*1に過度に依存することの弊害を指す。

  1. 報酬は罰になる
  2. 報酬は人間関係を破壊する
  3. 報酬は理由を無視する
  4. 報酬は冒険に水をさす
  5. 報酬は興味を損なう
  6. 報酬は使い出したら簡単には引けない
  7. 報酬はそれを得るための手抜き(最短ルート)を選ばせる

pp.147-148

罰はあんまりよくないイメージがあるけど、報酬も使い方を間違えると毒になるってことですね。家で犬を飼ってるんだけれど、ジャーキーがないとお座りしなくなった感じがするのはこのせいか(笑)

関連リンク

*1:自分から行動しようと思うのではなく、誰かのご褒美によって行動すること