1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

期待値を取るかリスクを取るか、選び方に国による差はある? - 早大の研究

マイナビニュース / 2024年7月1日 12時54分

画像提供:マイナビニュース

早稲田大学(早大)は6月28日、社会経済的・文化的背景が異なる11か国の人々の経済的判断の傾向を調査し、明示的な情報に基づいたリスク回避の傾向などは国によって違いがあっても、試行錯誤を通じた学習による行動のバイアス(偏り)にはほとんど違いが見られないことを明らかにしたと発表した。

同成果は、早大理工学術院の渡邊克巳教授、パリ高等師範学校のHernán Anlló博士、同・Stefano Palminteri教授らの国際共同研究チームによるもの。詳細は、「Nature Human Behaviour」に掲載された。

ヒトを含む動物は、自分(や家族・仲間)にとってのメリットを得られる可能性を高めたり、得られるメリットを増やしたりするなど、報酬に基づく試行錯誤によってさまざまなことを学習する性質を持ち、その仕組みを「強化学習」という。言い換えれば強化学習とは、獲得した経験に基づいて行動することを可能にするメカニズムや行動のことである。

強化学習は本来、報酬を多くし、罰や損などを少なくしていくという単純なルールの上に成り立っている。しかし、文脈によっては必ずしも最適でない判断につながることが知られていた。強化学習は、医療・教育・経済・経営・政策などさまざまな分野に広範な影響を及ぼすにも関わらず、異なる社会経済的・文化的背景などが、強化学習にどのように影響するかはわかっていなかったという。

その疑問を解決するために研究チームは今回、強化学習における文脈効果を確実に捉える実験的アプローチを用いて、社会経済的・文化的に異なる11か国の人々の経済的判断の傾向を調査したとする。

例えば、以下の4点の報酬をもらえる選択肢があったとする(実際に実験で用いられたものではない)。なおカッコ内にある「期待値」とは、1回の試行で確率的に得られる値の平均値のことを指し、この値がより高くなる選択をすることが、確率的に“良い”選択である。

(A) 75%で1万円(期待値=7500円)
(B) 25%で1万円(期待値=2500円)
(C) 75%で1000円(期待値=750円)
(D) 25%で1000円(期待値=250円)

このような選択肢の「~%で~円」の部分を明示的に示して判断させる「宝くじ課題」では、「AとB」のどちらか、「CとD」のどちらかを選ばせると、当然期待値の高いAとCが選ばれる。これを何度も繰り返した後に、今度は「AとD」「BとC」をペアにして選ばせたとしても、AとCが選ばれる。ただし、このような意識的な判断の時に、報酬を得られないというリスクを回避する傾向(たとえば「BとC」をペアとした時に、期待値は低いが報酬を得られる確率は高いCを選択する傾向)は国によってかなり違っていたという。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください