「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表
ITmedia NEWS / 2024年10月13日 8時5分
・電話ボックスから電話をかける場合、1分あたり0.6ドル掛かります。10分を超えると、料金は1分あたり0.5ドルに下がります。60分間の通話はいくらですか?
・ホテルの部屋の電話から電話をかける場合、1分あたり0.6ドル掛かります。10分経過すると、料金は1分あたり0.5ドルに下がります。通話開始から25 分経過すると、料金はさらに下がり、1分あたり0.3ドルになります。60分間の通話はいくらですか?
・ホテルの電話から電話をかける場合、1分あたり0.6ドル掛かります。10分経過すると、料金は1分あたり0.5ドルに下がります。通話開始から25分経過すると、料金はさらに下がり、1分あたり0.3ドルになります。合計請求額が10ドルを超える場合は、25%割引になります。60分間の通話料金はいくらですか?
●無関係な情報に惑わされる
問題文に、一見関係がありそうだが、実際には回答に全く影響しない情報を追加すると、間違えやすくなる。
例えば、「キウイを〇個収穫した。ただし、そのうち△個は小さかった」という問題で、LLMは関係のない「小さいキウイの数」を全体のキウイの数から引いてしまうという間違いをした。
これは、LLMがトレーニングデータで「割引」という言葉が出てきたら「掛け算」をする、といったパターンを機械的に学習しているために起こると考えられる。
研究者らは、LLMの限界を克服できるかどうかについては明言していない。現在のLLMが真の数学的推論能力を獲得するには、パターン認識を超えた、より高度な推論能力の開発が必要であると結論付けている。特に、問題の本質を理解し、無関係な情報を適切に処理できる能力の向上が不可欠であると指摘する。
-
- 1
- 2
外部リンク
この記事に関連するニュース
-
Appier (エイピア)、人工知能に関する研究論文3本が、世界最高峰の学会「NeurIPS (人工知能、機械学習)」と「EMNLP (自然言語処理)」で採択
PR TIMES / 2024年10月17日 15時10分
-
【教員採用試験】「大阪エリア 数的処理 集中ゼミ」開講!
PR TIMES / 2024年10月11日 17時15分
-
「生成型AIによる医療革命」患者診断から治療まで支援…韓国IT企業も参戦
KOREA WAVE / 2024年10月4日 9時0分
-
世界一の日本語性能を持つ企業向け大規模言語モデル「Takane」を提供開始
PR TIMES / 2024年9月30日 16時15分
-
「BizTAP AI」ChatGPT OpenAI o1シリーズおよびDeepL翻訳機能実装のお知らせ
PR TIMES / 2024年9月25日 18時40分
ランキング
-
1Xのブロック機能や規約の変更後、Blueskyに50万人の新規ユーザー
ITmedia NEWS / 2024年10月19日 10時31分
-
2めざましテレビが「まいたけダンス」紹介→元ネタのVTuberに触れずさまざまな意見 「何も紹介が無いのは違う」「フリー素材扱いしたかったのかな?」
ねとらぼ / 2024年10月16日 17時34分
-
3「タップで早送り」「簡単操作で2倍速」YouTubeアプリを使いこなす!知って得する5つの裏技
よろず~ニュース / 2024年10月19日 11時0分
-
4【無料ゲーム】アマゾン「Prime Gaming」2024年10月の特典はこれだ
ASCII.jp / 2024年10月15日 17時0分
-
5リアム・ペインの急死巡り、“生みの親”と恋人へ批判が集中 「あなたのせい」「真実を話せ」と炎上状態に
ねとらぼ / 2024年10月18日 14時35分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください