オルツ、ハルシネーションを自動スコアリングし発見可能とする技術を開発

マイナビニュース / 2024年5月9日 15時10分

画像提供：マイナビニュース

パーソナルAIの開発および実用化を進めるオルツは5月9日、LLM（Large Language Models：大規模言語モデル）におけるハルシネーションをスコアリングする手法の開発に成功したことを発表した。同社の「alt developer」のAPIサービスを通じて提供を開始している。

○開発技術の概要

生成AIのハルシネーションとは、AIがまるで幻覚を見ているかのように、正当性がなく、事実に基づかない虚偽の回答をする現象。LLM（Large Language Models：大規模言語モデル）やAIによる誤った情報出力は企業や個人に深刻な信頼問題を引き起こす可能性があるだけでなく、生成AIの今後の応用にも大きな障壁となる。

これに対しオルツは独自のLLM開発の経験を生かして、ハルシネーション問題を解決する研究開発を続けてきたという。今回、ハルシネーションを解決する方法の一つとして、ハルシネーションが発生するか否かを判定してその発生確率（ハルシネーション・スコア）を自動的に評価できる手法「ハルシネーション自動評価エンジン」を開発したとのことだ。

○ハルシネーション自動評価エンジン

今回同社が開発したエンジンは一貫性を重視してハルシネーションの評価を行う。具体的には、同じ入力データに基づいて複数の生成プロセスを行い結果を比較するアプローチにより、生成された内容における不一致や矛盾を特定し、これに基づいて学習データや事実に基づかない不正確な生成物が生じているかどうかを確率的に評価する手法だ。

開発段階における実験においては、ハルシネーション自動評価エンジンはJcommonsenseQAデータセットから作成した擬似評価セットに対し、72%の正解率でハルシネーションの判定を実現。同社が開発したLLMのLHTM-OPTだけではなく、GPT-3.5、Llama2などのハルシネーションもスコアリング可能だという。
（熊谷知泰）

外部リンク

この記事に関連するニュース

富士通、ナレッジグラフとLLMを融合する研究開発を強化し生成AI活用を加速
マイナビニュース / 2024年5月17日 17時3分
オルツ、LLMハルシネーションの自動評価エンジンを開発
PR TIMES / 2024年5月9日 13時45分
オルツ、LLMハルシネーションの自動評価エンジンを開発
共同通信PRワイヤー / 2024年5月9日 11時0分
オルツとStability AI、画像生成AIの新たなユースケースの検討を開始
マイナビニュース / 2024年5月8日 17時36分
オルツが数兆パラメータ規模のLLM構築に着手、実運用に適した性能を追求
マイナビニュース / 2024年4月26日 16時18分

ランキング

総合
芸能
社会
スポーツ
経済
国際
IT
ライフ

1

有吉弘行　THE SECOND惨敗の後輩を罵倒「この恥さらしが」「ヘボクソ漫才師がよ」
東スポWEB / 2024年5月19日 21時38分
2

ドライバー不足で修学旅行の貸切バス手配が突然キャンセルに　近畿日本ツーリストは謝罪「総動員して修学旅行の実施に努める」
ねとらぼ / 2024年5月17日 16時5分
3

イラン大統領ら乗ったヘリが山中に不時着、安否不明…悪天候と濃霧で救助隊が現場到着できず
読売新聞 / 2024年5月20日 0時5分
4

イオンの「幸せの黄色いレシート」キャンペーン。レシートを使って寄付したいけど、不良品を「返品」できなくなるの？「寄附」と「レシート保管」を両立させる方法を解説
ファイナンシャルフィールド / 2024年5月19日 5時10分
5

内閣支持率低迷２６％、自民党の規正法改正対応「評価せず」７９％…読売世論調査
読売新聞 / 2024年5月19日 22時0分

もっと見る

1

有吉弘行　THE SECOND惨敗の後輩を罵倒「この恥さらしが」「ヘボクソ漫才師がよ」
東スポWEB / 2024年5月19日 21時38分
2

「光る君へ」ききょう呆然　変装コント急転…定子落飾　ネット悲痛「あまりにも可哀想」「兄弟の尻拭い」
スポニチアネックス / 2024年5月19日 20時47分
3

オズワルド畠中、井上咲楽との破局に初言及「結婚したい気持ちはあった」何が一番ダメだった？には…
スポニチアネックス / 2024年5月19日 20時12分
4

高橋一生＆飯豊まりえは2位“共演結婚”びっくりランキング！最初は「嫌いでした」からのカップルも
女子SPA！ / 2024年5月18日 8時46分
5

「写ってはいけないものが……」ゆうちゃみの自撮り写真に見えた“あるモノ”にネット衝撃
週刊女性PRIME / 2024年5月18日 18時0分

もっと見る

1

内閣支持率低迷２６％、自民党の規正法改正対応「評価せず」７９％…読売世論調査
読売新聞 / 2024年5月19日 22時0分
2

「顔も腫れあがり、髪の毛もむしり取られていた」妹が殺され償いを求めた遺族　加害者へ賠償求めても全額払われず　相手の口座に残っていたのはたった"９３１円"「憎みたくなくても憎んでしまう...今の制度では」
MBSニュース / 2024年5月19日 19時40分
3

上野飲食店経営者夫婦殺害、背景に首謀者への畏怖か　遺体処理から殺人も「断り切れない」
産経ニュース / 2024年5月19日 19時20分
4

IBXエアラインズが福岡空港着陸前に機材トラブル　滑走路一時閉鎖の影響でセブパシフィック航空が北九州空港にダイバート
RKB毎日放送 / 2024年5月19日 20時25分
5

Amazonレビューは大荒れ、SNSでは卑怯者扱い…“アニメの感想ツイート”が炎上した「大学教授のその後」
文春オンライン / 2024年5月19日 17時0分

もっと見る

1

「本当に悲しいアクシデント」　J1で味方同士衝突→プレー続行不能…同僚沈痛「かなり酷かった」
FOOTBALL ZONE / 2024年5月19日 19時50分
2

大谷翔平が放った移籍初サヨナラ打をド軍番記者陣も絶賛「最高の瞬間だ」「こんな選手見たことない」
THE ANSWER / 2024年5月20日 8時40分
3

偉業達成！ダルビッシュが史上3人目の日米通算200勝「これでほっとできる」野茂、黒田に次ぐ快挙
スポニチアネックス / 2024年5月20日 11時6分
4

パ・リーグで珍事！　3試合全てサヨナラ決着は10年ぶり3度目　
スポニチアネックス / 2024年5月19日 17時37分
5

大谷翔平、DH専念で実は“二刀流時代”を超越の「3.1」　異次元の数値でDH過去最高を更新ペース
THE ANSWER / 2024年5月19日 21時3分

もっと見る

1

イオンの「幸せの黄色いレシート」キャンペーン。レシートを使って寄付したいけど、不良品を「返品」できなくなるの？「寄附」と「レシート保管」を両立させる方法を解説
ファイナンシャルフィールド / 2024年5月19日 5時10分
2

健康サプリを「毎月3万円」購入する80代の母。本人は「健康のため」と言いますが、解約させるべき？
ファイナンシャルフィールド / 2024年5月19日 3時0分
3

コロナ禍で売上げ95%減となった「地球の歩き方」 Ⅴ字回復遂げ新分野に挑戦　岩塚製菓のおつまみスティックとコラボ
食品新聞 / 2024年5月19日 20時14分
4

やがて太陽光パネル"大量廃棄の波"が押し寄せる…地銀の｢電力子会社設立ブーム｣に潜むリスク
プレジデントオンライン / 2024年5月20日 10時15分
5

３０年以上塩漬け「阿蘇ソフトの村」用地、投資額の３８分の１で県売却へ…ＴＳＭＣ進出に伴う需要期待
読売新聞 / 2024年5月20日 6時51分

もっと見る

1

イラン大統領ら乗ったヘリが山中に不時着、安否不明…悪天候と濃霧で救助隊が現場到着できず
読売新聞 / 2024年5月20日 0時5分
2

インドネシア小型機が市街地に墜落　搭乗の3人死亡
TBS NEWS DIG Powered by JNN / 2024年5月20日 1時13分
3

日本政府の態度「反文明的」　徴用工巡り、韓国前大統領
共同通信 / 2024年5月19日 18時56分
4

アングル：「働いた証ない」、労働者の権利求めるメキシコのセックスワーカー
ロイター / 2024年5月20日 8時52分
5

敵前上陸「地上の地獄だった」　対ロシア渡河作戦、兵士ら証言
共同通信 / 2024年5月19日 20時8分

もっと見る

1

富士フイルム新機種に重くのしかかる為替レート　「X-T50」の値段は「X-T30 II」の倍以上に
ITmedia NEWS / 2024年5月18日 7時20分
2

モトローラの新ミドル機は控えめ価格なのに、FeliCa＆防水＆薄型軽量に美しいデザインと贅沢な1台
ASCII.jp / 2024年5月19日 12時0分
3

「思わず笑った」　ハードオフに4万4000円で売られていた“まさかのフィギュア”に仰天　「玄関に置いときたい」
ねとらぼ / 2024年5月19日 12時0分
4

「現場を知らなすぎ」　政府広報が投稿「令和の給食」写真に批判続出……　識者が指摘した“学校給食の問題点”
ねとらぼ / 2024年5月18日 7時30分
5

新鮮なバナナを60日放置→やせたかなしい姿に……　タイムラプスで見る驚きの変化に「私のバナナはいつもこうなる」などの声【海外】
ねとらぼ / 2024年5月19日 21時0分

もっと見る

1

ドライバー不足で修学旅行の貸切バス手配が突然キャンセルに　近畿日本ツーリストは謝罪「総動員して修学旅行の実施に努める」
ねとらぼ / 2024年5月17日 16時5分
2

上川外相「うまずして」発言　ＳＮＳで「曲解」批判相次ぐ　専門家「状況を考慮する必要」
産経ニュース / 2024年5月19日 18時31分
3

「ガラケーの使い方が分からない…」スマホ世代の新入社員が訪問先で“やらかした”大騒動
日刊SPA！ / 2024年5月19日 15時54分
4

白髪は禿げないのは本当？目立たせないドライヤー活用法はあるのか？【プロに学ぶ「白髪染め」「白髪のぼかし」】
日刊ゲンダイヘルスケア / 2024年5月20日 9時26分
5

「家を借りられない」「老人ホームにも入れない」身寄りのない“孤独な高齢者”が増加する日本を待ち受ける残酷な未来とは
日刊SPA！ / 2024年5月20日 8時52分

もっと見る

記事ミッション中･･･

10秒滞在

記事にリアクションする

記事ミッション中･･･

10秒滞在

記事にリアクションする

デイリー：参加する

ウィークリー：参加する

マンスリー：参加する

ポイント獲得ページへ

10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください