オルツ、LLMハルシネーションの自動評価エンジンを開発
PR TIMES / 2024年5月9日 13時45分
~ハルシネーション自動スコアリングで、生成AIの誤出力の発生を発見可能に~
P.A.I.(R)️(パーソナル人工知能)をはじめ、AIクローン技術でつくり出すパーソナルAIの開発および実用化を行う株式会社オルツ(本社:東京都港区、代表取締役:米倉 千貴、以下、オルツ)は、2024年5月9日に、大規模言語モデル(LLM)におけるハルシネーションをスコアリングする手法の開発に成功したことを発表いたします。
[画像: https://prtimes.jp/i/111359/83/resize/d111359-83-6de9ab00471ac23666bc-0.jpg ]
「ハルシネーション」とは、LLMがまるで幻覚を見ているかのように、正当性がなく、事実に基づかない虚偽の回答をしてしまう現象です。このようにLLMが誤った情報を出力することは、企業や個人にとって深刻な信頼問題を引き起こす可能性があるだけでなく、LLMの今後の応用にも大きな障壁となっています。
オルツでは、以前から独自の大規模言語モデルを開発・提供しており、この開発の経験を活かし、ハルシネーション問題を解決する研究開発を続けてまいりました。この度、ハルシネーションを解決する方法の一つとして、ハルシネーションが発生するか否かを判定し、その発生確率(ハルシネーション・スコア)を自動的に評価できる手法を独自に発明し、「ハルシネーション自動評価エンジン」を開発いたしました。
本開発における実験では、本「ハルシネーション自動評価エンジン」は、JcommonsenseQAデータセットから作成した擬似評価セットにおいて72%の正解率でハルシネーションの判定を実現しました。本エンジンは、オルツが独自に開発してきた軽量型大規模言語モデル「LHTM-OPT(https://alt.ai/news/news-2300/)」だけではなく、GPT-3.5、Llama2など、様々なLLMのハルシネーションのスコアリングが可能になります。
また、本エンジンは、一貫性を重視してハルシネーションの評価を行います。具体的には、同じ入力データに基づいて複数の生成プロセスを行い、これらの結果を比較します。このアプローチにより、生成された内容における不一致や矛盾を特定し、それに基づいて「ハルシネーション」、すなわち、学習データや事実に基づかない不正確な生成物が生じているかどうかを確率的に評価します。
「ハルシネーション自動評価エンジン」は、当社の「alt developer(https://developer.alt.ai/)」のAPIサービスを通じて提供を開始いたしました。(alt Developer:https://developer.alt.ai/api-doc.html#tag/LHTM-OPT/operation/lhtm-opt-completion)
本件ならびにLLMを活用したプロジェクトについては、以下のアライアンス窓口にお問い合わせください。
>ハルシネーションスコア計測アプリケーション デモ動画<
[動画: https://www.youtube.com/watch?v=-_k-SDIPje4 ]
(https://youtu.be/-_k-SDIPje4)
▶LHTM-2/LHTM-OPT/GPT など大規模言語処理ソリューションに関するお問い合わせ先
https://alt.ai/aiprojects/gpt/
株式会社オルツについて
2014年11月に設立されたオルツは、P.A.I.(R)️(パーソナル人工知能)、AIクローンをつくり出すことによって「人の非生産的労働からの解放を目指す」ベンチャー企業です。生成AI、独自開発LLM及び音声認識技術をはじめとするAI要素技術を豊富に保有し、それらを活用した多くのAI Productsを開発・提供しています。2024年4月までの累計調達額は約100億円超に達しています。
https://alt.ai/
<報道関係者からのお問い合わせ先>
株式会社オルツ 広報 西澤
e-mail:press@alt.ai
<アライアンスに関するお問い合わせ先>
株式会社オルツでは、IT・金融・建設・物流・メディア・製造・小売・サービス業など、
ジャンルを問わずAIソリューションの提供および支援を行っております。
お気軽にお問い合わせください。
株式会社オルツ AI Solutions事業部 浅井
e-mail:gptsolutions@alt.ai
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
オルツ、GNIおよびガバナンス・パートナーズと連携しJV組成へ
PR TIMES / 2024年5月15日 19時45分
-
オルツ、ハルシネーションを自動スコアリングし発見可能とする技術を開発
マイナビニュース / 2024年5月9日 15時10分
-
オルツ、LLMハルシネーションの自動評価エンジンを開発
共同通信PRワイヤー / 2024年5月9日 11時0分
-
オルツ、Stability AIと共同で画像生成AIの新たなユースケースの検討を開始
PR TIMES / 2024年5月8日 14時15分
-
オルツ、GNIグループと創薬および投資分野におけるAI活用に関する協業を発表
PR TIMES / 2024年4月25日 16時45分
ランキング
-
1だからトヨタは「全方位戦略」を貫いた…「富裕層のシンボル」テスラがここにきて大失速しているワケ
プレジデントオンライン / 2024年5月20日 9時15分
-
2やがて太陽光パネル"大量廃棄の波"が押し寄せる…地銀の「電力子会社設立ブーム」に潜むリスク
プレジデントオンライン / 2024年5月20日 10時15分
-
3再送-米アップル、薄型iPhoneを開発 25年に発売か=報道
ロイター / 2024年5月20日 8時30分
-
430年以上塩漬け「阿蘇ソフトの村」用地、投資額の38分の1で県売却へ…TSMC進出に伴う需要期待
読売新聞 / 2024年5月20日 6時51分
-
5健康サプリを「毎月3万円」購入する80代の母。本人は「健康のため」と言いますが、解約させるべき?
ファイナンシャルフィールド / 2024年5月19日 3時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください