RAG実用化サービス「SAT」で自動QA評価をリリース RAGの回答精度検証を大幅に効率化
PR TIMES / 2025年1月17日 13時40分
ストックマーク株式会社(本社:東京都港区、社長:林 達、以下:当社)は、当社が提供するRAG実用化サービス「Stockmark A Technology、以下:SAT」にて「自動QA評価」をリリースしました。
「SAT」は、膨大な企業データをRAGシステムで活用できる形式へ構造化するRAG実用化サービスです。多機能AI(マルチモーダルLLM)を活用して、膨大な量かつ複雑なビジネスドキュメントのテキスト・図・表から情報を抽出。構造化データとナレッジグラフを自動生成し、RAGシステム検証を簡単に実行することができます。当機能の追加により、RAGシステム検証において、莫大な工数を必要とするQA評価の大幅な効率化と精度向上が可能になります。
「自動QA評価」機能の詳細
RAGシステムを構築し、現場ユーザーの活用につなげる実用化において、ユーザーからの質問に対して正しい回答を検索・生成出来ているか否かを検証するQA評価は避けて通ることのできない重要な工程ですが、実際には、このQA評価を多様なユースケースに対応させるために莫大な工数がかかるのが現状です。
本機能のリリースにより、下記のような課題解決を支援することが可能です。
・RAGの精度評価の手法が分からない(何を持って正しいといえるのか?)
・精度評価に関するQA自体を作成することが難しい
・QAは作成したが、評価に膨大な時間がかかる
・評価を人力で行うと、評価者によって、ブレが出てしまう
・なんとなく回答精度が低いが、どう各パラメータをチューニングして良いのか分からない
・1つのパラメータをチューニングすると、改めて評価がやり直しとなり、また膨大な時間がかかる
・上記の繰り返し・・・
今回、新たにリリースした「自動QA評価」機能により、RAGシステムの検証にかかる工数の大幅削減と、精度向上をより強力に支援できるようになりました。
[画像1: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-8dbde01aacb431d35ed7f371868fee84-3900x2311.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
1. 数十パターンのパラメータに対して、一括で回答を生成
SATでは、1つのデータセットに対して、構造化 / LLM / システムプロンプト等、精度改善のポイントとなるパラメータを複数調整することができ、事前に用意された質問群に対して、この数十と存在するパターンを一括で自動評価することができます。これにより、データに適したパラメータの早期発見を実現します。
2. QAの自動評価に加え、評価根拠の明示で最終評価を支援
生成された回答が妥当か否かを想定回答に基づいて生成AIで自動評価します。評価を「良し、評価不能、悪し」の3つの区分で行うことで、人が注力して評価する対象の優先度をつけられるようにし、評価時間の大幅短縮に貢献します。
一方で、現状の生成AIが生成する回答結果は、誤りが含まれる可能性や、データソースや想定回答自体が妥当でない可能性もあり、生成された回答をそのまま最終的な評価結果として用いるには問題が生じる場合があります。そのため、本機能では「結果を受け入れるか否かの判断」「評価結果の理由」を提示することで、QAの最終評価プロセスまで支援することが可能です。
[画像2: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-572639f2b1c9157378403a77bccc5a01-3900x2296.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
自動評価した状態
[画像3: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-d3e9a918774955ac3c3f1df1da5ec94b-3900x2298.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
評価理由の提示
「SAT」について
[画像4: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-d2d2568e25f2d909f09c40b75a283d3b-400x210.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「SAT」は、膨大な企業データをRAGシステムで活用できる形式へ構造化するRAG実用化サービスです。
多機能AI(マルチモーダルLLM)を活用して、膨大な量かつ複雑なビジネスドキュメントのテキスト・図・表から情報を抽出。構造化データとナレッジグラフを自動生成し、RAGシステム検証を簡単に実行することができます。
・「SAT」公式サイト:https://sat.stockmark.co.jp/
「SAT」の特徴
[画像5: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-e5063237e456f86995e920b2eb1c62a7-2500x1318.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像6: https://prcdn.freetls.fastly.net/release_image/24407/221/24407-221-1646b3ded0ebfca261791a06542b5bcf-2433x1387.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
特徴1.:複雑な構成のデータを簡単かつ高精度に構造化
ビジネスシーンで頻繁に用いられている、図や表を含むあらゆる形式で構成された、複雑かつ膨大な量のドキュメントを、簡単にテキスト抽出し、検索可能なデータ形式に変換することができます。
特徴2.:ナレッジグラフの自動生成
構造化されたデータベースから概念同士の関係性を理解したナレッジグラフを自動生成します。これにより組織固有の専門性が高い知識でも正しく検索・回答生成が可能になります。
特徴3.:RAGシステムの検証や、継続的な改善が実現可能
構造化されたデータベース、自動生成されたナレッジグラフに対して、質問・回答の検証を実施できます。これにより組織のRAGシステム構築を加速し、対象のドキュメントが増加しても、簡単に構造化や検証が可能となり、RAGシステムの検証・改善継続的に実現します。
今後の開発ロードマップ
今後「SAT」では、組織の生成AI活用をより強固に支援するプラットフォームとして、データ構造化からRAGシステムの構築/検証/改善までを、ワンストップで実現可能なサービスを目指しています。
更に「SAT」を活用したデータベースをAPI経由で接続可能にすることで、組織内のRAGシステムへ簡単に接続、継続的な改善サイクルの実現を目指します。
データ構造化の重要性
2022年以降、急速に注目された生成AIは、ビジネスシーンでも約7割の企業が何かしらの形で生成AIを導入している一方で、実際の利用頻度は、数日に1回程度が約35%と主流となり、各社で生成AIツールの導入が進んでいる割には、高頻度に利用できているユーザーが少ない状況にあります※1。
その理由として、生成AIが事実と異なる生成をしてしまう「ハルシネーション(もっともらしい嘘)」が主な理由と言えます。ハルシネーションの抑止策として、既存のデータベースから検索・回答生成を行う「RAGシステム」の利用が一般的です。しかし、業務データを用いたRAGシステムを構築するためには、組織内データの大半を占める、図表を含む複雑な形式の非定型ドキュメントを、検索可能なデータ形式に変換する「データ構造化」が必要です。正しく構造化されたデータでRAGシステムを構築することで、組織内の専門的な知識や情報を検索し、生成AIによる正確な回答生成が可能になります。
※1:製造業における生成AIの活用とセキュリティ状況 https://stockmark.co.jp/news/20240418
ストックマーク株式会社について
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用し、多くの企業の企業変革を支援しています。
社内外の情報をワンストップで検索できる「Anews」及び、あらゆるデータを構造化し企業の資産に変える「SAT(Stockmark A Technology)」を運営しています。さらに、企業特化生成AIの開発や、独自システムの構築も支援しています。
会社名 :ストックマーク株式会社
所在地 :東京都港区南青山一丁目12番3号 LIFORK MINAMI AOYAMA S209
設立 :2016年11月15日
代表者 :代表取締役CEO 林 達
事業内容:自然言語処理を活用した、
事業機会の探索と意思決定の支援を行うサービスの開発・運営
URL :https://stockmark.co.jp/
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
日本マイクロソフト社が推進する生成AIの利用拡大・活性化プログラム 「生成AI事業化支援プログラム」にストックマークが参加
PR TIMES / 2025年1月22日 11時0分
-
生成AIと文書管理システムが連携!社内情報をもとに高精度な対話を実現 ~楽々Document Plusが新機能を25年2月にリリース予定~
Digital PR Platform / 2025年1月15日 13時31分
-
生成AIと文書管理システムが連携!社内情報をもとに高精度な対話を実現
PR TIMES / 2025年1月15日 13時30分
-
生成AIの業務活用基盤をつくり、RAGの精度を向上する「生成AIオペレーション品質向上サービス」の提供を開始
PR TIMES / 2025年1月14日 17時15分
-
ジェイズ、生成AIとRAGによるサポートサービス業務の実証検証を実施
週刊BCN+ / 2024年12月25日 16時24分
ランキング
-
1インスタ 17歳以下に一部利用制限
日テレNEWS NNN / 2025年1月22日 19時47分
-
2羽田空港、国内線の施設利用料を4月から値上げ…大人370円を450円に
読売新聞 / 2025年1月22日 22時13分
-
3給料を上げて大丈夫? 若手社員を中心に“賃上げの波”、一方で世代間に“格差”も…不遇すぎる“氷河期世代”【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2025年1月22日 21時15分
-
4ニデックにTOB延期を再要望=牧野フライス
時事通信 / 2025年1月22日 19時50分
-
5主幹事の大和証券もCM見送り=「フジテレビ離れ」止まらず
時事通信 / 2025年1月22日 19時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください