1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

名大など、生成AIを用いて西洋古典学に特化した対話システムを開発

マイナビニュース / 2024年5月31日 18時21分

画像提供:マイナビニュース

名古屋大学(名大)、桜美林大学、国立情報学研究所(情報研)の3者は5月30日、生成AI技術を用いて西洋古典学の研究と教育に新たなアプローチを提供するAI対話システム「Humanitext Antiqua」(以下「ヒューマニテクスト」)を開発したことを発表した。

同成果は、名大 デジタル人文社会科学研究推進センターの岩田直也准教授、桜美林大の田中一孝准教授、情報研/ROIS-DS 人文学オープンデータ共同利用センターの小川潤特任研究員らの共同研究チームによるもの。詳細は、一般社団法人人工知能学会が刊行する人工知能に関する学術誌「人工知能学会全国大会論文集」に掲載された。

Open AI社が2023年3月に公開した大規模言語モデル(LLM)「GPT-4」は、古代ギリシア語やラテン語を含む多言語での文脈処理と文章生成において非常に高い精度が実現されており、人文学分野での活用可能性を急速に高めた。しかしながら現状では、人文学分野へのLLMや生成AIの導入は、他の学術分野に比べて著しく遅れているとする。その背景には、LLMが使用する学習データの信頼性への懸念や、誤った情報を生成するリスク、対話型AIに適切な指示を与えるスキルの必要性といった課題があるからだ。

ただし、信頼できるデータ基盤に基づいた研究手法や倫理規定、教育システムを正しく整備できれば、人文学分野でもAI技術の導入は十分に可能とする。そこで研究チームは今回、これらの課題を解決し、人文学分野でLLMの多言語による文脈処理の能力を駆使した新たな研究方法を提示することを試み、西洋古典学に特化したAI対話システムとして「ヒューマニテクスト」を開発したという。

ヒューマニテクストの特徴は、西洋古典分野で広く利用されている「Perseus Digital Library」におけるオープンリソースのテクストデータなどを再構成することで、信頼できる原典テクストに基づいた回答を生成できる点とする。さらに、回答の典拠となる原典テクストとその典拠情報も同時に出力することができ、ユーザーは出力の正確性をいつでも容易に確認することが可能とのこと。このようにして、偽情報生成(ハルシネーション)の問題を可能な限り低減させたという。

現在、古代ギリシア語やラテン語の古典テクストを研究する際に使用されるデータベースは、特定の単語の用例を検索することはできるものの、そのデータ量が膨大であるため、すべての検索結果を1つ1つ調べるのはほぼ不可能だ。そのためこれまで研究者は、特定の著者や著作に調査対象を絞り、手作業で用例を確認するしかなかった。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください