1. トップ
  2. 新着ニュース
  3. 経済
  4. ビジネス

たまにウソつく生成AIに「契約書管理」は無理? 「40年の歴史」持つ言語解析AIが再評価されるワケ

ITmedia ビジネスオンライン / 2024年7月11日 8時20分

 正確性を求める中では、生成AIではなく伝統的な言語解析AIも活用した。契約書の親子関係を特定する機能だ。

 多くの企業取引では、基本契約書(親契約)と個別契約書(子契約)が存在する。これらの関係を正確に把握することは、契約全体の理解と管理において極めて重要になる。例えば、基本契約に書かれている日付や数字は、覚書などの子契約によって上書きされる。どの子契約がどの親契約と結びついているかは、契約全体を把握するために必須の情報となる。

 通常子契約には「甲乙間で◯年◯月◯日付締結の基本契約取引書の定めに従い……」など関係性を示す文言が入っている。これをAIで把握し、2つの契約に関連があることを登録すればいいわけだが、意外とこれが難しい。

●40年の歴史持つ技術を再評価

 この課題を解決するために、Sansanが採用したのが、2023年に子会社化した言語理解研究所の技術だった。同研究所は40年近い歴史を持ち、日本語の解析に特化したルールベースの技術を開発してきた。同研究所では、日本語の単語一つ一つに、品詞、正誤情報、揺れ、同義語などを登録しており、さらにどの概念に分類されるか、どんな意図や感情を想起させるかといったことを記述した大規模言語知識データベースを構築してきた。いわば伝統的なAIの手法を使った言語解析の仕組みだ。

 「新しい言葉が生まれるたびに、人力でデータベースに登録し続けている」と尾花氏は説明する。「40人ほどの会社だが、そのうち10人から20人が辞書チームとして、この作業に従事している。この地道な作業が、高精度な解析を可能にしている」

 「契約書が指し示す原契約(親契約)がどれかを抜き出せ」。こんなプロンプトを最新の生成AIに投げれば、ほとんどの場合正解が出てくるだろう。生成AIがあれば従来型の言語解析AIはもはや不要になる――。そんなこともささやかれる昨今だが、用途によっては逆にルールベースであることの意味がある。

 生成AIの精度は急速に上がっているが、仕組み上、誤りを完全になくすことはできない。さらになぜ今回間違ったのかの解明も困難だ。そして次回間違わないように修正することも実質的に行えない。「ルールベースの技術を中心に据えることで、万が一誤りが生じた場合でも、なぜ間違ったのか、どう修正したのかを明確に説明できる。これは、特に法務分野では極めて重要な要素だ」と、尾花氏は説明可能性の重要性を強調した。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください