LLMによる視覚読解技術を確立～グラフィカルな文書を理解する「tsuzumi」実現に向けて～

Digital PR Platform / 2024年4月12日 0時0分

3．研究の成果
　LLMの高い推論能力を活用し、視覚的に文書を理解する新たな視覚読解技術を世界に先駆けて開発しました（図2)。この実現に向けて本研究では、① 文書画像をLLMの表現に変換可能な新たなアダプタ技術※5の開発および、② 多様な視覚読解タスクを対象とした指示遂行データセットの構築を行いました。これにより、LLMが文書の内容を視覚と言語を融合して理解し、任意のタスクを追加学習なしで遂行することが可能となります。例えば、文書を検索・スクリーニングを行う業務、専門文献の読書補助などオフィス作業や日常生活におけるヒトの認知が必要なシーンにおいて、LLMを活用することが可能です。

[画像2]https://digitalpr.jp/simg/2341/86559/700_373_202404111010076617386fc0f13.JPG

4．研究のポイント
　① 画像中の文字および位置（座標）、画像の特徴を定量的に表現した画像情報、指示テキストを同一空間上にマッピングし、LLMに繋ぐ新たなアダプタ技術を開発しました。図2で示すように、学習時には、モデルパラメータの大部分を占めるLLMや画像エンコーダのパラメータを固定にし、アダプタのみを学習対象にすることで、パラメータ効率の良い学習を実現しています。図3に示すように、本技術のアダプタでは、Transformer※6構造を採用し、学習可能なトークンに対して、相互注意※7では画像特徴との関係性を捉え、自己注意※7では指示テキストや画像中の文字および位置情報との関係性を捉えます。これにより、文書画像のマルチモーダルな特徴をLLMにとって解釈しやすい情報として獲得することができます。

[画像3]https://digitalpr.jp/simg/2341/86559/700_329_202404111010076617386fa4e8c.JPG

　② 文書画像を知識源とし、質問応答、情報抽出、文書分類を始めとする12種類の視覚読解タスクを、ヒトの指示を基に遂行する世界最大規模の指示遂行データセットを構築しました。
　これらの貢献により、図4で示す様に、未学習のタスク※8、※9においても、目的タスクで学習を行なった教師あり学習モデルの性能やGPT-4（テキスト入力のみ）、画像を理解できるLLMであるLLaVA※10などに匹敵または凌駕する高い性能を達成しました。

この記事に関連するニュース

ナレッジグラフと大規模言語モデルを融合する研究開発を強化することで、生成AIの信頼性を高め業務活用を加速
PR TIMES / 2024年5月17日 18時15分
世界初、AIモデルの再学習コストを大幅に削減可能な過去の学習過程を再利用する「学習転移」を実現～NTT版LLM「tsuzumi」など基盤モデルの更新・差し替えを容易に～
Digital PR Platform / 2024年5月7日 15時13分
連合学習において一部のクライアントに異常や悪意がある場合にも高精度にAIモデルを学習可能な手法を開発～LLM tsuzumi の学習への適用やIOWN機能としての実用化を目指す～
Digital PR Platform / 2024年5月7日 15時10分
NSSOL、生成AI・LLMを活用した業務自動化を実現するプラットフォーム「Alli LLM App Market」を提供開始
Digital PR Platform / 2024年5月7日 13時57分
データ分析の適用範囲を広げるバラバラなデータの回帰分析を世界で初めて実現～「万能近似能力」を持つ深層学習によるデータ分析の適用領域の拡大～
Digital PR Platform / 2024年4月26日 15時0分

ランキング

総合
芸能
社会
スポーツ
経済
国際
IT
ライフ

1

《井上咲楽“破局スピード報告”の意外な理由》事務所の大先輩二人に「隠し通せなかった嘘」オズワルド畠中との交際2年半でピリオド
NEWSポストセブン / 2024年5月20日 19時30分
2

高橋一生16歳差婚、羽賀研二41歳差カップル成立「結婚していきなり介護」？年の差夫婦はいいことばかりじゃないかも
女子SPA！ / 2024年5月21日 8時46分
3

工藤静香はステージママ、国生さゆりは悪女役…ドラマ「ふてほど」で注目“元おニャン子”の処世術
日刊ゲンダイDIGITAL / 2024年5月21日 11時2分
4

“駅ナカコストコ”登場で話題の「コストコ再販店」はおトクなのか？【2024年最新コストコ事情】
オールアバウト / 2024年5月20日 21時50分
5

栃木・那須2遺体　「実行役」2人を殺人容疑で再逮捕へ　21日にも
毎日新聞 / 2024年5月20日 23時0分

もっと見る

1

《井上咲楽“破局スピード報告”の意外な理由》事務所の大先輩二人に「隠し通せなかった嘘」オズワルド畠中との交際2年半でピリオド
NEWSポストセブン / 2024年5月20日 19時30分
2

高橋一生16歳差婚、羽賀研二41歳差カップル成立「結婚していきなり介護」？年の差夫婦はいいことばかりじゃないかも
女子SPA！ / 2024年5月21日 8時46分
3

工藤静香はステージママ、国生さゆりは悪女役…ドラマ「ふてほど」で注目“元おニャン子”の処世術
日刊ゲンダイDIGITAL / 2024年5月21日 11時2分
4

「月曜から夜ふかし」でまさかの人物が街行く人インタビューに登場　女性の告白にマツコ仰天「えぇ～」
スポニチアネックス / 2024年5月21日 6時48分
5

ロッチ中岡の13年愛婚に芸能界から祝福の嵐！みちょぱ、ローラ、出川の充電旅…「わーーー！」「きゃー」
スポニチアネックス / 2024年5月20日 21時42分

もっと見る

1

栃木・那須2遺体　「実行役」2人を殺人容疑で再逮捕へ　21日にも
毎日新聞 / 2024年5月20日 23時0分
2

ランクル７０は誰の手に…公用車売却に全国のファン興奮「旅費をかけても確認する価値ある」
読売新聞 / 2024年5月20日 13時36分
3

潜伏先でＳＮＳにピースサイン＝実行役、投稿きっかけに身柄確保―夫妻殺害容疑で再逮捕へ・那須２遺体
時事通信 / 2024年5月20日 23時25分
4

ラッコも「草食化」か、オスが求愛しなくなり飼育数減少…数年後には日本の水族館からいなくなる？
読売新聞 / 2024年5月21日 7時15分
5

つばさの党選挙妨害事件に支援者らも関与か　「拠点」に十数人出入り、住み込みも
産経ニュース / 2024年5月20日 20時12分

もっと見る

1

槙野智章氏、パリ五輪は「世界へのアピールの場」、注目選手に“因縁の選手”挙げ「負けん気とかめちゃくちゃ好き」
スポーツ報知 / 2024年5月20日 22時31分
2

中日・中田翔　尊敬する大先輩ダルビッシュの偉業祝福「人としても尊敬する先輩の大偉業に大変うれしく」
スポニチアネックス / 2024年5月20日 23時2分
3

【関西学生野球】関学大6季ぶり優勝の原動力は「コロナ世代」の結束　悪夢の「5・20」が歓喜の一日へ
スポニチアネックス / 2024年5月21日 6時3分
4

万年最下位争いのチームが連日満員　ファンの期待と熱くて温かな視線
スポニチアネックス / 2024年5月21日 11時1分
5

【夏場所】役力士が続々離脱の異常事態　芝田山親方が憂慮「稽古の問題が大きく影響している」
東スポWEB / 2024年5月20日 6時16分

もっと見る

1

日本円の価値崩壊へのカウントダウン…国内全上場企業株「5割」を保有する“大筆頭株主”が打った「危険な一手」の行方に注目【経済のプロが警鐘】
THE GOLD ONLINE（ゴールドオンライン） / 2024年5月21日 8時15分
2

「好きに生きてきた代償だな…」月収〈16万円〉72歳の日雇いバイト、年金〈月1万円未満〉の現実
THE GOLD ONLINE（ゴールドオンライン） / 2024年5月21日 5時15分
3

NY金先物、最高値更新　中東情勢不安で買い広がる
共同通信 / 2024年5月21日 5時15分
4

東海道線「107年ぶり新駅」いよいよ着工へ！駅周辺も大化け？工事の施行協定を締結 JR東日本
乗りものニュース / 2024年5月21日 14時34分
5

ドライブスルー中古車査定が登場…強みは「スピードと会話の短縮」
レスポンス / 2024年5月20日 19時30分

もっと見る

1

逮捕状請求に激しく反発＝イスラエル・ハマス
時事通信 / 2024年5月20日 23時40分
2

ＩＣＣの逮捕状請求にイスラエル首相「恥知らずの決定だ」…バイデン大統領も「言語道断」
読売新聞 / 2024年5月21日 10時7分
3

焦点：米支援遅れに乗じロシアが大攻勢、ウクライナに戦線崩壊の危機
ロイター / 2024年5月20日 18時59分
4

ロシア提出の宇宙決議案を否決＝米「核搭載衛星を開発」と批判―国連
時事通信 / 2024年5月21日 7時31分
5

台湾総統就任式、中国が日本議員出席に抗議　「協調精神に反する」
ロイター / 2024年5月21日 15時41分

もっと見る

1

今なら最大3500ポイント獲得　銀行の振込手数料を0円にする「エアウォレット」
ASCII.jp / 2024年5月21日 7時0分
2

貼り付ければOK、配線不要の小型ドライブレコーダーを実際に試してみた　画質やWi-Fiスマホ連携の使い勝手を検証
ITmedia Mobile / 2024年5月21日 12時30分
3

加護亜依、夫が1年前から病魔に襲われ……“嫌がらせ記事”と発覚時期かぶり「メンタル凹んでるときにダブルでやられて」「苦しかった」
ねとらぼ / 2024年5月21日 13時40分
4

Googleドライブ、カーソルを合わせるだけでビデオのプレビューが可能に
マイナビニュース / 2024年5月20日 18時40分
5

Apple Watchを外出時にほぼ持ち出さなくなった理由
ITmedia Mobile / 2024年5月19日 10時5分

もっと見る

1

“駅ナカコストコ”登場で話題の「コストコ再販店」はおトクなのか？【2024年最新コストコ事情】
オールアバウト / 2024年5月20日 21時50分
2

朝ドラのモデル三淵嘉子は父親に｢好きな人は｣と聞かれ｢和田さんがいい｣と答えた…実弟が見た結婚のいきさつ
プレジデントオンライン / 2024年5月21日 6時15分
3

初めてiPadを購入します。「iPad」「iPad Pro」「iPad Air」「iPad mini」どれを買うべきですか？
オールアバウト / 2024年5月20日 21時20分
4

Xiaomi 14 Ultraが日本上陸。高級ブランド・ライカと開発した4眼カメラの実力は？【レビュー】
オールアバウト / 2024年5月20日 21時15分
5

お金持ちとは本当に"うらやましい人生"なのか｢FIRE｣の流行から数年たって改めて考える
東洋経済オンライン / 2024年5月21日 11時0分

もっと見る

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください