ヒトの読解能力を超えたAIの最新言語モデル、日本語版初公開!
PR TIMES / 2019年10月25日 10時25分
~ビジネス文章データを学習したXLNet事前学習済モデル~
日本語の文章を解析するAI(=自然言語処理技術)の研究開発をするストックマーク株式会社(https://stockmark.ai/ 本社:東京都港区、代表取締役CEO:林 達、以下「ストックマーク」)は、2019年10月25日、ディープラーニングを用いたアルゴリズムであるXLNet(エックスエルネット)の日本語事前学習済モデルを初公開いたしました。
様々なタスクを高精度で解くという意味でこれまで最も良いとされていたのは「BERT」と呼ばれるモデルで、日本語のBERT事前学習済モデルとそれ以前にはELMo学習モデルにおいても公開してまいりました。この度は、20を超える評価タスクでBERTの精度を超えたXLNetについて、大規模日本語ビジネスニュースコーパスを学習したXLNet(MeCab+Sentencepiece利用)モデルを初公開します。XLNetを適用することにより、特にエンティティ抽出の精度がさらに向上し、これまで人が文章を読まないと判断できなかったビジネスおける新しい製品名やサービス名、新興企業などを事前の辞書(コーパス)なしに自動抽出することが可能となり、大量のビジネス文章から精度のよい洞察を導くことが可能となります。
▼モデルのダウンロードリンク及び詳細はこちらから
https://qiita.com/mkt3/items/4d0ae36f3f212aee8002
▼自然言語処理とは
人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野です。
▼ディープラーニングとは
人間が自然に行うタスクをコンピュータに学習させる機械学習の手法の一つです。
▼XLNetとは
ディープラーニングを用いた自然言語処理は翻訳、QAタスク、文書分類など多岐にわたるが、それらのタスクを解く際は、タスクにまたがって有用な表現を教師なしで取得する「事前学習」と、事前学習の結果をもとにタスク用に再学習させる「微調整(fine-tuing)」という2段階にわけるという手法が近年とメジャーとなっています。
事前学習においては、BERTという手法と、Seq2Seqという自己回帰を用いた言語モデルの2つが頻繁に使われています。
BERTは、順方向・逆方向の情報をうまく扱えますが、予測対象の単語同士の依存関係を学習しにくいという特徴があります。一方、Seq2Seqのような自己回帰言語モデルは順々に単語を読み込ませるため、予測対象の単語同士の依存関係を学習できますが、順方向・逆方向の情報を同時に扱えないという問題がありました。
XLNetは、予測対象の単語同士の依存関係を学習できる自己回帰言語モデルでありながら、自己回帰言語モデルの弱点でありBERTの良いところである「順方向・逆方向の情報を同時に扱える」性質を持っています。
▼ストックマーク株式会社 会社概要
[画像: https://prtimes.jp/i/24407/34/resize/d24407-34-944619-0.jpg ]
最先端の自然言語処理の研究をベースに、組織で使うニュース及びナレッジ共有プラットフォーム「Anews」、AIが競合の動向を瞬時にリサーチし経営の戦略策定をサポートする「Astrategy」、社内外のテキストデータや営業日報・商談メモを解析し、営業戦略を支援するサービス「Asales」を提供しています。
会社名 :ストックマーク株式会社
所在地 :東京都港区南青山一丁目12番3号 LIFORK MINAMI AOYAMA S209
設立 :2016年11月15日
代表者 :代表取締役CEO 林 達
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
【4月18日(木) 無料セミナー】『カーボンニュートラルを加速する注目技術2024』を開催(ストックマーク主催)
PR TIMES / 2024年4月15日 12時15分
-
【4月11日(木) 無料セミナー】『社内外の情報がAIでつながる ストックマークAIが切り拓くシームレスな情報収集』を開催(ストックマーク主催)
PR TIMES / 2024年4月8日 11時15分
-
リッジアイ、目的特化型の軽量日本語LLM開発で高精度の検証結果
マイナビニュース / 2024年3月27日 12時31分
-
Anewsに待望の「社内情報検索機能」がリリース決定!ニュースや特許論文などの外部情報と社内情報の横断検索・要約生成が可能に
PR TIMES / 2024年3月27日 12時15分
-
AI・ディープラーニング技術開発のリッジアイ、目的特化型の日本語LLM開発においてLlama2に次ぐ精度の検証結果を達成
PR TIMES / 2024年3月26日 11時45分
ランキング
-
1東京円一時1ドル154円87銭、34年ぶり円安水準を更新…経団連会長「円安過ぎる」
読売新聞 / 2024年4月23日 20時39分
-
2パナ、電動自転車発火の恐れ バッテリー14万個リコール
共同通信 / 2024年4月23日 18時32分
-
3いなば食品、大炎上でも「不買運動」が起きぬ理由 キリンはあれだけ盛り上がったが…どこに違いが?
東洋経済オンライン / 2024年4月23日 18時10分
-
4「配属ガチャ」対策を進める企業が、一度立ち止まって考えるべきコト
ITmedia ビジネスオンライン / 2024年4月24日 8時15分
-
5わずか2年半で消えた「幻のJR新型特急」とは 裏目に出た高性能
乗りものニュース / 2024年4月24日 9時42分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください