レッジ、ウェブライダー、SPJの共同研究結果第一弾「ディープラーニングを用いた誤字脱字検出機能」が『文賢』に搭載
PR TIMES / 2018年4月25日 10時1分
[画像1: https://prtimes.jp/i/30320/6/resize/d30320-6-291217-2.jpg ]
株式会社レッジは、株式会社ウェブライダー、株式会社SPJ と共同で、2017年12月より「機械学習を用いた文章校正の共同研究」を行ってまいりました。このたび、研究結果の第一弾として、ウェブライダーの提供する文章校正ツール「文賢(ブンケン)」に、「ディープラーニングを用いた誤字脱字検出機能」が搭載されたので、お知らせいたします。
■ 推敲・校閲支援ツール「文賢」とは
「文賢」は、株式会社ウェブライダーが提供する、ブラウザ上で文章をチェックするクラウド型の推敲・校閲支援ツール。「誤った敬語」や「ら抜き言葉」などのチェックをはじめ、読みやすく分かりやすい文章をつくるための推敲支援・アドバイス機能も搭載している。3/12には類語表現を大幅に拡充した「文章表現機能」を大幅アップデートしており、ライティングやメール作成業務などを総合的にサポートする。
文賢の詳細:https://rider-store.jp/bun-ken/
■誤字脱字検出モデルの概要
今回、さまざまな試行錯誤を経て、以下のようなアプローチを採用しました。ディープラーニングならびに、自然言語処理の技術を誤字脱字検出に活用し、実際の『文賢』ツールに組み込んだ形となっています。
[画像2: https://prtimes.jp/i/30320/6/resize/d30320-6-967584-1.jpg ]
・大量のコーパスからRNN言語モデルを作成。誤字検出に最適な複数のハイパーパラメータを探索
・作成された学習済み言語モデルによる単語の予測と、入力文章との比較
・誤字として検出された単語をもとに、レーベンシュタイン距離による正解らしい単語のサジェストを実行
[画像3: https://prtimes.jp/i/30320/6/resize/d30320-6-170705-0.jpg ]
現時点では、全ての誤字・脱字を完璧に検出するというわけではありませんが、これまでの共同研究成果から見えてきた更なる改善点に向き合い、今後も更にその精度を進化させていく予定です。
■誤字・脱字検出モデルが利用するデータについて
今回リリースされた文賢「誤字脱字チェック機能」では、株式会社ウェブライダー・株式会社レッジの著作データ、ならびに下記データの一部が学習時の教師データとして利用されています。
・livedoor ニュースコーパス (準拠ライセンス:CC BYND2.1)
・内閣府ホームページコンテンツ(準拠ライセンス:CC BY 4.0)
・文部科学省ホームページコンテンツ(準拠ライセンス:CC BY 4.0)
・ウェブライダー提供コンテンツコーパス
・その他提携メディアコンテンツコーパス
■AI学習のご協力について
当プロジェクトのAI学習に際し、株式会社ネットワールドより、同社 AIセンター内 NVIDIA Tesla P100 GPU+IBM POWERプロセッサー搭載ディープラーニング向けサーバー『S822LC for HPC (Minsky)クラウド検証環境』にて、学習の高速化にご協力いただきました。
【株式会社レッジ概要】
株式会社レッジは、AI導入の現場の「発想と実装の間をつなぐ」ことを目的とし、AIプロジェクトのコンサルティングや、AI特化型Webメディア「Ledge.ai(https://ledge.ai/)」の運営を行なっています。日々発表されるAI関連技術を、実際にビジネスの現場でどの程度、どのくらいの工数で、どのくらいの費用で活用できるのかという視点での情報発信、及びその知見を生かしたAIプロジェクトのコンサルティングによって、世の企業のスムーズなAI導入を助けます。
・会社名 :株式会社レッジ
・URL :https://ledge.co.jp/
・代表者 :橋本和樹
・所在地 :東京都品川区西五反田2-30-4 BR五反田7F
・事業内容:AIに特化したメディア運営、AIプロジェクトのコンサルティング
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
AI翻訳「Mirai Translator(R)」の活用により、学生の読解スピードが向上。英作文の正確性にも寄与し、アウトプットのクオリティや指導内容も変化
PR TIMES / 2024年4月23日 13時0分
-
Smart-IP株式会社 外部ツール連携による特許明細書作成の機能強化のお知らせ
PR TIMES / 2024年4月15日 15時15分
-
鈴木おさむさんも推薦!グッドデザイン賞ベスト100も受賞した『きみ辞書(きみの名前がひける国語辞典)』が今年も販売開始!
PR TIMES / 2024年4月2日 15時15分
-
沖縄発、KDDIグループのmediba seasorizeカンパニーが生成AI(GPT)を活用した社内向け広告審査システム『seabo(シーボ)』を開発 4月1日(月)より運用開始
PR TIMES / 2024年3月28日 14時15分
-
AI・ディープラーニング技術開発のリッジアイ、目的特化型の日本語LLM開発においてLlama2に次ぐ精度の検証結果を達成
PR TIMES / 2024年3月26日 11時45分
ランキング
-
1リッチモンド、顧客満足度1位に「なっちゃう」神髄 目指さずとも…要因は"委ねる"から生まれる主体性
東洋経済オンライン / 2024年4月23日 10時30分
-
2いなば食品、大炎上でも「不買運動」が起きぬ理由 キリンはあれだけ盛り上がったが…どこに違いが?
東洋経済オンライン / 2024年4月23日 18時10分
-
3「会社の飲み会」を避ける人は大損している…飲み会は無駄という若手が知らない"お値段以上のリターン"
プレジデントオンライン / 2024年4月23日 6時0分
-
4【要注意】自宅に「エコキュートの無料点検をします」と突然の来訪! 悪徳業者の「詐欺」の場合もあるの? 正規業者との見分け方や注意点を解説
ファイナンシャルフィールド / 2024年4月22日 5時0分
-
5今から家買う人は知らないとマズい「耐震」の真実 過去の大地震の被害データを分析してわかること
東洋経済オンライン / 2024年4月23日 13時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください