レッジ、ウェブライダー、SPJの共同研究結果第一弾「ディープラーニングを用いた誤字脱字検出機能」が『文賢』に搭載
PR TIMES / 2018年4月25日 10時1分
[画像1: https://prtimes.jp/i/30320/6/resize/d30320-6-291217-2.jpg ]
株式会社レッジは、株式会社ウェブライダー、株式会社SPJ と共同で、2017年12月より「機械学習を用いた文章校正の共同研究」を行ってまいりました。このたび、研究結果の第一弾として、ウェブライダーの提供する文章校正ツール「文賢(ブンケン)」に、「ディープラーニングを用いた誤字脱字検出機能」が搭載されたので、お知らせいたします。
■ 推敲・校閲支援ツール「文賢」とは
「文賢」は、株式会社ウェブライダーが提供する、ブラウザ上で文章をチェックするクラウド型の推敲・校閲支援ツール。「誤った敬語」や「ら抜き言葉」などのチェックをはじめ、読みやすく分かりやすい文章をつくるための推敲支援・アドバイス機能も搭載している。3/12には類語表現を大幅に拡充した「文章表現機能」を大幅アップデートしており、ライティングやメール作成業務などを総合的にサポートする。
文賢の詳細:https://rider-store.jp/bun-ken/
■誤字脱字検出モデルの概要
今回、さまざまな試行錯誤を経て、以下のようなアプローチを採用しました。ディープラーニングならびに、自然言語処理の技術を誤字脱字検出に活用し、実際の『文賢』ツールに組み込んだ形となっています。
[画像2: https://prtimes.jp/i/30320/6/resize/d30320-6-967584-1.jpg ]
・大量のコーパスからRNN言語モデルを作成。誤字検出に最適な複数のハイパーパラメータを探索
・作成された学習済み言語モデルによる単語の予測と、入力文章との比較
・誤字として検出された単語をもとに、レーベンシュタイン距離による正解らしい単語のサジェストを実行
[画像3: https://prtimes.jp/i/30320/6/resize/d30320-6-170705-0.jpg ]
現時点では、全ての誤字・脱字を完璧に検出するというわけではありませんが、これまでの共同研究成果から見えてきた更なる改善点に向き合い、今後も更にその精度を進化させていく予定です。
■誤字・脱字検出モデルが利用するデータについて
今回リリースされた文賢「誤字脱字チェック機能」では、株式会社ウェブライダー・株式会社レッジの著作データ、ならびに下記データの一部が学習時の教師データとして利用されています。
・livedoor ニュースコーパス (準拠ライセンス:CC BYND2.1)
・内閣府ホームページコンテンツ(準拠ライセンス:CC BY 4.0)
・文部科学省ホームページコンテンツ(準拠ライセンス:CC BY 4.0)
・ウェブライダー提供コンテンツコーパス
・その他提携メディアコンテンツコーパス
■AI学習のご協力について
当プロジェクトのAI学習に際し、株式会社ネットワールドより、同社 AIセンター内 NVIDIA Tesla P100 GPU+IBM POWERプロセッサー搭載ディープラーニング向けサーバー『S822LC for HPC (Minsky)クラウド検証環境』にて、学習の高速化にご協力いただきました。
【株式会社レッジ概要】
株式会社レッジは、AI導入の現場の「発想と実装の間をつなぐ」ことを目的とし、AIプロジェクトのコンサルティングや、AI特化型Webメディア「Ledge.ai(https://ledge.ai/)」の運営を行なっています。日々発表されるAI関連技術を、実際にビジネスの現場でどの程度、どのくらいの工数で、どのくらいの費用で活用できるのかという視点での情報発信、及びその知見を生かしたAIプロジェクトのコンサルティングによって、世の企業のスムーズなAI導入を助けます。
・会社名 :株式会社レッジ
・URL :https://ledge.co.jp/
・代表者 :橋本和樹
・所在地 :東京都品川区西五反田2-30-4 BR五反田7F
・事業内容:AIに特化したメディア運営、AIプロジェクトのコンサルティング
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
DeepLが初の独自LLM搭載サービス「DeepL Write Pro」発表、適切な文体や語調を提案
マイナビニュース / 2024年4月26日 7時28分
-
資料作成のプロフェッショナル10人がノウハウを語る!資料やスライド作成のノウハウが集まるウェビナー「みんなの資料作成Fes」を5/22(水)オンラインで無料開催!
PR TIMES / 2024年4月25日 13時30分
-
身体性の有無による人間と機械の言語処理プロセスの違いの解明に向けたオノマトペ音象徴性の分析を行った論文が「2024年度 人工知能学会全国大会」にて発表採択
PR TIMES / 2024年4月24日 13時15分
-
Smart-IP株式会社 外部ツール連携による特許明細書作成の機能強化のお知らせ
PR TIMES / 2024年4月15日 15時15分
-
鈴木おさむさんも推薦!グッドデザイン賞ベスト100も受賞した『きみ辞書(きみの名前がひける国語辞典)』が今年も販売開始!
PR TIMES / 2024年4月2日 15時15分
ランキング
-
1【解説】円安どこまで進む? 深刻…家計にも影響、為替介入の可能性は
日テレNEWS NNN / 2024年4月25日 20時5分
-
2英郵便局の冤罪事件、会計システム原因の富士通社長「申し訳ない」と謝罪…1月にドラマ化され批判強まる
読売新聞 / 2024年4月25日 23時0分
-
3サイゼリヤ、ギリギリ「国内黒字化」も残る難題 国内事業の利益率0.05%、値上げなしで大丈夫か
東洋経済オンライン / 2024年4月24日 7時30分
-
4アキレス、シューズの国内生産終了へ コスト増や少子化など背景
ロイター / 2024年4月25日 16時27分
-
5ベッド派?布団派?「老けない」のはどっち?頑張らずに「老いない」環境を手に入れる方法【理学療法士が助言】
THE GOLD ONLINE(ゴールドオンライン) / 2024年4月25日 18時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください