OCR技術の限界を突破。特許技術「マルチAI OCR」の実証実験で、信頼精度99.997%を達成
PR TIMES / 2022年6月14日 18時15分
データエントリー業界の標準的な信頼精度99.97%を上回る、特許技術「マルチAI OCR」を確立
法人向けソフトウェアパッケージ、クラウドサービスを提供する株式会社ハンモック(本社:東京都新宿区、代表取締役社長:若山 大典、以下 ハンモック)は、特許技術「マルチAI OCR」※1 の技術を活用し、トリプルOCR(3つのOCRエンジンで文字認識)でデータエントリー業界の標準信頼精度99.97%※2 を上回る、99.997%を達成したことを発表いたします。
[画像: https://prtimes.jp/i/52725/165/resize/d52725-165-fed4cd857b12f8c8251f-11.png ]
■実証実験の背景
紙に書かれた文字を読み取り、データ化する技術「OCR」。弊社では28年に渡り、さまざまなお客様にOCRを導入いただき、データエントリー業務を効率化するご支援をして参りました。昨今では、機械学習やディープラーニング、蓄積データの活用ができるAIと組み合わせることで「AI OCR」と呼ばれる、より精度が高いOCRが誕生しました。
AI OCRは精度が高いことが売りですが認識の精度を示す認識率は、99.1%※3 が一般的であり、データエントリー業界の標準信頼精度99.97%に及ばないのが現状です。「99.1%」という数値だけを見ると非常に高く感じますが、100項目に1項目の誤りが発生します。重ねて、この100項目に1項目の誤りがどこで発生しているか分かりません。データ量が多くなればなる程、この誤りは非常に大きな問題となります。
対策として挙げられるのは、人力によるデータの全件目検です。つまり、OCRを導入しても、人力による全件目検業務が残存するため、これまでの技術では業務効率化の範囲が限定的であるという課題がありました。この課題解消のため、弊社特許技術「マルチAI OCR(複数のAI OCRエンジンで項目を判読する技術)」により、入力業務がどのくらい効率化できるかをシミュレーションしました。
■実証実験の前提条件
日本年金機構のホームページにて公開されている次の対象帳票で実証実験を実施。
1.対象帳票
健康保険・厚生年金保険 被保険者報酬月額変更届/厚生年金保険 70歳以上被用者月額変更届
※サンプルデータを弊社にて準備し、テスト画像を作成
2.データ量
信頼性99.997%以上を実証するために、100,000項目以上の画像を弊社にて準備して、本検証の対象とした。
3.データ分布
準備した画像の活字と手書きの割合は、活字8割、手書き2割とした。
4.OCRエンジン
3つのOCRエンジンの結果を組み合わせてシミュレーションを実施。
※本実験ではそれぞれのOCRを下記の通り定義する。
・シングルOCR:1つのOCRエンジンで文字認識
・ダブルOCR:特性の異なる2つのOCRエンジンで文字認識し、結果を比較分析
・トリプルOCR:特性の異なる3つのOCRエンジンで文字認識し、結果を比較分析
■実証実験の結果
1.OCRの信頼精度
本検証の結果、以下の処理によって99.997%以上の信頼精度を実現できることが確認できた。
(1)トリプルOCRによる処理
(2)演算/マスタ利用による誤確定防止チェック処理
・OCRエンジン個々の認識精度は単体では99.997%以上の認識精度を実現することはできなかった。
・ダブルOCRでは99.997%以上の認識精度を実現することはできなかった。
・OCRの誤認識を見破るために、弊社特許技術である複数のOCRエンジンを組み合わせることで実現を確認。
<参考>
活字帳票に限定した場合は、ほぼ100%の信頼精度を実現できることが確認できた。
尚、本検証による正解率は2022年04月30日時点の各AI OCRエンジンの精度によるものであり、今後の追加学習により手書き文字の読取精度はより向上するものと想定する。
2.入力業務の効率化
トリプルOCRおよび誤確定防止チェック処理の結果から、人による「確認・修正」が必要なデータの割合は約20%となる。OCRの利用なしで人による2重入力を行っている作業量が200%であると仮定した場合に、約10倍の入力業務効率化が図れるものと考える。
本プレスリリースは実証実験 結果報告書の一部を抜粋しております。
お客様の課題に合わせたソリューションのご提案が可能です。
▼詳細はこちらからお問い合わせください。
https://hmk.web-tools.biz/dcs/inquiry/web_defact/?20220614=pr
※1:特許番号 5464474号
※2:ハンモック調べ
※3:ハンモック調べ
■株式会社ハンモックについて
ハンモックは、法人向けソフトウェアメーカーです。組織を強くするIT環境をすべての人へご提供するべく、法人に必要な3領域『セキュリティ、営業支援、業務効率化』でお客様課題の解決を実行しています。
<製品・サービスはこちら>
▼AssetView(アセットビュー):クライアントPCの運用管理×セキュリティ対策を支援
https://www.hammock.jp/assetview/?20220614=pr
▼ホットプロファイル:クラウド型名刺管理・営業支援ツール(名刺管理×SFA×MAを統合)
https://www.hammock.jp/hpr/?20220614=pr
▼ホットアプローチ:狙った企業に営業ができるフォーム営業ツール
https://www.hammock.jp/hap/?20220614=pr
▼DEFACT:さまざまな帳票の入力業務効率化を支援
・WOZE(ウォーゼ):AI OCR+人のチェックで高精度にデータ化。すぐに始められるクラウドサービス
申込書、勤怠表、アンケートのデータ入力、手書き文字も高精度に認識します。
https://www.hammock.jp/defact/woze/?20220614=pr
・AnyForm OCR:FAX注文書、請求書、納品書に対応した帳票データ化ソフトウェア
https://www.hammock.jp/anyform/?20220614=pr
代表者 : 代表取締役社長 若山 大典
設 立 : 1994年4月1日
資本金 : 3,648万円
売上高 : 36億円(2022年3月期)
従業員数 : 223名(役員除く/パート含む)
本社所在地 : 東京都新宿区大久保1-3-21 ルーシッドスクエア新宿イースト3F
URL : https://www.hammock.jp?20220614=pr
※本ニュースリリース記載の会社名および製品名は、各社の商標または登録商標です。
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
「DynaEye 給与支払報告書OCR」でデータ入力作業を削減!摘要欄など読取項目を拡大し、総括表にも対応
Digital PR Platform / 2024年9月10日 11時0分
-
「DynaEye 給与支払報告書OCR」でデータ入力作業を削減!摘要欄など読取項目を拡大し、総括表にも対応
PR TIMES / 2024年9月10日 11時0分
-
株式会社Arent、海外での労務管理体制を強化するため統合型IT運用管理「AssetView CLOUD」を導入
PR TIMES / 2024年8月27日 14時15分
-
フューチャーアーキテクト、国際物流総合展2024に出展
共同通信PRワイヤー / 2024年8月26日 14時0分
-
生成AI×AI-OCR「DX Suite」が新機能「Few-shot学習」を実装、修正内容を自社環境内で個別学習し“使えば使うほど”読取精度が向上
PR TIMES / 2024年8月26日 13時45分
ランキング
-
1《1個買うと1個もらえる》新作「チョコパイ」が無料ってお得すぎ...。セブン・ミニストップ・ファミマお得企画まとめ(9月24日開始)
東京バーゲンマニア / 2024年9月24日 12時37分
-
2「うまい棒」12円→15円に値上げ 「許容できる範囲をさらに超え……」
ITmedia ビジネスオンライン / 2024年9月24日 13時9分
-
3昭和に大ヒット「青春という名のラーメン」令和に復活! 熱湯1分、タイパ志向に応える 明星食品
食品新聞 / 2024年9月24日 9時2分
-
4「きのこの山」模倣品流通受け、明治が知的財産権の保護を強化へ…製造差し止めなどでブランド保護
読売新聞 / 2024年9月24日 16時59分
-
5ノースボルト、国内で1600人削減 電池増産計画撤回
ロイター / 2024年9月24日 11時19分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください