スマホ×OCRで新しいモバイルアプリを実現しよう ~ 活字認識の基礎と精度向上テクニック

CodeZine / 2012年6月18日 14時0分

認識結果画面

 近年、カメラを標準装備したスマートデバイスの普及に伴い、バーコードリーダーやOCRといった光学認識技術の活用シーンが身近に広がってきています。本稿では、日本語OCRの製品開発で20年以上の歴史を持つパナソニック ソリューションテクノロジーの取材をもとに、OCR関連技術、特にスマートフォン周りの最新動向を紹介します。

■対象読者

「OCR」という言葉を聞いたことはあるが、詳細や具体的な用途をよく理解していない人 Android/iOSアプリケーションの開発者 ■手入力によるデータ入力を代行する「OCR」

 不況下の昨今、クライアントへの提案に効率化やコスト削減といったキーワードは外せません。手入力によるデータ入力のコストを削減する「OCR」の技術は、業務システム提案の目玉要素の一つとして、これまで多くの引き合いがありました。

 またOCRは画像データを入力として扱う性質上、据え置きが前提のスキャナが必要となり、適用範囲が限定的でした。しかし、最近はカメラを備えたスマートデバイスの普及によって、既成の枠にとらわれない使われ方をするようになってきました。

 アイデア次第で新しい価値を提案する余地が残されている「OCR」。OCRとはどういったもので、何を提供可能にするのでしょうか。新規ビジネスを開拓をする手掛かりとして、OCRの基本をおさらいしてみます。

■「OCR」の概要とメリット

 「OCR」とは、Optical Character Recognition(光学式文字読取)の略で、活字や手書き文字などを画像データとして取り込み、編集可能なテキストデータ(文字コード)に変換するソフトウェアのことです。

 OCRには、次のような特長があります。

コンパクト化紙書類や画像ファイルをテキスト化し、物理的スペースやハードディスク容量を節約できる

検索性テキストデータに変換されるため、必要な情報を検索しすばやくアクセスできる

再利用性表をCSV形式のデータとして取り込むなどして、データベースへの手入力の手間を省略できる

 大まかに次のような仕組みで実現されています。

OCR処理の概要


 類似の技術にチェックマーク式の答案用紙や投票券で使われる「OMR」(Optical Mark Recognition)があります。

■OCRの活用シーン

 それでは実際に、「OCR」や「OMR」の技術がどのようにアプリケーションで活用されているかを見てみましょう。

●業務システムのデータ管理を手助け

 OCRやOMRは、本質的には「紙に書かれた情報を、アプリケーションで利用可能な電子データに変換する」手助けをする技術といえます。そのため、大量の注文書の入力処理や、アンケート結果の集計、答案用紙の採点などに使われてきました。バーコードやQRコードで識別番号を振っておき、物品受領書の付け合わせ作業を簡略化する目的などにも使われています。

 業務改善の一環として現在はペーパーレスの方向に進みつつはあるものの、まだ過渡期であり、「社内システムにアクセスできない派遣社員の勤怠表を紙ベースで管理し、後からシステムに取り込むケース」など、引き続き紙と共存しなければならない環境も少なくありません。

 OCR、OMRは、主にこのような基幹・業務システムを中心に活用されてきました。

●モバイル端末の普及により、業務向けからコンシュマー向けへ

 最近は、スマートフォンやタブレットの普及により、モバイル端末に内蔵しているカメラを使って活字認識を行うアプリケーションが増えてきています。

 例えば、「インターネットからの各種申込みにおいて、スマートフォンのカメラで運転免許証を撮影し、OCRを使って写真から入力項目を自動的に拾い出して、いくらか修正するだけで申込が行える」といった事例が出てきています。また、海外の旅行者向けのアプリとして「レストランのメニューなどを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳して表示する」といったアイデアもあるようです。

 このようにOCRの技術を利用できる端末が個人レベルで普及して身近になることで、業務向けだけではなく、コンシュマー向けにも便利なアプリケーションを提供できる可能性が広がりつつあります。


CodeZine

トピックスRSS

ランキング