必要な文書がなかなか見つからない、文書の片付けや整理が大変・・・このような経験を持つ方も多いですよね。紙の文書はかさばってしまい管理が大変ですし、使い勝手も悪いです。しかし、紙の文書に重要な情報が書かれていることも多く、適切な文書管理は欠かせません。
実は、こういった紙の文書を手軽に電子データ化する方法があります。それは、「OCR」を使うことです。OCRは紙の文書から文字認識して電子データ化してくれる技術で、企業での文書管理の効率を飛躍的に向上します。
そのため、OCRを導入する企業は増えているのだとか。とはいえ、まだまだOCRについて良く知らない方も多いですよね。そこでこの記事では、文字認識で使われているOCRの基本概念から活用方法まで、詳しくご紹介します。文書管理に課題を感じている方は、この記事を読んでOCRについてしっかり理解を深めましょう。
OCRとは
オフィスには、紙で印刷された文書が沢山ありますよね。こういった文書はデータ化することで、情報共有しやすくなるなど多くのメリットがあります。しかし、人間が手作業で紙の文書をデータ化しようとすると、膨大な時間や労力がかかってしまうでしょう。
そこで活用されているのが、OCR(Optical Character Recognition、光学文字認識)と呼ばれる技術です。OCRを使うと、画像データから文字を認識してテキストデータ(文字コード)に変換してくれます。元となる画像データは、紙の文書をイメージスキャナーで取り込んだものを使うのが一般的です。
OCRの用途は大きく分けると、書籍や論文などの「文書管理」と、帳票類などの「データ処理」に分かれます。多くの企業には紙で管理された文書や帳票が存在し、管理上の課題を感じている方も多いでしょう。そのため、OCR技術を導入する企業は増えています。OCR技術を導入するためには、専用のOCRソフトをパソコンにインストールして使いましょう。
OCRが文字認識を行う仕組み
文字認識をOCRにより行うための3ステップを、ひとつずつ順にご解説します。
ステップ1:画像の中にある文字データの場所を特定する
画像の中には図形やデザインなどの、文字データではないものも含まれています。そういった場所から文字認識をOCRにより試みても、意味がありません。そのため、まずは画像の中で文字データが存在する場所を特定し、文字認識する領域を決めます。
ただし、文字認識に用いるOCRソフトによっては文字データの場所の特定を行わないものもあります。このようなソフトでは、読み取り位置や項目の定義が事前に必要です。とはいえ最近のOCRソフトの多くは、場所の自動特定機能をサポートしています。
1文字ずつ種類を判別し、文字コードに変換する
特定した文字データ領域から1文字ずつチェックして、どの文字なのか判別します。判別には「機械学習アルゴリズム」を使うのが一般的です。
まず、あらかじめ想定されるすべての文字パターン(形状)をシステムに一通り学習させておきます。そして、読み取った文字をそれらのパターンと比較し、一致するものを探すという方法です。一致する文字パターンが見つかったら、そのパターンの該当する文字コードに置き換えます。
ステップ3:変換結果をテキストデータとして出力する
すべての文字データ領域に対して変換処理を実施したら、その結果をテキストデータとして出力します。出力形式は文字認識に用いるOCRソフトによってさまざまですが、基本的にはパソコンやスマートフォンで再利用可能です。ステップ1で文字データの場所を特定しているので、元の構成や順序をできる限り崩さない形で出力することもできます。
OCRを使うメリット・デメリット
ここでは、文字認識のためにOCRを使うことのメリット3つ、デメリット2つを順にご解説します。
メリット1:データの再利用がしやすい
OCRを使うことで、テキストデータを再利用できるようになるのが大きなメリットです。紙の文書やスキャナーで取り込んだ画像データでは、文章や帳票といったデータを他の目的には使えません。しかしOCRによってテキストデータに変換されていれば、文章の一部を加工したり、帳票をデータ分析に使ったりすることも可能です。
メリット2:ペーパーレス化してコンパクトに管理できる
紙の文書では枚数が増えると、どうしてもかさばってしまいますよね。それに、種類ごとにファイリングしたり、時系列に沿って順序を整理したりといった必要が生じ、管理には手間がかかります。しかも機密情報の漏洩を防ぐために、紙の文書管理には細心の注意を払わなければなりません。
そこで、OCRを使うのが効果的です。OCRを使うと手書きの文書でも電子データ化できるため、紙で文書管理する必要がなくなります。結果として、管理の手間やコストを削減できるでしょう。また、紙の文書管理と違って紛失や破損することがないため、管理リスクも減らせます。
メリット3:必要な情報が得やすくなる
紙の文書から情報を得るためには本棚などから取り出して、使い終わったら元の場所に戻す、という作業が毎回必要です。しかも、大量にある紙の中から必要な情報を探さなければなりません。これでは手間がかかりますし、使い勝手が悪いですよね。
一方OCRを使った場合、文書を電子データとしてネットワーク上で管理できます。ネットワーク上であれば検索や並び替えが容易に行えるため、必要な情報をすぐに見つけやすいでしょう。また、複数人が別のパソコン上から同時に、ひとつの文書を閲覧することも可能です。そのため、紙の文書よりも情報共有がしやすいといえます。
デメリット1:正しく文字が認識されない場合も
OCRの文字認識の精度は100%とは言えません。たとえば、数字の0(ゼロ)とアルファベットのO(オー)のように、形状がよく似た文字を正確に判別することは難しいでしょう。新聞や書籍のような活字体よりも、書き手によって癖が出る手書きの場合は特に、誤認識のリスクは高まります。
0(ゼロ)とO(オー)の間違いであれば、人間が読む分には問題ないかもしれません。しかし、Excelなどの表計算ソフトでデータ処理する際に数字と認識されなくなるなど、不都合はあり得ます。また、紙に汚れがあった場合「大」と「犬」のように、誤解を与えかねない変換となるケースもあります。
そのため、誤変換がないかOCRの出力結果を手作業でチェックする手間が発生するのがデメリットです。文字認識の精度は、OCRソフトで採用されている機械学習アルゴリズムの種類によって変わってきます。文字認識の精度についても意識しながらOCRソフトを選択するのがおすすめです。
デメリット2:導入コストがかかる
当然ではありますが、導入にはある程度のコストが必要です。安価な製品であれば5,000円前後ですが、多言語対応などの高機能な製品では30,000円を超えるものもあります。企業のニーズと価格を照らし合わせて、費用対効果が高くなる製品を選ぶと良いでしょう。
OCRに最近AIが導入されている理由
最近のOCRソフトには、AI(人工知能)技術を導入しているもの(AI-OCRソフト)が増えています。その理由は、従来文字認識に使われていたOCRソフトに比べてより高い性能を得られるためです。その分価格も高くなりますが、費用対効果の高さを考えると、AI-OCRソフトの導入も有力な選択肢でしょう。
AI技術を導入することで具体的に性能向上するポイントとしては、2つあります。まず、前述のとおり文字データの場所を自動的に特定してくれることです。この機能によって、OCR利用前に読み取り位置や項目を指定せずとも任意の文書フォーマットに対応できます。結果として、文字認識をOCRにより実施するまでの準備作業がなくなり、人件費削減につながるでしょう。
もう1つは、誤認識などの経験から自動学習して、認識精度を向上することです。この機能によって、認識が難しい手書きの文書でも誤認識を減らせるため、手作業でチェックする負担を軽減できます。
おすすめのAI-OCRソフト:DX-Suite
「DX-Suite」は、2019年にAI-OCR市場でトップシェアを獲得した、人気の高いAI-OCRソフトです。写真で取った書類など、どんな文書でも自動的に電子データ化します。しかも、電子データ化した文書を種類ごとに自動で仕分けしてくれるため、使い勝手の良さは抜群です。
また、データ管理にクラウドサーバーを利用するのが大きな特徴です。Web上のサーバーを使えるため、自社でサーバーを構築・運用・保守する手間やコストがかかりません。それに、スピーディーに導入できるのもメリットといえます。
価格はLite、Standard、Proの3種類のプランから選択する形となります。最も安いLiteで月額30,000円~と、価格はやや高めですが、その分品質が高いため多くの企業で導入されています。
OCRソフトをうまく活用するポイント
OCRソフトは他のシステムと連携させることで、より効果を高められます。特に「RPA」と連携させるのがおすすめです。RPA(Robotic Process Automation)とは、元々人間が手作業で行っていた決まった作業を、自動化するシステムを指します。
OCRによってテキストデータ化したものを、RPAによって仕分けたり、データ処理したりするといった使い方が一例です。実際のところ、「三菱UFJニコス株式会社」ではOCRによる帳票のデータ化とRPAによるチェック作業を組み合わせて導入しました。その結果、1ヶ月あたり約450時間もの業務削減に成功しています。OCRを組み合わせて使うことで、RPAで自動化する作業範囲をより拡大でき、業務効率化につながります。
さて、今回は文字認識で使われているOCRソフトについて、基本概念から活用方法までご紹介しました。ご紹介した内容について振り返りましょう。
- OCRとは、画像データから文字を認識してテキストデータ(文字コード)に変換する技術
- OCRが文字認識を行うための3ステップ
①画像の中にある文字データの場所を特定する
②1文字ずつ種類を判別し、文字コードに変換する
③変換結果をテキストデータとして出力する
- OCRを使うメリット
①データの再利用がしやすい
②ペーパーレス化してコンパクトに管理できる
③必要な情報が得やすくなる
- OCRを使うデメリット
①正しく文字が認識されない場合も
②導入コストがかかる
- OCRに最近AIが導入されている理由
①さまざまなフォーマットに自動で対応できる
②自動学習により認識精度を向上できる
- おすすめのAI-OCRソフト⇒DX-Suite
- OCRソフトをうまく活用するポイント⇒RPAと組み合わせて作業を自動化
このように、OCRを導入することで社内の文書管理を効率化でき、情報共有の促進にもつながります。とはいえ、OCRの導入にはコストもかかりますし、上手く活用できるか不安な方も多いですよね。
弊社ではこれらのOCRやRPAを導入するお手伝いを行っています。OCRやRPAを導入する企業も少しずつ増えているので、文書管理の無駄を減らして企業の利益を拡大したいとお考えの方は、まずお問い合わせください。