NI+C EDIシリーズ<第9弾>OCRを使ってみた ~FAX・BPOサービス~
投稿者:梅田
こんにちは。
バリューオペレーション本部EDIサービス部第1グループの梅田です。
日頃企業間の受発注に関するソリューションセールスに携わっています。
これまでの弊社のブログではEDIについてテクニカル(システム)的なお話しをしてきましたが、
今回は私の経験的なブログを書きたいと思います。
日々お客様へEDIをご提案していますが、『FAX受注を効率化する別の考え方はないかな?』
と聞かれることが多くなってきました。
弊社のサービスでFAX帳票をテキスト化し、後続へつながる仕組みを提供しているお客様がおり、その機能を理解するために実際に帳票をOCRに連携してテキスト化してみました。
今回はその感想や素人目線ですが私なりのFAX受注の考慮点をお伝えします。
■テスト環境イメージ(以下のFAX-OCR④で色々と読み込ませてみました。)
結果:認識率100%はありえない
まずはいきなりすでが、認識率の100%はありません。ただし、この頃のOCRは修正を施すとAI学習していくので、非常に認識精度も高くなっていきます。
しかし、実際に読み込んでみると以下のようなことが見えてきました。
●読取込み範囲に注意が必要
例:記入欄からはみ出ている
「陸」は読めませんでした
例:罫線と数字が重なっている
「7」を「1」と読み待ち違えましたが、「5」と「6」は重なっていても特徴が捉えやすいので読めました。
FAX特有のノイズやかすれ、歪みが発生し、読取精度が落ちる
送信元のFAX機器の状態によるのかもしれませんが、帳票が汚れてしまっているケースも多かったです。
OCR側でノイズを除去して読取ってくれますが、間違える確率は上がります。
●数字の「1」が罫線と判断されて読み飛ばされてしまう
OCRには罫線や二重線での訂正を読み飛ばす機能があり、非常に役に立つのですが、
数字の「1」はまっすぐ直線(こんな感じ「|」)に記入されていると、読み飛ばされてしまいました。
同じような書き方をしてあっても正しく認識できるものもたくさんあったのですが、たまにこのようなケースも発生するようです。
こうなった場合は、OCRの読取定義(OCRで読取る項目を決める設定)を微修正する必要があり少し大変です。
⇓認識結果
結論:読取は完璧ではない
しかし、業務には使えそう、、、9割を読めるなら入力作業が9割不要になる!
認識率にこだわってしまうと、精度向上のために読取定義の(範囲)修正を何度も繰り返す必要があるため、多くの時間を費やすことになり導入効果が得られなくなってしまいます。OCRを利用する目的はデジタルデータに変換することではなく、業務効率化やコスト削減することだと思いますので、
OCRを利用する際は、人による確認作業は必ず必要になるという前提で、認識率だけにこだわらず、便利なところを利用することが良いと感じました。
ただし、OCRの誤認識を明確にする必要はありそうです。
弊社のお客様の例では
〇お客様の注文品番(OCRで読取った結果)を社内品番と引き当てる
〇お客様住所はマスタに登録しておいて、電話番号と引き当てる
〇一度の納入数量は、上限を決めたり、製品に合わせた納入単位での倍数であるかをチェックする
〇納品日も納品場所と出荷場所で事前に時間を決めておいてチェックする
など、認識誤りの可能性がある項目を機械的に見つけだし、後続処理ですぐに気づけるようにしています。
やはり、入力の手間がなくなるのは全体工数の削減には効果的です。
また、OCRで読取りやすい帳票レイアウトに変更したり、帳票を統一化させたりと、認識率向上に向け取引先と調整することも、業務効率化には必要なことです。
このコロナ禍においても、リモートでの結果確認だけで社内の受注工程が進むのは、コロナ後のニュ―ノーマルをふまえてもいいですよね。
今回は提案している私が自分で使ってみた感想を紹介させていただきましたが、EDIやFAX業務の効率化については、日本情報通信にお問い合わせください。