文字認識時、位置合わせに失敗して、縦方向にずれて正しく読み取れないことがあります。
帳票により、ずれが発生したりしなかったりします。
事象と原因、及び回避策をまとめました。
事象と原因
以下の帳票(A4縦)をテンプレートに利用したとします。
以下の帳票を文字認識すると、縦方向にずれます。
こんな風にずれてしまいました。
文字認識時、AI JIMYはテンプレートと帳票の位置ずれ、スキャン時の歪みなどを補正します。
その際、「似ている個所」を基準にします。
この2枚の帳票では、帳票のヘッダ部よりも朱色で囲った部分が「より一層」同じ“絵柄”と認識して、
その場所を基準に位置補正を行ったため、縦方向にずれてしまいました。
たまたま同じ並びで書かれた内容が、“絵柄”として位置合わせの基準に採用されてしまった事例です。
対策方法
位置補正のより強い基準を示すために、帳票の左上にロゴを入れる、
表の中身の並びが合致しそうにないテンプレートを用意するなどして、回避することが出来ます。
方法1-ロゴ付き帳票の例
左上に目立つロゴがあると、それを基準に補正を行おうとします。
方法2-並びが合致しそうにないテンプレートの例
実際には存在しない商品名(下記の場合であれば「東京銘菓」)を埋めた帳票をテンプレートに使うことで、誤った位置合わせを回避します。