文字認識時、縦方向にずれて正しく読み取れない

文字認識時、位置合わせに失敗して、縦方向にずれて正しく読み取れないことがあります。
帳票により、ずれが発生したりしなかったりします。
事象と原因、及び回避策をまとめました。

事象と原因

以下の帳票(A4縦)をテンプレートに利用したとします。

以下の帳票を文字認識すると、縦方向にずれます。

こんな風にずれてしまいました。

文字認識時、AI JIMYはテンプレートと帳票の位置ずれ、スキャン時の歪みなどを補正します。
その際、「似ている個所」を基準にします。
この2枚の帳票では、帳票のヘッダ部よりも朱色で囲った部分が「より一層」同じ“絵柄”と認識して、
その場所を基準に位置補正を行ったため、縦方向にずれてしまいました。

たまたま同じ並びで書かれた内容が、“絵柄”として位置合わせの基準に採用されてしまった事例です。

対策方法

位置補正のより強い基準を示すために、帳票の左上にロゴを入れる、
表の中身の並びが合致しそうにないテンプレートを用意するなどして、回避することが出来ます。

方法1-ロゴ付き帳票の例

左上に目立つロゴがあると、それを基準に補正を行おうとします。

方法2-並びが合致しそうにないテンプレートの例

実際には存在しない商品名(下記の場合であれば「東京銘菓」)を埋めた帳票をテンプレートに使うことで、誤った位置合わせを回避します。

関連する記事