国勢調査の手書き数字の書き方は難しいですね。
10年に1回の大規模調査の年のようです。末尾が0の年。
調査票の1枚目の右上に数字の記入例があります。
書き方の注意点として
縦線1本
はねない。
すきまをあける。
上に突き抜ける
閉じる。
角をつける。
等です。
JIS X 9006-1979規格の
光学式文字認識のための手書き文字(数字)
のようです。
30年前の規格ですね。旧規格からだと思いますのでさらに
前のものだと思います。当時のOCRはこうしないと読めなかったのかも
しれません。
普段こういう書き方はしてないのでこの注意書きを意識すると
書きにくいと思います。
正確にこのように書くのは難しく余計誤認識が出やすくなるようです。
私は文字認識の開発をしているものとして、こう書かなくとも
郵便の封書やはがきの郵便番号を赤い枠に書きますが、
フリーに気にしないで自分が書きたいように書く文字を
認識できるものを作っています。
6万字で認識率99.5%以上が出ています。
他社もフリー手書きのOCRを作っていると思います。
私が対応している文字についてまとめています。
http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOtegakisuuji.htm
フリーの文字と、あと良く出てくる途切れ文字とつぶれ文字についても
できます。
「認識館帳票OCR 手書き数字、カタカナ、英数字版」製品版はこちらです。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- snipping tool(2024.04.09)
- パソコンメールをスマホで見れるんですね。(2024.04.04)
- Windows1台、1OSでいと思っていたのですが(2016.05.20)
- 自炊で本が泣いている。(2015.03.08)
- 認識館帳票OCR 手書き数字・版 PFUスキャナScanSnap(スキャンスナップ)に対応しました。(2013.10.21)
「文字認識」カテゴリの記事
- snipping tool(2024.04.09)
- パソコンレンタルすることになりました。(2024.03.26)
- 認識館帳票OCRに活字日本語認識が追加になりました。(2017.10.21)
- 認識館帳票OCR 手書きカタカナ認識良くなりました。(2017.07.24)
- 手書き数字認識エンジン(ライブラリ、dll)さらに良くなりました。(2017.07.21)
コメント