« 文字認識(OCR) | トップページ | 窓の杜さんに帳票OCRの掲載をしていただきました。 »

2010年9月27日 (月)

国勢調査の手書き数字の書き方は難しいですね。

10年に1回の大規模調査の年のようです。末尾が0の年。
調査票の1枚目の右上に数字の記入例があります。
書き方の注意点として

縦線1本
はねない。
すきまをあける。
上に突き抜ける
閉じる。
角をつける。
等です。
JIS X 9006-1979規格の
光学式文字認識のための手書き文字(数字)
のようです。
30年前の規格ですね。旧規格からだと思いますのでさらに
前のものだと思います。当時のOCRはこうしないと読めなかったのかも
しれません。

普段こういう書き方はしてないのでこの注意書きを意識すると
書きにくいと思います。
正確にこのように書くのは難しく余計誤認識が出やすくなるようです。

私は文字認識の開発をしているものとして、こう書かなくとも
郵便の封書やはがきの郵便番号を赤い枠に書きますが、
フリーに気にしないで自分が書きたいように書く文字を
認識できるものを作っています。
6万字で認識率99.5%以上が出ています。
他社もフリー手書きのOCRを作っていると思います。

私が対応している文字についてまとめています。
http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOtegakisuuji.htm
フリーの文字と、あと良く出てくる途切れ文字とつぶれ文字についても
できます。

「認識館帳票OCR 手書き数字、カタカナ、英数字版」製品版はこちらです。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

|

« 文字認識(OCR) | トップページ | 窓の杜さんに帳票OCRの掲載をしていただきました。 »

パソコン・インターネット」カテゴリの記事

文字認識」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: 国勢調査の手書き数字の書き方は難しいですね。:

« 文字認識(OCR) | トップページ | 窓の杜さんに帳票OCRの掲載をしていただきました。 »