文字認識(ocr)手書き数字、カタカナ、英数字、活字日本語、英数字、数字のアルゴリズム
私が作った認識文字種です。
アルゴリズムは少し違ってきます。手書き数字が完成度が高くなってきましたが
それぞれ違う難しさがあります。数字だけが難しいというものではありません。
手書きは活字に比べて10倍ぐらい変化しますが、数字は文字切り出しが
簡単です。文字切り出しが一番難しいのは活字の英文です。カーニングや
続き文字が多くて、一文字に切り離すのが大変です。
その点日本語活字は楽ですね。手書きカタカナも難しいです。
ハとかル等の1文字分離文字がありますから。認識では手書き英数字が一番
難しいでしょうね。数字が混じると英字の一部と全く同じ文字になります。
日本語活字は第二水準が混じると、第一水準の文字の線が一つないとか
一つ多いとかの文字があり、似た文字が多くなり難しくなります。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- Windows1台、1OSでいと思っていたのですが(2016.05.20)
- 自炊で本が泣いている。(2015.03.08)
- 認識館帳票OCR 手書き数字・版 PFUスキャナScanSnap(スキャンスナップ)に対応しました。(2013.10.21)
- 手書き数字版窓の杜さんに掲載して頂きました。(2013.10.01)
- SEO設定のむずかしさ(2013.09.06)
「文字認識」カテゴリの記事
- 認識館帳票OCRに活字日本語認識が追加になりました。(2017.10.21)
- 認識館帳票OCR 手書きカタカナ認識良くなりました。(2017.07.24)
- 手書き数字認識エンジン(ライブラリ、dll)さらに良くなりました。(2017.07.21)
- 認識館 帳票OCR 複合機だけでできるようになり、身近になりました。(2017.06.30)
- ベクターさんに「OCRフリー」ソフトとして登録しています。(2017.06.21)
コメント