文字認識(ocr)手書き数字、カタカナ、英数字、活字日本語、英数字、数字のアルゴリズム
私が作った認識文字種です。
アルゴリズムは少し違ってきます。手書き数字が完成度が高くなってきましたが
それぞれ違う難しさがあります。数字だけが難しいというものではありません。
手書きは活字に比べて10倍ぐらい変化しますが、数字は文字切り出しが
簡単です。文字切り出しが一番難しいのは活字の英文です。カーニングや
続き文字が多くて、一文字に切り離すのが大変です。
その点日本語活字は楽ですね。手書きカタカナも難しいです。
ハとかル等の1文字分離文字がありますから。認識では手書き英数字が一番
難しいでしょうね。数字が混じると英字の一部と全く同じ文字になります。
日本語活字は第二水準が混じると、第一水準の文字の線が一つないとか
一つ多いとかの文字があり、似た文字が多くなり難しくなります。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- snipping tool(2024.04.09)
- パソコンメールをスマホで見れるんですね。(2024.04.04)
- Windows1台、1OSでいと思っていたのですが(2016.05.20)
- 自炊で本が泣いている。(2015.03.08)
- 認識館帳票OCR 手書き数字・版 PFUスキャナScanSnap(スキャンスナップ)に対応しました。(2013.10.21)
「文字認識」カテゴリの記事
- snipping tool(2024.04.09)
- パソコンレンタルすることになりました。(2024.03.26)
- 認識館帳票OCRに活字日本語認識が追加になりました。(2017.10.21)
- 認識館帳票OCR 手書きカタカナ認識良くなりました。(2017.07.24)
- 手書き数字認識エンジン(ライブラリ、dll)さらに良くなりました。(2017.07.21)
コメント