パソコンのファン
文字認識ソフトを開発していますとコンパイル、リンク、辞書作成、
テストと1日に何百回と実行することが多くパソコンを酷使します。
ファンが壊れたことがあります。
日本語は(JIS第1水準漢字2965文字+JIS第2水準漢字3390文字)、
合計6355文字+
平仮名、カタカナ、英字、数字、記号 とあります。
データ作成テストが開発の半分以上を占めます。
アルゴリズムを考えている時間が少ないかもしれません。
日本語第1水準までの認識は半年で作りました。英文の
古代アルファベットの認識をした経験が役に立ちました。
古代アルファベットは英語の原型アングロサクソン語に
使われていて蟹(M、W)のような手足が多い文字があったり竜の落とし子(F,I)
のように画数が多く漢字と似ています。
活版印刷が始まったころのチョーサーの「カンタベリー物語」の小説の本の
認識の仕事でした。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- Windows1台、1OSでいと思っていたのですが(2016.05.20)
- 自炊で本が泣いている。(2015.03.08)
- 認識館帳票OCR 手書き数字・版 PFUスキャナScanSnap(スキャンスナップ)に対応しました。(2013.10.21)
- 手書き数字版窓の杜さんに掲載して頂きました。(2013.10.01)
- SEO設定のむずかしさ(2013.09.06)
「文字認識」カテゴリの記事
- 認識館帳票OCRに活字日本語認識が追加になりました。(2017.10.21)
- 認識館帳票OCR 手書きカタカナ認識良くなりました。(2017.07.24)
- 手書き数字認識エンジン(ライブラリ、dll)さらに良くなりました。(2017.07.21)
- 認識館 帳票OCR 複合機だけでできるようになり、身近になりました。(2017.06.30)
- ベクターさんに「OCRフリー」ソフトとして登録しています。(2017.06.21)
コメント