« Kevin Schuler | トップページ | Colin Meads - All Black »

2009年4月15日 (水)

パソコンのファン

文字認識ソフトを開発していますとコンパイル、リンク、辞書作成、
テストと1日に何百回と実行することが多くパソコンを酷使します。
ファンが壊れたことがあります。

日本語は(JIS第1水準漢字2965文字+JIS第2水準漢字3390文字)、
合計6355文字+
平仮名、カタカナ、英字、数字、記号 とあります。
データ作成テストが開発の半分以上を占めます。
アルゴリズムを考えている時間が少ないかもしれません。

日本語第1水準までの認識は半年で作りました。英文の
古代アルファベットの認識をした経験が役に立ちました。
古代アルファベットは英語の原型アングロサクソン語に
使われていて蟹(M、W)のような手足が多い文字があったり竜の落とし子(F,I)
のように画数が多く漢字と似ています。

活版印刷が始まったころのチョーサーの「カンタベリー物語」の小説の本の
認識の仕事でした。

|

« Kevin Schuler | トップページ | Colin Meads - All Black »

パソコン・インターネット」カテゴリの記事

文字認識」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: パソコンのファン:

« Kevin Schuler | トップページ | Colin Meads - All Black »