文字認識プログラマと作曲家、漫画家との共通点
どちらもアイデア勝負ということでは同じですが
漫画家に似ているところも多いです。
文字認識はアルゴリズムだけ考えていればいいように
思えますが、実は非常に泥臭い部分があります。
私は一人でやっているからとくにそうかもしれませんが。
いいOCRにするにはたくさんの原稿、文字に対応する必要が
あります。そのためには認識させて文字コードと文字パターンが
対になった文字DBを作成します。認識率が完成した文字種ですと
文字コードの間違いも少なくデータ作成も楽です。
ところが初期バージョンですとたくさんの誤認識があります。
数字のように文字が少なければまだいいですがカタカナからでも
このコード修正がたくさんの時間がかかります。
単純でだれでもできる仕事ですが。
こんなはずじゃと思います。
ですからこの部分も余力がある大手にOCR製品が多いのも
わかります。
漫画家も絵の背景等も力を入れたほうがいいものに仕上がります。
アシスタントの人もやっているんでしょう。
両方にも単純作業があるのが共通点かも。
あと出版社があってなりたつというのも。
OCR開発者のつぶやきでした。
| 固定リンク
| コメント (0)
| トラックバック (0)
最近のコメント