« 2010年8月 | トップページ | 2010年10月 »

2010年9月

2010年9月30日 (木)

窓の杜さんに帳票OCRの掲載をしていただきました。

http://www.forest.impress.co.jp/docs/update/other/20100930.html
の3番目の
「認識館 帳票OCR 手書き数字、カタカナ、英数字版 (Lite)」v1.00
です。

メール版では1番目でした。
この説明で手書きの英数字に数字を含めていますが
プログラム(dll)は別になります。
数字は数字のみで認識したほうが良く、
英数字のdllで数字を認識するとO(オー)と0(ゼロ)等の
区別ができません。
タイトル通りです。

| | コメント (0) | トラックバック (0)

2010年9月27日 (月)

国勢調査の手書き数字の書き方は難しいですね。

10年に1回の大規模調査の年のようです。末尾が0の年。
調査票の1枚目の右上に数字の記入例があります。
書き方の注意点として

縦線1本
はねない。
すきまをあける。
上に突き抜ける
閉じる。
角をつける。
等です。
JIS X 9006-1979規格の
光学式文字認識のための手書き文字(数字)
のようです。
30年前の規格ですね。旧規格からだと思いますのでさらに
前のものだと思います。当時のOCRはこうしないと読めなかったのかも
しれません。

普段こういう書き方はしてないのでこの注意書きを意識すると
書きにくいと思います。
正確にこのように書くのは難しく余計誤認識が出やすくなるようです。

私は文字認識の開発をしているものとして、こう書かなくとも
郵便の封書やはがきの郵便番号を赤い枠に書きますが、
フリーに気にしないで自分が書きたいように書く文字を
認識できるものを作っています。
6万字で認識率99.5%以上が出ています。
他社もフリー手書きのOCRを作っていると思います。

私が対応している文字についてまとめています。
http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOtegakisuuji.htm
フリーの文字と、あと良く出てくる途切れ文字とつぶれ文字についても
できます。

「認識館帳票OCR 手書き数字、カタカナ、英数字版」製品版はこちらです。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

| | コメント (0) | トラックバック (0)

2010年9月23日 (木)

文字認識(OCR)

私は25年ほど文字認識に携わっていますがもっとも
優れていると思ったのはアメリカのTrueScanという製品でした。
PCマガジンという雑誌でOCR部門のexcellenceを貰っていました。
それを購入し性能調査しました。スキャナーはキャノン製と
PC-ATも日本で購入しました。合わせて150万ほどかかりました。
PCもUSから買えば良かったかもしれません。
性能は確かに優れていて間違いがほとんどありませんでした。
パフォーマンスもよく印象が強かったです。
この製品は古くから日本にも入っていたようです。パランテイアと言って
箱のようなものでした。
その認識性能を見て私も作ってみたいと思って文字認識を
やっています。

手書き数字はそのレベルになっていると思います。

認識館帳票OCR 手書き数字、カタカナ、英数字版 V1.0 Plusはこちらです。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

| | コメント (0) | トラックバック (0)

2010年9月20日 (月)

パソコンOCRのパイオニア

20数年前前の会社にいたころ広告も担当していたので
この言葉はコピーライターが考えたのか、私だったか
はっきり覚えていませんがパソコン雑誌の広告に
使ったのは私だと思います。

最近他社さんでこの言葉を使っているところもあるようですが。
パソコンOCRは20数年前からあったのでほんの少し違うかも。

今だったらパソコンOCRの老舗とでも。

| | コメント (0) | トラックバック (0)

NTT Mark Gerrard のお姉さんラグビー転向

MO'ONIA GERRARD ですがネットボールのスターのようですね。
http://www.ntt.com/rugby/focus/mark.html
似ています。
リオ五輪にセブンズが採用されたのでラグビーをして
オリンピックに出たいようです。
http://www.smh.com.au/rugby-union/union-news/net-loss-as-gerrard-sees-sevens-way-to-get-to-rio-20100917-15ga3.html

| | コメント (0) | トラックバック (0)

2010年9月18日 (土)

大畑大介1999年香港セブンズスコットランド戦の逆転独走トライ

大畑選手が世界に知られるようになった100m近い独走トライです。相手を全部抜いています。

| | コメント (0) | トラックバック (0)

2010年9月17日 (金)

2007年ラグビーワールドカップ日本-カナダ戦2

前はリンク

http://recab.cocolog-nifty.com/blog/2009/05/2007-627b.html

でしたので動画を貼ります。最後時間がない時に相手のdeliberate knockback から
ドラマが始まりました。副音声の解説者も感動した試合でした。

| | コメント (0) | トラックバック (0)

タイミングマーク 帳票OCRソフト

タイミングマークとは塗りつぶしの矩形を3点原稿の
隅に配置することにより角度の補正、回転を行います。
タイミングマークからの相対位置により枠の認識領域が
ずれることなく認識できます。

タイミングマーク使用しています

帳票OCRソフトの 「認識館帳票版 手書き数字、カタカナ、英数字」

性能ですがA4の数字500字ある帳票の場合、
認識処理時間は1.86秒です(3.10GHz)。スキャンに4秒ですから
スキャン、認識で5,6秒です。数字の認識速度は秒1000文字、認識率は99.5%以上です。
確認修正を含めて、1枚数分で済むと思います。

タイミングマークがなくともモノクロ既存罫線帳票もそのまま認識できるようになりました。
http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

で手書きのデータを効率よく入力できます。

お奨めはドロップアウトカラー有りですが、PFU ScanSnap jpgに対応しました。モノクロでよくなりましたから費用が少なくてすみます。

フリーに書いた手書き数字が認識率(99.4~99.5%以上)で速度秒1020文字(3.10GHz)で認識します。修正も少なく
*フリー 郵便番号のように書かれたもの。手本なしです。認識率が高く、高速ですから修正も少なくトータル入力時間が少なくてすみます。

タイミングマークと赤枠ドロップアウトを併用した方法も可能です。

認識率を寄りお求めの方に向いています。

ベクターにもフリーソフトとして登録しています。

http://www.vector.co.jp/soft/winnt/hardware/se486408.html

| | コメント (0) | トラックバック (0)

2010年9月15日 (水)

ロムー、1995年イングランド戦4トライのビデオ

南アフリカでのワールドカップ準決勝でした。 キース・クインが解説しています。解説の経験長い人ですが 感嘆しています。 クインはNZ TV ONE の解説者ですが、日本にもセブンズの とき来て、話したことがあります。NZではスカイがラグビーの 放送をするようになってクインの解説が聞けなくなったのは 残念です。ラグビーの解説は長くできるのに。

| | コメント (0) | トラックバック (0)

手書き数字 認識エンジン、帳票OCR

全て私(稲田五男)の独自開発です。大手のOEMではありません。

私のオフライン手書き文字認識(紙に書かれた文字をスキャン後認識)は多くの人が紙(帳票・伝票)に書いた原稿が対象です。オンライン認識ではありません。

 認識ライブラリとして
手書き 数字、英数字、カタカナ、 
活字  日本語、英数字、数字
dll5本用意しています。

認識館文字認識エンジン

http://www.geocities.jp/itsuoinada/HOR_index/Horabstract.htm

手書き数字は5万人が書いた手持ちの50万字プラスに対応し高い認識率です。全くの新規原稿ですと .5%以上が出ます。鉛筆にも対応し癖字、ペン種を吸収しています。

認識館 帳票OCR 手書き数字、カタカナ、英数字版 PLUS V1.0

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

手書き 数字、英数字、カタカナが認識でき
帳票(原稿)の任意の領域(枠)と文字種を設定し
大量に認識処理ができる帳票OCRも
作りました。

性能ですがA4の数字500字ある帳票の場合、
認識処理時間は1.86秒です(3.10GHz)。スキャンに4秒ですから
スキャン、認識で5,6秒です。数字の認識速度は秒1000文字、認識率は99.5%以上です。
確認修正を含めて、1枚数分で済むと思います。

| | コメント (0) | トラックバック (0)

2010年9月 9日 (木)

1960年代のAll Blacks 動画

youtubeの動画でラグビーに関するビデオを貼り付け手見たいと思います。 テストを兼ねて私が初めて見たころの映像です。 FWもバックスのように走っています。

| | コメント (0) | トラックバック (0)

« 2010年8月 | トップページ | 2010年10月 »