パソコン・インターネット

2016年5月20日 (金)

Windows1台、1OSでいと思っていたのですが

Windows10不安定ですね。
起動したとき、気に入りましたか?という
洞穴の写真が表示サレ、マウスが効かなくて
どうしようもありませんでした。
一応何とか起動しましたが、もう。
Windows7から変える気持ちなくて
1台、1OSでいと思っていたのですが
ちょっと目を離したすきに、強制的に
アップグレードしてしまいました。
開発マシーンなので、アップグレードにかかる時間が
もったないですから。
Windows10はまだ安定してないので、様子を見たほうがいいと思います。
 
training.に時間をかけすぎ日本
コーリー・ジェーンが日本にくるようですが
4人の子供がいるので、働かないといけませんが
その記事に
where the players typically spend more time training
という記述があります。
練習好き過ぎですね
ジェーンはうまいので日本で活躍すると思います。
どのチームかはわかりません。
ラグビーワールドカップ日本大会のホスト、キャンプロゴマークが決まったようです。

一番下の開催都市熊本ってかっこいいですね。
背景ははなだ(縹)色(薄いあい色。)だそうです。
 

| | コメント (0) | トラックバック (0)

2015年3月 8日 (日)

自炊で本が泣いている。

自炊、本を切り刻んでスキャナーでスキャンしやすくして
OCRで文字認識してデータ化するというものですが
その本の残骸は捨てるしかないでしょうね。
本は手にとって読みたいということもあると思います。

これを解消するスキャナーが販売されています。
ScanSnap SV600
http://scansnap.fujitsu.com/jp/product/sv600/
今年2月、あるフェアで展示してましたので
デモを見て説明を聞きました。
卓上スタンドのように上からスキャンします。
本を抑えて、ページめくりは必要ですが
スキャナーの性能はいいようです。

PFUはスキャナーメーカーですが
本は残したいという要望が多く、それで
開発された製品のようです。
ラグビーアナウンサーの住田 洋 さんの
ブログを見て思いました。

http://ameblo.jp/sumi-kun/entry-11998640346.html

私はOCRソフトメーカーですが
データ化もできて、本も残る方法がいいと
思います。
まだベータ版ですが日本語活字も良くなって来ています。
http://iinada.la.coocan.jp/JEHOR_index/BETANEWJEHOR_index.htm

久しぶりにソフト関係の記事ですね。

ブログ村ラグビーに参加しています。

| | コメント (0) | トラックバック (0)

2013年10月21日 (月)

認識館帳票OCR 手書き数字・版 PFUスキャナScanSnap(スキャンスナップ)に対応しました。

ォルダに読みためたjpgファイルを認識処理できます。ScanSnapはドキュメントスキャナですからドロップアウトカラー機能がありませんが文字記入枠を点線で作成しモノクロ印刷し、記入した帳票をスキャンします。

点線枠を消去して認識します。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOscansnapsyoriDOT.html

ドロップアウトのための赤等カラー印刷・コピーはモノクロに比べて費用がかさみますが、その点でも節約できます。ScanSnapでなくても複合機など、モノクロの場合

同じ処理ができます。

認識館 帳票OCR 手書き数字、カタカナ、英数字版Plus V1.0 

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

ブログ村ラグビーに参加しています。

| | コメント (0) | トラックバック (0)

2013年10月 1日 (火)

手書き数字版窓の杜さんに掲載して頂きました。

ダイジェストニュース
http://www.forest.impress.co.jp/docs/digest/
下から2番目ですが、この掲載の意味は大きいのです。
動作確認して頂いてからの掲載になります。
ひとつホットしました。
あとひとつあります。

私のHPへのリンクになっていますので
アクセスが集中しています。

ブログ村ラグビーに参加しています。

| | コメント (0) | トラックバック (0)

2013年9月 6日 (金)

SEO設定のむずかしさ

ページタイトル、それから説明が
ネットで検索した時表示されます。
ここに興味を引くことが書けるかどうかが
アクセスしてみようと思われる分かれ目かもしれませんね。

私の場合今性能に自信があってアクセスを上げたいのですが
今までの設定が良くなかったようです。
ストレートに書くことにしました。やはりこのこと真剣に
考えるべきでした。

OCRソフト 認識館 新手書き数字版
認識率99.4~99.5%以上、秒1020文字(3.10GHz)の高速で認識します。
http://iinada.la.coocan.jp/NHPHOR_index/HandSUJI_index.htm

アクセス増えるでしょうか。

ブログ村ラグビーに参加しています。

| | コメント (0) | トラックバック (0)

2012年10月 9日 (火)

認識館帳票OCR 使用方法

HPからでないお客様には製品版Plus・問い合わせ先です。

価格7万4千円(税別)、手書き数字の認識率99.5%以上、モノクロ罫線対応で

複合機とこのソフトのみで可能になりました。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

HPからいらした方は見られたかもしれませんが、わからないところとしてまとめました。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOPluswakaranai.htm

そちらがわかりやすいと思います。

認識館帳票OCRのヘルプはhtmlになっています。

インストールしていただいた後に、windows7,10の全てのプログラム、アプリの

帳票OCRplusのところの真ん中のヘルプをクリックしてください。ヘルプにほとんど記述しています。

Ninhelp

モノクロの罫線既存帳票内に記入の文字も認識できるようになり、正式リリースしました。タイミングマークがなくともモノクロ印刷、コピー、スキャンで可能です。

検索からの方もありますので以下二つは重複するところもあります。

使い方の説明は、私が認識エンジンも全て自社開発して帳票OCRのメインプログムも作成しておりますので、わかりやすい説明までなかなか手がつけられないのが実情です。結果的に購入・非購入どちらでもお気軽にお問合せください。ご説明するのが一番の早道です。

パソコン雑誌の帳票OCRが掲載されました。

http://recab.cocolog-nifty.com/blog/2016/02/ocr-5ce2.html

帳票OCRは最初
帳票の理解
業務用スキャナ(ADF,ドロップアウトカラー)、ScanSnap、複合機も可能です。新しい言葉が多く、やや敷居が高いですがそれを過ぎますと入力が大幅に軽減されます。

私は未知のことでしたが。エクセルで作った帳票を印刷して使いますので
レーザープリンター(ふち有り印刷)とインクジェットプリンター(ふちなし印刷)による印刷のずれ、長さの違いがありそれが影響します。
ソフトをダウンロードしてヘルプの「帳票設定はお使いのプリンターに合わせる必要があります」を参照してください。
レーザープリンター(以下LP、ふち有り印刷)とインクジェットプリンター(IJP、ふちなし印刷)による印刷のずれがあります。ずれといいますか、LPはふちの余白(5ミリ)が
あり、その分ふちなしに比べて、縮小印刷されます。年賀状でよく目にしますが
A4の用紙でも同じのようです。5ミリは大きくて、スキャンは200DPIですから1ミリ8ドット、
5ミリですと40ドットのずれになります。

私の帳票OCRのサンプルの「書いて頂いての迅速認識性能テスト」はLPにより印刷した
帳票にしたがって、認識領域を設定しています。お客様のプリンターがIJPの場合、
あるいはメーカーが違うLPの場合、長さが長くなり、設定枠が短くなり、左側にずれる
場合があります。サンプルでは記入枠に対して認識枠を大きくして、その差を吸収できるようにしてはいます。40ドットもずれますと、、認識枠と記入枠がずれて、文字が欠けたりして、誤認識になることがあります。
設定枠はお客様のプリンターに合わして作成する必要があります。

認識館帳票OCRは業務用ソフトです。価格は7万円(消費税別)になります。
多くの人が書いた原稿を連続認識します。業務用スキャナをお使いください。(以下A、B)

帳票OCRは最初はわからない言葉が出てきます。ただ電話で説明しますとすぐ理解していただけます。一通り動かして、使用方法が難しいと思われる場合、購入前でも下記にお問い合わせください。
http://www.geocities.jp/itsuoinada/HOR_index/Horrerakusaki.htm

帳票は必ずプリントしてお使いください。コピーはタイミングマーク等がずれますので
避けてください。

使い方ですが、ヘルプを読んでいただきますと理解できると思います。

1 お客様の帳票作成
・タイミンマーク(以下TM スキャンするとき、蛇行しますので、1,2ミリずれます。3点のTMの関係でそのずれを吸収します。)。記入枠の周囲に空白がある場合TM無しでも可能です。
  \TM配置済み空帳票  のA4新再小TM縦 等を使っていただきますと
   すでに配置して、認識しやすい記入文字枠のセルの大きさに設定しています。
2 「ファイル」「設定用イメージ1枚スキャン」
  認識枠設定のため、記入枠がわかるようにドロップアウトカラー無し(モノクロ)でスキャンします。(c:\HORcyohyodenpyoに保存)
3 認識領域・文字種設定
・「ファイル」「設定用BMP・TIF等(ファイル)1枚読み込み」 で2のファイルを読み込みます。
 ここで読むのはTMを認識するためです。2でスキャンしても表示されますが、TMを
 認識していません。
・TM認識が必要なのは、A4縦ですと、左上のTM矩形の右下座標からの相対位置で
 認識枠を決めるからです。
・イメージファイルを読み込んで、今度は設定ダイアログを表示させます。
・それはマウス右クリックで「帳票用(認識領域、認識文字種)設定画面」をクリックします。
・そこで認識領域の左上と右下を指定し、認識文字種を指定により「領域、文字種追加」
ボタンで追加していきます。

4 3で作成した設定ファイルにより、記入原稿をスキャンし認識します。フォルダのファイルからも認識できます。

A) 業務用スキャナーにも種類があります。

キヤノンはDRシリーズになります。
Canon DR-C130
http://cweb.canon.jp/imageformula/lineup/c130/index.html

ScanSnapはPFUというメーカーの製品ですが
手書き帳票の入力にはfiシリーズという業務用スキャナーの
製品があります。
http://www.pfu.fujitsu.com/direct/scanner/
右側です。

用途と機能が違います。
業務にお使いの帳票は、ADF、赤色ドロップアウトカラー機能が
向いています。それはfiシリーズのジャンルです。ドロップアウトカラー機能がなくとも、点線枠で使うことができます。

業務用スキャナーは普通の家電量販店には置いてなく
普段目に触れる機会は少ないかと思います。

B) ScanSnapを点線枠で使用して帳票OCRに使うことができます。
  複合機も似た機種もあります。

http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOscansnapsyoriDOT.html

C) 実は帳票OCRで使うことが多いのは複合機のスキャナ機能かもしれません。
 A)、B)両方の場合があります。

ベクターさんニフリーで登録しました。
2領域です。仕事には使えません。
http://www.vector.co.jp/soft/winnt/hardware/se486408.html

| | コメント (0) | トラックバック (0)

2012年4月 6日 (金)

ブログのカレンダーに前月、次月を追加しました。

私のブログのカレンダー(ココログ標準)は今まで前月(<<)、次月(>>)に
移動ができなかったのですが、追加しました。
合わせて日付の上にマウスを置くとその日のタイトルも表示されるようになりました。
これで読みやすくなったと思います。

このブログパーツは風柳亭さんのココログカレンダーPlus
http://furyu.tea-nifty.com/annex/2008/01/plus_aa88.html
というスクリプトを使用しました。

ブログ村ラグビーに参加しています。

| | コメント (0) | トラックバック (0)

2012年2月29日 (水)

訳しマウスとGoogleマウスオーバー両方使用しています。

意味のわからない単語にマウスカーソルを置くだけで訳してくれるマウスオーバー 機能を使った「訳しマウス」を7,8年使っていますが、起動とワンタッチ翻訳のオンオフが ややめんどうでした。onにしていると候補の空表示で見にくいということもありました。 Googleも似たような「Googleマウスオーバー」を使用できるのですね。 両方onにしてみました。 Mouseover 口語や新語が多いので辞書の豊富さも必要です。

| | コメント (0) | トラックバック (0)

2011年7月21日 (木)

OCR フリー としてベクターさんに登録しています。

10領域までフリーとして認識できます。
認識館帳票OCR 手書き数字、カタカナ、英数字版(Lite)版
http://www.vector.co.jp/soft/winnt/hardware/se486408.html

手書き数字は高認識率です。
帳票OCRは多くの人が書いた原稿を連続スキャンし、一括認識してcsvファイルとして
出力します。

認識性能を実際に試して頂くためにOCRフリーソフトとして頒布しています。
フリー版も高性能ですが、製品版はさらに性能が上がり、機能豊富になっています。業務用ソフトとして病院、法人等に納入しています。カスタマイズも可能です。

製品版の認識館帳票OCR はお客様の確認のため5領域はフリーです。手書きの数字、カナ、英数字大文字、活字英数字、その他(ドットプリンター)の帳票を連続認識ができます。フル機能の1500領域は有料で販売しています。モノクロ罫線認識の性能が上がり、複合機とこのソフトのみで
可能になりました。認識率は99.5%以上、 99.9%以上でているものがあります。また高速です。
http://iinada.la.coocan.jp/CHPHOR_index/CYOHYOHOR_index.htm

| | コメント (0) | トラックバック (0)

2011年1月 6日 (木)

文字認識プログラマと作曲家、漫画家との共通点

どちらもアイデア勝負ということでは同じですが
漫画家に似ているところも多いです。
文字認識はアルゴリズムだけ考えていればいいように
思えますが、実は非常に泥臭い部分があります。
私は一人でやっているからとくにそうかもしれませんが。
いいOCRにするにはたくさんの原稿、文字に対応する必要が
あります。そのためには認識させて文字コードと文字パターンが
対になった文字DBを作成します。認識率が完成した文字種ですと
文字コードの間違いも少なくデータ作成も楽です。
ところが初期バージョンですとたくさんの誤認識があります。
数字のように文字が少なければまだいいですがカタカナからでも
このコード修正がたくさんの時間がかかります。
単純でだれでもできる仕事ですが。
こんなはずじゃと思います。
ですからこの部分も余力がある大手にOCR製品が多いのも
わかります。
漫画家も絵の背景等も力を入れたほうがいいものに仕上がります。
アシスタントの人もやっているんでしょう。
両方にも単純作業があるのが共通点かも。
あと出版社があってなりたつというのも。

OCR開発者のつぶやきでした。

| | コメント (0) | トラックバック (0)

より以前の記事一覧