HOME > ソフトウェア > OCR de PawS


製品特徴 2022/03/22 Update

概要

「OCR de PawS」は、PaaS(Platform as a Service)と呼ばれているクラウドサービスを利用し、画像からテキストを検出し翻訳から音声読み上げまでを自動的に行うUWPアプリです。 (OCRと翻訳、音声読み上げ機能は、独立及び手動でも利用可能)

最も特徴的な機能は、ユーザー自身のPaaSサービス認証情報を使用し、複数のサービスを切り替えて利用できるマルチクラウドに対応していることです。 ユーザー自身のサービス情報を使用することで、無駄なコストを抑えながら、利用するデータのプライバシーにも配慮できます。
これは、SaaS(Software as a Service)やアプリ提供者のアカウントに属するリソースを経由せず、直接ユーザー自身のPaaSリソースを使用できるためです。
また、マルチクラウドに対応することで、サービス毎の機能に合わせて使い分けたり、障害に強い環境を得ることが可能になります。

ユーザー・フレンドリーな操作と、多種のデバイス(タブレット、ラップトップ、デスクトップ等)を利用するPCユーザー向けに機能やUIをデザインしています。

動画、ゲーム、電子書籍、カメラ撮影画像、名刺、絵本、マンガ、書類、バーコード等のテキストを含むデジタルやアナログ媒体を活用できます。
スマートフォンなどのカメラで撮影した画像を、まとめてOCR検出できます。(複数ファイル指定可能)







paws 01
paws 02
paws 03
paws 04
paws 05
paws 06
アプリのターゲット層
    このアプリのターゲット層は、次の様なエクスペリエンスを求めているユーザーです。
  • PCならではの機能(遅延の少ないデータ管理や操作性)
  • マルチクラウドサービス(Multiple Cloud Service)を利用した最新のOCRと翻訳サービス
  • ユーザー自身で行う毎月のコスト管理(不要なコストの低減)
  • データのプライバシー保護(SaaSなどよりも安全)
  • 作業の履歴を管理し、データを再利用
  • 外付けのバーコード・スキャナーによるバーコード読み取り

利用できるサービスと機能

OCR機能

  • Microsoft Azure (PaaS - Read API及びOCR APIに対応)
  • Google Cloud Platform (PaaS - APIキー及びサービスアカウント認証に対応)
  • In-App 標準OCR(オフラインで利用できるOCR)
    処理速度は非常に高速。AIをサポートしていないレガシーなアルゴリズムのため、PaaSサービスより認識精度は低い。

翻訳機能

  • Microsoft Azure (PaaS)
  • Google Cloud Platform (PaaS - APIキー及びサービスアカウント認証、V2, V3, AutoMLに対応)
  • ユーザー自身が開発した翻訳WEBサイト等(クラウドサービスのプロバイダーがREST APIを提供している場合等)


各種サービスのサポート言語や制限事項に関しては次のページを参考にして下さい。





バーコード読取り機能

  • 画像ファイルやクリップボードからの読取り機能(複数ファイルの一括読取り可能)
  • カメラによる読取り機能
  • 外付けのバーコード・スキャナーによる読取り機能(様々なインターフェースに対応)
  • 読み取ったバーコードデータのイベント機能(WEB閲覧、メール送信、マップ表示、WiFi接続(ステルス対応)など)





機能

主な機能

  • OCRサービス(PaaS及びオフラインでの利用)
  • 翻訳サービス(PaaS及びユーザー自身で開発したWEBサイト)
  • OCR及び翻訳作業の履歴管理機能(管理データのフィルタリングやエクスポート機能に対応)
  • オフラインでの音声読み上げ(OCRで検出したテキストの翻訳結果を自動で読み上げることも可能)
  • 画像編集(トリミング、モザイクや塗りつぶし等)
  • 画面キャプチャ
  • カメラ撮影
  • クリップボードの監視機能(非アクティブ状態での検出に対応)
  • 複数ファイルを指定した一括OCR検出(OCRサービス毎に制限有、 内容は次を参照。AzureGCP
  • OCR Append Mode(複数画像に含まれるテキストを連結しながら検出)
  • OCR 自動リサイズ(サイズが小さい画像は、OCR実行時に自動的に拡大)
  • OCR検出テキストの自動整形機能(機能のON/OFF切り替え可能)
  • OCR検出回数や翻訳済み文字数のカウント及び閾値管理(PaaS直接管理時の目安)
  • アプリ内購入(AzureやGCPのOCR及び翻訳サービスを利用可能)
  • カメラや外付けのバーコード・スキャナーによるバーコード読取り機能

動作環境
対応OS Microsoft(R) Windows(R) 10 May 2019 Update(1903)以降 x86/x64
ARM64に関しては調整中。

※動作保証をしていないOSに関しては、サポート対象外
ローカライズ 日本語、英語(U.S)に対応。
対応デバイス Windows 10 Desktopが動作するPC, ノートPC, タブレット, その他
CPU Atom x5-Z8350 1.44GHz以上推奨
メモリー 4GB以上推奨
解像度 Full HD以上推奨(4Kまたは、デュアルディスプレイ)
必要なデバイスと注意点 インターネット回線(PaaSサービスやWEB表示、メール送信時)
カメラ撮影画像のOCR検出時は、高解像度のカメラ程、認識精度が向上します。

カメラによるバーコード読み取りの場合。WEB会議等に利用する外付けのWEBカメラの多くは、バーコードの読取りには適していません。 内蔵カメラがあるデバイスで、特にリアカメラを搭載するタブレット等が最適です。

外付けのバーコード・スキャナーによる読取りの場合、次のインターフェースが利用できます。
USB接続: HIDキーボード、仮想COM(シリアル通信)、HID-POS
Bluetooth接続: HIDキーボード、SPP(シリアル通信)
動作確認に利用したデバイス Windows 10 Desktop: ドスパラ Diginnosタブレット DG-D09IW2SL(Intel Atom x5-Z8350 1.44GHz)
Windows 10 Desktop: Acer Aspire E5-575 ノートPC(Intel Core i5 7200U 2.5GHz)
Windows 10 Desktop: 自作デスクトップPC(Intel Core i7 7700K 4.2GHz)
Windows 10 Desktop: Surface Pro X(x86エミュレータ―上) ※ARM64での動作は調整中
Windows Mixed Reality: Lenovo Explorer with Motion Controllers G0A20002JP (GPU: GTX 1060 6GB)

その他、仮想PC上でも動作確認を行っています。

バーコード・スキャナー
Honeywell 1902hHD, 1902SR
Tera Model-1100, NW-7
ライセンス(license)について

ライセンス

  • OCR de PawSは有料のMicrosoft soreアプリです。また、Microsoft storeアプリの規約に準拠しています。
    試用期間中(30日間)は、利用制限無しに無償で利用できます。


    PaaSプロバイダー毎に、各サービスに関する制限事項の定義は異なっています。
    また、契約する価格プランによっては、SLA(Service Level Agreement)が提供または保証されていない場合があります。 詳細については、各プロバイダーが表記しているSLAを確認して下さい。

    本アプリの使用にあたっては、上記及びアプリ内制限の範囲内で利用して下さい。

ライセンスのご購入

  • 1ライセンス価格:980円(税込み)
    ご購入時のアカウントでログインしたデバイスであれば、最大10台までインストールが可能です。
  • ご購入及びダウンロードは、Microsoft storeでお求めください。
  • ライセンスの購入は、著作権放棄を意味するものではありません。著作権は全てSymmetry Soft(シンメトリー・ソフト)に帰属します。

ライセンス認証

  • Microsoft storeでご購入後、自動的にライセンス認証が完了します。
    (ライセンスキーなどの発行を待つ必要はありません)

サポートの範囲

  • PaaSを含むクラウドサービス側の手続きや設定に関するサポートは行っていません。サービス提供のプロバイダーへ直接お問い合わせ下さい。
    また、プロバイダーが提示する制限(不明記な制限も含む)を超えた利用でのサポートも行いません。 制限を超えて利用を行った場合、プロバイダー側でリソースをロックされる可能性があるので注意して下さい。
    PaaSを含むクラウドサービスに関する基本的な知識を有する前提で、利用して下さい。

    本アプリの操作やバグ、フィードバック(feedback)に関しては随時受け付けていますので、サポート経由でご連絡下さい。
アプリ内購入について

概要

  • PaaSの知識が無い方でも、AzureやGCPが提供している高品質なクラウド型OCR及び翻訳サービスを利用できます。
    商品毎に設定されている利用可能な数量を購入していただき、使用した数量分減算される消費型の商品となります。 無料で体験できる商品と有料商品をご利用いただけます。


    ユーザー登録などは不要で、PaaSサービスを手軽に体験していただくことを目的とした試験的な運用となります。 そのため、接続するエンドポイント(End point)は、複数ユーザーで共有されます。 同時に接続する人数が多くなると、レスポンスが遅くなる可能性が有ることをご承知下さい。

    なお、大量の画像や文字の処理を行う場合は、PaaSサービスをユーザー自身で直接管理できる機能の利用を推奨しています。 占有のエンドポイントで、コストを抑えながら快適にご利用いただくことが可能になります。

購入可能な商品

  • 無料体験商品価格:0円(税込み)
    OCRサービスと翻訳サービス毎に、一度のみ購入できます。
  • 有料商品価格:120円(税込み)
    OCRサービスと翻訳サービス毎に、何度でも購入できます。
  • 残数が残っている場合でも追加購入可能です。残数は累積されます。
  • 商品毎に設定している数量に関しては、変更される場合が有ります。
    そのため、最新の情報はアプリ内で確認して下さい。購入済みの商品の数量は、変更されません。

有効期限

  • ご購入していただいた商品には、有効期限を設けておりません。 Microsoftストア及びPaaSプロバーダーのサービスが継続する限り、いつでも使用可能です。
  • 消費した数量などは、Microsoft社により管理されています。 そのため、商品ご購入時に利用しているアカウントであれば、複数のデバイス間(Widows 10)で商品を同期してご利用いただけます。
  • アプリの体験有効期間内(30日)に購入した商品の数量を全て消費出来なかった場合は、アプリを購入後に再度ご利用いただけるようになります。

消費数のカウント

  • 処理が成功した場合に、各サービス毎に次の様に消費数がカウントされます。

    ・OCRサービス: 1画像につき1カウント減算。PDFファイルはページ単位で1カウント減算。
    ・翻訳サービス: 翻訳元となる文字数分減算されます。改行や空白文字もカウントされます。

    Azureの場合は、翻訳結果受信時に返却される実際に処理された翻訳対象文字数を参照しています。そのため、送信している文字数と異なる場合があります。
  • 複数ファイルを処理中にキャンセルまたは継続不可能なエラーが発生し中断された場合

    キャンセル時点で既に処理に成功した画像及び翻訳文字数に対してのみカウントされます。
    未処理の画像や文字に関してはカウントされません。
  • 処理中にエラーが発生した場合

    通常は、カウントされません。
    ただし、短時間に連続でエラー等を誘発させる行為を行った場合はカウントされる可能性があります。 また、サービス提供側から、一時的に一定期間処理を拒否される場合があるので注意して下さい。

購入方法

  • アプリのOCRサービス及び翻訳サービス管理ページ上で、ご購入いただけます。
  • ①アプリ内購入スイッチを有効にする。
    ②接続先のリージョン(エンドポイント)を設定する。(使用者の現在地に最も近い地域を選択する。)
     ※通常は、グローバルを選択すれば大丈夫です。回線が混雑する場合は、切り替えてみて下さい。
    ③商品を購入する。(初めて使用する場合は、無料商品を購入可能)
     ※購入手続き時(認証など)は、Microsoft社が運用管理している決済システムに切り替わります。

  • 購入後は、メインページで好みのサービスを選択しご利用ください。
  • 消費した残数は、メインページ下部に表示されるステータスバーで随時確認できます。
操作マニュアル

基本的な操作方法

直観的な操作で利用できるようにデザインしています。ほとんどの操作は、スマートフォンの操作ができる方であれば問題ないと思います。
PaaSなどの各種設定の概要や注意点、REST APIを利用した翻訳サイトの作成方法、基本的な操作方法などについては下記、基本操作マニュアルを参考にして下さい。

また、基本的な操作方法についてはアプリ内の各Tipsも参照して下さい。

基本操作マニュアル

OCRの認識精度や、基本的な操作を行っている動画等は次を参考にして下さい。

AIを利用したOCRの認識精度を検証

リリース情報

リリース履歴

2022.03.22: Version 2.14.0をリリース

機能改善

    ★OCR
  • 「In-App Standard OCR」で、アラビア語指定時に検出文字列を右から左へ読めるように対応


  • クリップボード監視エージェント起動時の待機時間を5秒から10秒へ延長
  • クリップボード監視処理中は、OCR検出画面表示中のみ検出を行うように変更
  •  

2022.01.06: Version 2.13.3をリリース

機能改善

    ★OCR
  • クリップボード監視機能の改善。(監視エージェントを.Net6プロセスに分離し、UWPアプリの非アクティブ状態での検出に対応)
    機能詳細について
  • AzureのRead API指定時に、最新のプレビュー版を指定できるように対応。(プレビュー版指定時は、追加された49言語を含む122言語の検出及び6言語の手書き文字に対応)
    サポート言語について
  •  
 
    ★その他
  • その他マイナーバグの対応及び改善。

2021.07.22: Version 2.12.7をリリース

機能改善

    ★OCR - 機能詳細について
  • バーコード画像(ファイル or クリップボード)の読取りに対応。
  • OCRオプションに、検出データ(OCR画像とバーコード画像)切り替え機能を追加。
  • バーコード画像読み取りデータのイベント機能を追加。(ブラウザ表示・検索、座標、メール送信、Wi-Fi接続など)
  •  
 
    ★バーコードスキャン - 機能詳細について
  • 外付けのバーコード・スキャナー機器から読み取れるように対応。(HID-POS、HIDキーボード、USB仮想COM、Bluetooth HIDキーボード、Bluetooth SPP)
  • QRコード読取りデータの振る舞いを改善。(Mail送信、座標表示、WiFi接続(ステルスモード対応)に対応)
  • CSVやコピー時の出力オプション機能を追加。(出力項目の指定可能)
  • 読取りデータが日本語の場合に、文字コードの自動判定機能を追加。(UTF-8指定時)
  • 読取り時のサウンド選択機能を追加。
  •  
 
    ★その他
  • 履歴管理ページに、バーコード画像の管理機能を追加。
  • WindowsのUIライブラリを、最新の2.6.1に更新。
  • 効果音の追加。
  • 一部ボタン内のアイコンカラーを、ユーザー設定値が反映されるように変更。
  • その他マイナーバグの対応及び改善。

2021.05.31: Version 2.11.5をリリース

機能改善

    ★アプリ内購入 - 機能詳細について
  • PaaSの知識が無い方でもAzureとGCPのOCR及び翻訳サービスを利用できます。
  • 無料体験できる商品を利用できます。
  •  
 
    ★バーコードスキャン - 機能詳細について
  • カメラを利用した読取りに対応。
  • QRコードや複数種類のバーコードに対応。
  • 読み取ったデータをまとめてCSV形式で出力可能。
  • QRコードは、UTF-8やShift-JISの文字データも読取り可能。
  •  
   
    ★カメラ - 機能詳細について
  • 画像方向の指定に対応。(通常、ミラー)
  • 最小化などによる、非アクティブ状態からの復帰処理を改善。
 
    ★クラウドサービス設定管理
  • OCRサービス:GCPの設定でエンドポイントの管理が可能になりまし。
  • 翻訳サービス:Azureの設定で、エンドポイントとリージョンの設定が可能になりました。
 
    ★その他
  • ページ遷移後にスクリーンショット機能の映像が表示されないケースの対応。
  • 通知メッセージ表示パネルのデザイン変更。
  • その他マイナーバグの対応及び改善。

2021.03.05: Version 2.10.7をリリース

機能改善

 
    ★OCR - 機能詳細について
  • OCR検出テキストの自動整形機能を改善。
    ※日本語の検出時は、Preview 1の利用を推奨します。(特に縦書きでルビを含む場合)
  • 自動整形スイッチ切り替え時に、検出テキストの再表示を行うように改善。
  •  
 
    ★カメラ - 機能詳細について
  • 画面を縦向きで撮影した場合の、撮影画像の向きを改善。
 
    ★その他
  • OCR検出テキストの音声読み上げを手動で選択した場合に、アプリ起動後に異なる音声が選択されるケースの対応。
  • その他マイナーバグの対応及び改善。

2021.02.26: Version 2.10.2をリリース

機能改善
 
    ★OCR
  • Azure Read APIのプレビュー版をV3.2 Preview 2に対応。(サポート言語が9言語から73言語に拡張)
    ※日本語の検出時は、Preview 1の利用を推奨します。(特に縦書きでルビを含む場合)
  • OCR検出テキストの自動整形機能を追加。
  • 右クリックによるコンテキストメニューの追加。
  • AzureでF0サービス選択時に、トランザクション回数を減少させる遅延時間設定機能を追加。
  • Moreコマンドパネルの表示制御を改善。
  •  
 
    ★カメラ - 機能詳細について
  • シャッターモードの切り替え機能を改善。(OCRダイレクト撮影、画像編集、ファイル保存を一つのボタンに統合)
  • 画面を縦向きにした場合の、シャッターボタンなどの位置を改善。
 
    ★その他
  • 履歴管理機能のサムネイルを右クリック時に、コンテキストメニューから削除できるように対応。
  • 設定ページのアプリ情報表示で、日本語の場合のリンク切れに対応。
  • PDFファイルのOCR検出実行後、手動で画像のOCR検出を行った場合に、テキスト表示が重複するケースの対応。
  • その他マイナーバグの対応及び改善。

2021.02.09: Version 2.8.7をリリース

機能改善
 
    ★画像編集 - 機能詳細について
  • ホームパネルから遷移時の画像表示の高速化。
  • オリジナル画像表示時に、一つ前の画像が表示されるケースの対応。
  • 編集履歴記録時の高速化及び遅延改善。
  •  
 
    ★カメラ
  • 特定のデバイスで、グリッド線がプレビュー範囲外に描画されるケースの対応。

2021.02.05: Version 2.8.5をリリース

機能改善
 
    ★画像編集 - 機能詳細について
  • 設定オプションに、OCR実行時の自動リサイズ設定機能を追加。(サービス毎に最小サイズを設定可能)
  • 手動による画像の拡大・縮小サイズを編集画像に適用する機能を追加。
  • スナップショット機能を追加。(編集中画像の任意の状態をファイルに保存可能)
  • オリジナル画像情報の表示機能。(情報の表示や編集中画像をオリジナル画像にオーバーライト可能)
  • 編集中画像のサイズ表示。  
  • ショートカットキーの改善。  
  • 編集機能へ遷移時の、画像描画速度の高速化。  
  •  
 
    ★カメラ
  • プレビュー時にグリッド線のオーバーレイ機能を追加。(線数を変更可能[2 - 16])
  • 静止画の解像度設定機能を追加。(変更できる解像度はデバイスに依存)
  • ファイルへ直接保存できる機能を追加。(通常のカメラとして利用可能)
 
    ★スクリーンショット
  • ショートカットキーの改善。
 
    ★OCR機能
  • OCR表示画像にズーム機能を追加。
  • AzureのRead API指定時に、最新のプレビュー版(v3.2 Preview)を利用できるスイッチ機能を追加。(日本語と簡体字中国語のサポートに対応)
  • 標準OCRサービス(オフライン)で、文字間の半角スペース除去機能を改善。
 
    ★翻訳サービス管理(WEBサイトを利用した翻訳の場合)
  • 翻訳テキストの入出力エリア設定項目の変更。(querySelector()の引数を指定できるように変更)
  • BingとGoogleサイトを利用した翻訳の場合、最新のクエリー情報をダウンロードできるように対応。
  • HTMLの解析機能を廃止。
 
    ★その他
  • ナビゲーション機能の改善。
  • メッセージ通知パネルに閉じるボタンを追加。
  • 履歴管理機能で、複数項目選択による編集時に利用サービス情報の利用言語表示を改善。
  • その他マイナーバグの対応及び改善。

2021.01.11: Version 2.7.1をリリース

機能改善
 
    画像編集 - 機能詳細について
  • 編集オプションに、画像の保存モード指定機能を追加。(未加工のオリジナル画像 or 加工後の画像を指定可能)
  • 編集画像として未加工のオリジナル画像の再読み込み機能を追加。
 
    スクリーンショットとカメラ
  • 各設定オプションに、キャプチャした画像をダイレクトにOCR検出できる設定スイッチを追加。(編集機能を経由せずに直接OCR検出画像に設定可能)

2020.11.05: Version 2.6.1をリリース

機能改善
 
  • 画像のぼかし処理(モザイク、塗りつぶし)で、画像範囲外を指定した場合に例外が発生するケースの対応

2020.11.03: Version 2.6.0をリリース

機能改善
 
    画像の編集
  • 不要な箇所のぼかし機能として、モザイクや塗りつぶし機能を追加(モザイク粒度の変更可能)
  • 画像のズーム機能を追加
  • Undo, Redo機能を追加(右クリック、ショートカットキー、タッチパネルで長押し)
 
    カメラ機能
  • シャッター位置の変更(配置位置を左右で選択可能)
  • ホワイトバランス機能の追加(カメラデバイスが対応している場合)
  • ズーム機能の追加(カメラデバイスが対応している場合)
  • タップでフォーカス機能の追加(カメラデバイスが対応している場合)
 
    その他
  • ターゲットバージョンを2004に変更(最小バージョンは1903で変更なし)
  • 画像ファイルのトリミング結果が検出画像に反映されないケースの修正
  • OCR検出時に、通常モードで複数ファイルを指定した場合は、自動履歴登録がOFFの場合でも自動的に履歴登録するように変更
  • マイナーバグの修正

2020.09.29: Version 2.1.0をリリース

機能改善
 
    画像の貼り付け
  • テキストボックスにフォーカスが有る場合でも、ショートカット(Ctrl+V)による画像貼り付けができるように改善
  • 画像とテキストフォーマットの両方を含むオブジェクトを無効にするように改善(OneNoteのテキストをコピーした場合等)
 
    その他
  • Window幅を狭くして使用した場合のサイズ記憶と復元の改善
  • 履歴項目のエクスポート機能に、出力項目として画像ファイル名とファイル保存先のルートパスを追加

2020.09.25: Version 2.0.1をリリース

機能改善
 
  • 音声読み上げ機能の追加
    1. OCR、翻訳、履歴管理機能で利用可能(オフラインでの読み上げが可能)
    2. OCRテキスト検出で自動翻訳が有効の場合は、自動音声読み上げを行うことが可能
    3. 早送り、巻き戻しや速度変更等に対応
  • その他
    1. 履歴管理の複数項目一括更新時に、利用したサービスの言語情報を設定できるように改善
    2. テキストボックス内のコマンドに、テキストのクリアコマンドを追加
    3. Windows幅を狭くした場合のレイアウト改善
    4. アペンドモードのテキスト編集時の不要なショートカットキー処理の改善
    5. OCRテキストの自動検出無効時に、手動検出ができなくなるケースの改善
    6. 最小ターゲットを1903に変更
    7. その他マイナーバグ修正

2020.07.24: Version 1.3.2をリリース

機能改善
 
  • OCR機能
    1. 複数ファイルの一括処理に対応(OCRサービス毎に制限有)
    2. 検出処理中のキャンセル処理を改善
    3. クラウド側からエラーを受信した場合の通知処理を改善
    4. AzureのRead API指定時に、新しく追加された検出言語に対応するよう改善(サポート言語
  • バグ修正
    1. 履歴ページなどからHomeページへ遷移時に、クラウド未設定の通知が表示れるケースの対応
    2. GCPのOCR検出処理でAppendモード指定時に、日本語以外の検出テキスト連結時に空白が付加されないケースの対応
    3. その他マイナーバグ修正

2020.06.26: Version 1.2.0をリリース

機能改善
 
  • OCR機能
    1. 翻訳ペインのレイアウト変更機能を追加
    2. GCPの検出タイプから自動を廃止
  • その他
    1. Tipsの説明文を改善

2020.06.19: Version 1.1.0をリリース

機能改善
 
  • OCR機能
    1. クリップボードの監視機能を追加(画像を監視し自動的に検出を行う)
    2. 標準OCRとAzure OCRサービスに、日本語の検出テキストから文字間の半角スペースを除去する機能を追加
  • その他
    1. 翻訳結果の編集テキストを履歴に登録できるように改善
    2. マイナーバグ修正

2020.05.15: Version 1.0.2 を新規リリース。