Haruziraについて
読み上げようとする文字列が装飾文字(記号)だけの場合などに、音声合成エンジンが読み上げ文字を解析できずに応答が返らないケースがあります。
カスタム辞書の正規表現を利用して、記号だけの文字列などを読み飛ばすことができます。
また、設定の「読み上げタイプ」で「SSMLに変換」スイッチをOFFにすることで発生し難くなる場合もありますので試してみてください。
カスタム辞書サンプルをこちらに用意していますので、ダウンロードし試して下さい。
設定変更やサンプル辞書を利用してもダメな場合は、辞書をユーザー様自身で登録するか、問題となる文字列をサポートまでお知らせ下さい。
追記 2016/12/30
Version 1.3.0.0をリリースしました。スキップワード機能を搭載することで、連続する記号などで止まることなく読み上げることができるようになりました。
また、こちらで確認したいくつかの文字についても対応しています。
ユーザー様の環境で止まる文字がある場合はお知らせ下さい。
カスタム辞書には正規表現を利用し登録して下さい。
カスタム辞書サンプルをこちらに用意していますので、ダウンロードし試して下さい。
サンプル辞書を利用しても読み飛ばしができない場合は、辞書をユーザー様自身で登録するか、問題となる文字列をサポートまでお知らせ下さい。
追記 2016/12/30
Version 1.3.0.0をリリースしました。スキップワード機能を搭載することで、メールアドレスやURL等の文字列を読み飛ばすことができるようになりました。
スキップワードに登録されていない文字列などに関してはカスタム辞書をご利用ください。
申し訳ございません。現在は、システムのデフォルト速度で音声化されます。
Windowsの設定で「時刻と言語」->「音声認識」->「スピード」で設定した速度で音声ファイル化することはできます。
追記 2016/12/30
Version 1.3.0.0をリリースしました。本アプリで設定した速度が反映できるように対応しましたのでお試しください。
現状は、再生ボタンのクリック(タップ)時に反映する仕様となっています。
次期バージョンでは、メインページの編集パネル上で変更できるように対応を行う予定です。
次期バージョンは「2017/01中旬頃」のリリース予定です。
日本語以外の様々な言語を利用したい場合は、OSの設定で言語パックの追加を行って下さい。
Windows10では、簡単に言語パックの追加や削除ができます。
追加方法について詳しく知りたい場合は、Haruziraの下記マニュアルを参照して下さい。
言語の追加方法
「Ctrl + Tab」で入力することができます。
Version 1.3.0.0では、句読点は自動入力、改行は手動入力となります。次期バージョン以降で対応を行う予定です。
追記 2017/01/18
Version 2.0.0.0をリリースしました。改行や句読点などが音声入力に対応しました。対応している音声入力コマンドやフレーズは、アプリの音声入力パネル上で確認できます。
以下のことを意識して行うと良いです。
・一文字毎にはっきりと話す。
・単語で区切るのではなく、できるだけ長い文節で区切りながら話す。
これは、文節中の前後の文字列を比較しながら適切な単語変換を行うためです。
(例:箸とういう単語に正しく変換させたい場合は、以下のように食事で使用する箸とわかるように話すと良いです。
NG:はしをつかいます → 橋を使います。
OK:にほんではしょくじにはしをつかいます。 → 日本では食事に箸を使います。)
・書き言葉より一般的な話し言葉を利用するほうが良い場合が有ります。
(例:明日は、 OK:あしたは、NG:あすは、)
・できるだけ標準語で話す。(方言は避ける)
・改行や句読点などを入力する場合は、音声入力中の文章変換が完了後に話す。
また、多少の間違いは気にしないで音声入力を継続し、最後に変換ミスを修正するほうが効率が良いです。音声認識を学習させるためにもどんどん利用して下さい。
OSの設定画面を起動し、「プライバシー」設定で次の設定が有効になっているか確認して下さい。
・「マイク」設定を表示し、マイクにアクセスできるアプリでHaruziraをオンにします。
・「音声認識、手書き入力、入力の設定」を表示し、音声認識サービスと入力候補をオンにして下さい。
また、音声認識の利用中に動作しなくなった場合には、音声認識を一旦停止させ、再度開始ボタンで再開して下さい。
外付けの単指向性マイクをお勧めします。また、マイクによってはマイクスポンジの有無で認識率が全く異なる場合があります。マイクスポンジ未装着の場合は、装着することをお勧めします。
アマゾンなどで購入できます。
現在は、変更できません。次期バージョン(2016/12中旬頃)で対応を行う予定です。
また、変換入力後のカーソル位置も自動的に最後尾になるよう変更する予定です。
追記 2016/12/30
Version 1.3.0.0をリリースしました。スムーズな文章入力ができるように改善しました。また、認識結果を候補から選択できるようになりました。
メールアプリに渡せる文字列サイズには制限があります。そのため、本アプリでは制限サイズをオーバーする場合クリップボードにセットする仕様にしています。
英語の場合は、2,000byte前後が制限サイズになっています。日本語の場合は、600byte前後で制限サイズをオーバーするケースがあり、この対応が本アプリで不十分であることを確認しました。
現状は、1,500byteで制限サイズオーバーとする仕様にしているのですが、日本語の場合に仕様を変更するよう改善します。(次期バージョンで対応)
追記 2017/01/18
Version 2.0.0.0をリリースしました。日本語の場合は、500byte以上でクリップボードにセットするように変更しました。
Creaters Update以降に発生している問題だと思われます。Anniversary Update環境では発生しておりません。
また、文字化けが発生しているのはWindows標準搭載のメールアプリのみです。Outlook2016やThunderbirdなどの他のメールアプリでは同様の問題は発生していません。
現状の調査結果では、MSが提供しているメールアプリまたはAPI側の問題だと思われるため、問い合わせを行っています。
Windows10 Desktop OSの場合は、標準のメールアプリ以外を既定のメールアプリにしていただければ暫定的な回避は可能となります。
既定のメールアプリの変更は、Windowsの設定で「アプリ」「既定のアプリ」のメールで設定できます。
Windows10 Mobileの場合は、現状では回避策がありませんのでコピー&ペーストなどで対応していただき、対応策が判明するまでお待ちください。
MS側から原因または対応策が提出されるまで少し時間がかかると思われます。ご不便をおかけいたしますが、回答が得られるまでお待ちください。
2017/12/23
追記 2018/01/05
次のメールアプリのバージョンから、文字化けの発生はなくなりました。メールアプリのアップデートを行って下さい。
Windows 10 Desktop:17.8730.21725.0
Windows 10 Mobile:17.8730.21726.0
Windows 10搭載のメールアプリでは、Windows 10 version 1803から仕様が変更されているため、外部アプリから表示名などをメールアプリに渡した場合に正常に処理されなくなっています。
Haruziraの設定「Emai設定」から、TO, CC, BCCの各表示名で「非表示」を選択して下さい。
なお、その他のメールアプリ(Outlook, Thunderbirdなど)では、上記問題は発生していません。
UWPアプリには、同一環境のデバイス(PCなど)上の他のアプリからネットワーク接続することが基本的にできません。
これは、Windows 10のセキュリティ仕様となります。(ループバック接続ができない)
他のデバイスから接続して下さい。または、同一のデバイス上にVirtualBoxやHyper-Vなどの仮想PCを構築することで接続することは可能です。
受信用のPort番号を、プロセス毎に競合しないように変更すれば可能です。
同様に、Port番号の競合を回避すれば、同一プロセス内でも複数の通信インスタンスを生成し通信することも可能です。
オンラインマニュアルがご利用いただけます。
全てのUWPアプリは、バックグラウンド状態のまま一定時間利用していない場合にリソースを解放します。
これは、OSが提供するエコシステムによる仕様です。
UWPアプリは、スマートフォンのようにフォアグランドやバックグランドなどの状態を管理しています。
バックグラウンド状態が長い時間継続している場合、システムのリソースを有効に活用するためにアプリが終了される場合があります。
なお、アプリが終了しても作業中のデータなどは自動保存され、安全に管理されているので大丈夫です。
音声認識による文章入力時のみ必要になります。文章の変換は、マイクロソフトのクラウドサービスを利用しているためです。マイクロソフト社に情報が送信されるため、機密文書などの作成には注意して下さい。
(Googleなどが提供するサービスも同じですので同様に注意して下さい。)
なお、リモート読み上げ機能の音声認識処理は、ユーザーによる任意のコマンド登録で行うためインターネットに接続する必要はありません。ローカルネットのみで利用できるため安全なシステムを構築できます。
ただし、フリーテキストによるコマンド送信の場合は、同様にインターネットへの接続環境が必要になります。