HOME > ソフトウェア > Haruzira


製品特徴 2018/08/30 Update

概要

Haruziraは、音声合成を利用しテキストを読み上げるUWPアプリです。
日本語形態素解析を利用することで、漢字から読み仮名への変換精度を大きく向上させています。
また、シンプルなエディタ機能を搭載し、テキスト入力には音声入力や手書き文字入力を利用することができます。
さらにメール送信支援機能を搭載することで、文章入力・校正・送信作業を効率的に行うことを可能にしています。
そしてUWPアプリの特徴として、Windows 10 Desktop, Windows MR, Windows 10 Mobile, Windows 10 Iot Core環境において共通したインターフェースで動作可能です。

最も特徴的な機能は、ネットワークに接続した複数デバイスから送信されるテキストデータを受信し、リモートで読み上げることが可能なことです。
また、当方で提供するSDKを利用することでテキストを送信するクライアント側のプログラムを簡単に開発することができます。
Version2.0.0からは、音声認識によるコマンド送信も可能になりました。SDKを利用すれば、遠隔のデバイスと音声での相互通信システムを簡単に作成することが可能です。

UWPアプリ(Anniversary以降)では、日本語の音声としてAyumi(女性), Haruka(女性), Ichiro(男性)が利用できます。
日本語以外の言語を利用したい場合は、OSの設定で言語パックを追加する必要があります。
言語の追加方法
アイデアを活かしてユニークな活用を楽しんで下さい。

Version 2.0.0から、リモート通信で音声認識によるコマンド送信機能が搭載されました。
また、音声入力による文書作成時に、句読点や改行などを入力できるようになりました。

※Haruziraはマルチページ(マルチウィンドウ)を採用していますので、複数のページを開いて並行作業ができるようになっています。





Analyze

機能

主な機能

  • 任意の位置からの再生機能。(カーソル位置や範囲指定)
  • 巻き戻し・早送り、リピート再生機能。
  • 音量・速度・ピッチ(音程)の調整。
  • バックグラウンド再生。
  • 音声ファイルの生成。(WAVE, MP3, WMA, AAC)(Windows 10 Mobileは、WAVE, AACのみ)
  • 音声ファイルの音質指定。(高, 中, 低)
  • 日本語形態素解析機能。(Windows 10 Desktopのみ)
  • スキップワード機能。(Url, Emaiアドレス, 連続する記号などを読み飛ばす機能)
  • カスタム辞書による変換機能。(正規表現による変換対応)
  • SSMLフォーマットの読み上げ機能。(SSML 1.0対応)
  • 日本語と英語を独立した音声合成エンジンで再生。
  • 多言語対応した音声認識によるテキスト入力。(文章入力に最適になるように、継続的なディクテーションセッションを管理及び改行や句読点などの音声入力対応。)
  • 多言語対応した手書き文字認識によるテキスト入力。(Windows 10 Desktopのみ)
  • シンプルなテキストエディター機能。(ファイル操作、検索、置換、ジャンプなど)
  • テキストファイルの読み込み。(UTF-8, UTF-8(BOM), Shift-JISに対応)
  • Email送信支援機能。(署名の管理、PeopleアプリやOutlookメールなどとの連携)
  • リモート音声通信機能。

リモート音声通信機能

    ★リモート読み上げ機能
  • SDKを利用した開発。(.NET, Ruby, Python提供中。 その他の言語は準備中)
  • セキュリティ(アカウント認証及び暗号化送信)。
  • 通信ログの記録。
  • 複数デバイスとの通信。
  • 受信データのバッファリング。
  • 送信データにプライオリティを指定した割り込み再生。
  • 言語・性別を指定し、読み上げる音声合成エンジンを変更。
  • 回数を指定しリピート再生。
  • SSMLフォーマットデータの送信。(SSML 1.0対応)
    ★音声認識によるリモートコマンド送信機能
  • SDKを利用した開発。(.NET, Ruby, Python提供中。 その他の言語は準備中)
  • セキュリティ(暗号化送信)。
  • 通信ログの記録。
  • 複数デバイスとの通信。
  • 送信先デバイスの管理。(デバイス毎に管理可能)
  • 音声認識コマンドの管理。(任意のコマンドや認識フレーズを設定可能)
  • 手動でのコマンド送信。

※リモート音声通信機能は、サンプルプログラムで体験できます。

活用方法(どんなことに活用できる?)

文章入力と文章校正

  • 音声入力や手書き文字入力を利用しテキスト入力を行う。(キーボードが利用できない環境で有効)
  • 入力した文章を読みながら同時に耳からも確認してみる。
  • 誤字や脱字があると、読み上げられた音声の違和感から高確率で発見できる。
  • 第3者に声を出して読んでもらいながら、文字を目で追う作業と同等な効果を1人でも体験できる。
  • 読み上げ速度を速めにすることで校正時間の短縮ができ、さらに集中力が増す。(これが読み上げ文章校正のコツ)

語学学習(Listening, Writing, Speaking)

  • 日本語を選択時に、日本語と英語を独立した音声で読み上げることができる。音量なども独立して調整可能。
  • 英文と日本語訳のテキストを作成し読み上げを行うことで、単に英文をリスニングやヒアリングするより意味を理解しながら覚えられる。片方の音量を0に設定することでリスニング版赤シート学習ができる。
    (単語暗記などで利用する赤シート学習のリスニング版)
  • 言語パックを追加することで世界中の言語で読み上げができる。
  • 英語関連の言語パックだけでも国毎に用意されているので、発音やイントネーションの違いを理解し易い。(U.S., U.K., カナダ, ニュージーランド, その他多数)
  • 一言語パック毎に最低でも男女各1名の音声が利用できるので、様々なタイプの発音に慣れることができる。
  • 市販の語学教材のような聞き取りやすい同じ人の音声に耳が慣れてしまうことを防ぐことができる。
  • 学校の授業で日本人の先生が話す外国語より発音が良いので、リスニングやヒアリングの学習に最適。
  • 海外のニュースサイトや青空文庫等から記事や物語を集めて独自のリスニングやヒアリング教材を作成し学習できる。
  • 作成したテキストから音声ファイルを作成できるので、音楽プレヤーでも利用できる。
  • 多言語対応の手書き文字認識機能を利用し、Writingの練習をする。
  • 多言語対応の音声認識機能を利用し、発音の練習ができる。
  • 例えば音声認識の変換言語に英語を指定した場合、英語の正しい発音をしないと言語として認識しないので高度な発音練習ができる。

モバイル環境でのメール送信

  • キーボードが利用できない環境でも音声認識や手書き文字認識機能を利用し入力できる。(改行や句読点なども音声入力可能)
  • 複数の署名を管理し、簡単に切り替えて本文に付加できる。
  • 作成した文章を読み上げることで文章校正ができる。
  • 作成した文章をそのままメールで送信できる。(Peopleアプリの連絡先やOutlookメールなどと連携している)

楽をする

  • 最近文字を見ると目が疲れてつらいと感じた場合、読み上げて聞くことで疲労軽減。
  • 文字を見ていると眠くなってくる場合、読み上げて聞きながら目で追うと集中できる。
  • キーボードで文章入力するのが面倒、または苦手な場合は、音声認識で入力するほうが速くて楽。
  • メールのようにURLやメールアドレス、様々な記号が含まれている文章でも不要な情報をスキップできるので読み上げて聞くことができる。
  • 料理しながら、ストレッチしながらなど、他の作業と並行して読み上げることで時間を有効に使う。
  • 青空文庫などを利用し好みの物語を読み上げてもらう。
  • リモートデバイスからRSSニュース配信などを、スマートフォンやタブレットなどのモバイル端末に転送することでモニターから離れた場所でも聞くことができる。(Wi-Fi等の通信可能圏内に限る)
  • ニュースを集めて読み上げ用のテキストファイルまたは、音声ファイルを作成しておくことで移動中でもスマートフォンで聞ける。

プログラムの開発

  • SDKを利用して、独自のプログラムを開発できる。(音声を利用したネットワーク通信システムなど)
  • SDKは無償で利用でき、作成したプログラムは商用及び非商用を問わずライセンス料不要で利用配布できる。
  • SDKが対応している言語が利用できる環境であれば、OSやデバイスの違いを気にせず動作できる。
  • Raspberry Piでも動作するので、IoT関連の開発にも利用できる。
  • システムやIoT機器などに音声合成エンジンを組み込みたいがライセンス料が高額であきらめていた場合、通信環境さえ用意できれば実現できる。

動作環境

対応OS Microsoft(R) Windows(R) 10 Anniversary以降 32bit/64bit
Fall Creators Update以降では、一部パネルのアクリル化に対応(バッテリー駆動等の省電力モードでは通常のパネルに自動的に切り替わります)
※動作保証をしていないOSに関しては、サポート対象外となりますのでご了承下さい。
ローカライズ 日本語、英語(U.S)に対応しています。
対応デバイス Windows 10 Desktopが動作するPC, ノートPC, タブレット, その他
Windows 10 Mobileが動作するスマートフォン, その他
Windows 10 IoT Coreが動作するRaspberry Pi3, その他
メモリー 2GB以上(IoT Coreは1GB以上)
動作確認に利用したデバイス Windows 10 Desktop: Dell Latitude10タブレット(Intel Atom Z2760 1.8GHz)
Windows 10 Desktop: ドスパラ Diginnosタブレット DG-D09IW2SL(Intel Atom x5-Z8350 1.44GHz)
Windows 10 Desktop: Acer Aspire E5-575 ノートPC(Intel Core i5 7200U 2.5GHz)
Windows 10 Desktop: 自作デスクトップPC(Intel Core i7 7700K 4.2GHz)
Windows Mixed Reality: Lenovo Explorer with Motion Controllers G0A20002JP (GPU: GTX 1060 6MB)
Windows 10 Mobile: Freetel KATANA02(MSM8909(ARM Coretex A7) Quad core 1.1GHz)
Windows 10 Mobile: Madosma Q601(Snapdragon 617 Octa core (1.5GHz + 1.2GHz))
Windows 10 IoT core: Raspberry Pi3 Model B(ARM Coretex A53 Quad core 1.2GHz)

ライセンスについて

ライセンス

  • Haruziraは有料のWindowsストアアプリです。また、Windowsストアアプリの規約に準拠しています。
    試用期間中(30日間)は、利用制限無しに無償で利用できます。

ライセンスのご購入

  • 1ライセンス価格:500円(税抜き)
    ご購入時のアカウントでログインしたデバイスであれば、最大10台までインストールが可能です。
  • ご購入及びダウンロードは、Windowsストアでお求めください。
  • ライセンスの購入は、著作権放棄を意味するものではありません。著作権は全てSymmetry Soft(シンメトリー・ソフト)に帰属します。

ライセンス認証

  • Windowsストアでご購入後、自動的にライセンス認証が完了します。
    (ライセンスキーなどの発行を待つ必要はありません)

音声ファイルの作成

  • ※作成した音声ファイルの著作権などは、マイクロソフト社に帰属します。利用目的が私的利用範囲から外れる場合は(営利及び非営利を問わず)、利用可能の可否をマイクロソフト社に確認して下さい。
    音声合成エンジンの著作権は、ほとんどの場合に音声合成エンジンの開発元に帰属しています。そのため、それらのエンジンを利用して作成した音声ファイルを第三者に公開することは2次配布とみなされるためです。これは、マイクロソフト社の音声合成エンジンやこのアプリに特化したことではありません。明示的にライセンス条項で許可していない場合は同様と考えて下さい。例えば、著作権所有者の許可を得ずに動画等のナレーションとしてYouTubeなどのサイトで公開することは、著作権等の侵害にあたり訴訟の対象となる可能性が有りますのでご注意下さい。
    『作成した音声ファイルを作成者本人のみが聴くことは問題ないが、2次配布及びそれに該当する行為は著作権侵害等にあたるということになります。』

SDKについて

ライセンス共通規約

  • 本SDKの利用及び本SDKを利用し開発を行ったソフトウェアは、商用及び非商用を問わず無償で利用または配布できます。
    本SDKの利用方法(マニュアル及びサンプルプログラムを参照すれば分かること)などに関するお問い合わせサポートは行いません。バグや要望に関する報告のみ受け付けます。バグの修正に関する情報提供の必要性、提供時期、提供方法等に関しては、すべて当方の裁量により決定させていただきます。
    また、上記以外の詳細に関しては下記ライセンス適用の範囲内でご利用下さい。また、無償提供は本SDKの著作権放棄を意味するものではありません。著作権は全てSymmetry Soft(シンメトリー・ソフト)に帰属します。

開発言語毎のライセンス規約

SDK for .NET ライセンスの種別:オリジナルライセンス
ソースコードの変更、改竄は禁止します。
開発を行ったソフトウェアを配布する場合は、本SDKを利用した旨をソースファイルまたは同梱するファイル内に記載し利用者に告知する。また、本SDKの著作権表示を行う。
本SDKには、いかなる種類の保証も付属せず、現状のままで提供されます。
SDKを利用することで何らかのトラブルが発生した場合でも、Symmetry Softは一切の責任も負いません。
SDKの利用者自身の責任の下で開発及び配布を行って下さい。
上記条件を厳守していただければ、SDKの利用及びSDKを利用し開発を行ったプログラムは、商用及び非商用を問わず無償で利用または配布できます。また、本SDKを使用し開発を行ったソフトウェアに、本SDKをバンドルし配布することもできます。
Copyright (c) 2016 Symmetry Soft
SDK for Ruby ライセンスの種別:MIT
Copyright (c) 2016 Symmetry Soft
SDK for Python ライセンスの種別:MIT
Copyright (c) 2016 Symmetry Soft



Download

SDK for .NET SDK:Haruzira SDK for .NET
サンプルソース(Sample source):BitBucket(Git)で提供中。
SDKマニュアル(Manual):Haruzira SDK User's Manual
SDK for Ruby SDK:Rubygems.orgで提供中。「gem install haruzira_sdk」でインストール可能。
サンプルソース(Sample source):BitBucket(Git)で提供中。
SDKマニュアル(Manual):Haruzira SDK User's Manual
SDK for Python SDK:pypi.python.orgで提供中。「pip install haruzira_sdk」でインストール可能。
サンプルソース(Sample source):BitBucket(Git)で提供中。
SDKマニュアル(Manual):Haruzira SDK User's Manual

サンプル

カスタム辞書サンプル

  • Desktop環境用:URL及びEメールアドレスを読み飛ばすことができるデータを含んでいる。
  • Mobile環境用:Desktop環境用のデータに加えて、Mobile環境で最適に読み仮名変換されるためのいくつかのデータを含んでいる。
  • Desktop環境用 Download: カスタム辞書サンプル.zip
    Mobile環境用 Download: カスタム辞書サンプル_Mobile.zip

リモート通信クライアントサンプル

  • リモート通信をちょっと試してみたいユーザー向けのサンプルプログラムです。任意のデータ送信や、RSSニュースサイトのトピックを読み上げることができます。
    また、音声認識で送信されたリモートコマンドを受信することもできます。
  • Download(x86): HzClientSample_x86.zip
    Download(x64): HzClientSample_x64.zip

リリース情報

リリース履歴

2018.08.30: Version 2.5.0.0をリリース

機能追加・変更

 
  • ビルドターゲットをversion 1803に変更(最小ターゲットはAnniversary Updateのまま)
    1. Windows Mixed Realityでの動作確認完了
  • システムトランスポートコントロール機能の改善
    1. 巻き戻しと早送り操作に対応
  • その他バグの修正
    1. アプリ起動直後のシステムトランスポートコントロールによる再生操作での不要なメッセージを非表示

2018.03.25: Version 2.4.0.0をリリース

機能追加・変更

 
  • ビルドターゲットをFall Creators Updateに変更(最小ターゲットはAnniversary Updateのまま)
    1. コントロールパネルの一部をアクリルパネルに対応。(バッテリー駆動等の省電力モードでは通常のパネルに自動的に切り替わります)
  • 読み上げ時の句読点選択機能の追加
    1. 日本語・中国語の場合は句読点を選択できるように対応。(デフォルト句読点「、。」)
    2. その他の言語の場合は、句点を任意に変更できるように対応。(デフォルト句点「.」)
    3. 日本語以外の言語も句点毎に読み上げができるように対応。
  • ヘルプページの各リンク先をhttpsに変更
  • 手書き認識機能の改善
    1. 描画領域の全クリア時に、確認ダイアログを表示するように改善
  • その他バグの修正

2018.01.13: Version 2.3.1.0をリリース

機能追加・変更

 
  • 音声入力機能の改善
    1. アプリがバックグラウンド状態に遷移した場合の処理を改善。
    2. タイムアウト発生時の処理を改善。
    3. ディクテーションコマンド認識処理を改善。

2018.01.03: Version 2.3.0.0をリリース

機能追加・変更

 
  • スキップワード機能の改善
    1. 画像ファイル名のスキップ機能を改善。
  • リモート通信機能の改善
    1. Bluetooth RFCOMMサービスを利用した、リモート操作機能の追加。(音声認識の開始やユーザーコマンド送信の制御機能など)
  • インクキャンバス表示時は常に描画モードになるように変更

2017.02.27: Version 2.2.0.0をリリース

機能追加・変更

 
  • リモート通信機能の改善
    1. リモートアカウント管理で受信可能IPアドレスにホスト名(コンピュータ名)を指定できるように変更。
    2. リモートデバイス管理で接続デバイスにホスト名(コンピュータ名)を指定できるように変更。
    3. SDKプロパティ追加に対応。(読み上げ完了通知の送信要否プロパティ)

2017.02.01: Version 2.1.0.0をリリース

機能追加・変更

 
  • スキップワード機能の改善
    1. 全角記号の読み飛ばし文字コードを一部変更。(単位記号のスキップ制御など)
    2. 画像ファイル名のスキップ設定を追加。
  • ヘルプ情報の改善
    1. サポート及びリリースノートへのリンクを追加。
  • メール送信支援機能の改善
    1. メールアプリに渡す本文の改行コードを「\n -> \r\n」に変更。
  • 音声認識機能の改善
    1. 聞き取り中にタイムアウトされた場合でも、自動的に再開し処理を継続できるようにに変更。
    2. 「全てコピー」コマンドでクリップボードに設定するテキストデータの改行コードを「\n -> \r\n」に変更。
  • 巻き戻し機能の改善
    1. スキップワードで読み飛ばされた行より前に巻き戻しができるように対応。

2017.01.18: Version 2.0.0.0をリリース

機能追加・変更

 
  • リモートデバイスへの音声認識によるコマンド送信機能の追加。
  • 手書き文字認識によるテキスト入力時のパフォーマンス改善。
  • 音声認識によるテキスト入力時のパフォーマンス改善。
  • 音声入力による文章作成時に、改行や句読点なども入力できるように改善。
  • フォント設定をエディットパネルからできるように改善。
  • スキップワード機能の改善。
  • 音声認識中などに不要な操作ができないように改善。

不具合対応

 
  • Email本文がクリップボーにセットされなくなるケースの対応。

2016.12.29: Version 1.3.0.0をリリース

機能追加・変更

 
  • 手書き文字認識によるテキスト入力機能の改善。
  • 音声認識によるテキスト入力機能の追加。>
  • テキストエディター機能の追加。
  • Email送信支援機能の追加。
  • GUIデザインを一部変更。

2016.10.13: Version 1.2.0.0をリリース

機能追加・変更

 
  • リモートログの初期化機能追加。

2016.10.09: Version 1.1.0.0をリリース

機能追加・変更

 
  • 英語(U.S)のローカライズ対応。
  • テキストフォントの設定機能追加。
  • テキストから音声変換時の、変換モード設定機能追加。(Direct, To SSML)
  • 読み上げ音量と速度を、再生中にリアルタイム調整できるように対応。

不具合対応

 
  • カスタム辞書登録で、\記号が入力された場合のファイル読み込み時エラーを修正。

2016.09.27: Version 1.0.0を新規リリース。