忍者ブログ
コンピューターとかゲームの最新ニュースはまとめるのが面倒なので Twitter を追ってください。もしくは1日分のツイートをまとめて簡素な HTML にするスクリプトください。

東芝の音声合成ミドルウェア ”To Speak(TM)” か HOYA の ”ViceText” が個人的に使いたい

また、溢れきっている状況で仕事を積むんですが、作業しながら 新着のメールを読んだり
RSS などで得られる最新情報に即時反応するのはなかなか難しいです。
会社で働いていた時もそうだったんだけど、当時と違って周囲に人がいないので、通知を音声で知らせてほしい!
かと言って、Windows10 の Cortana は「お前のあらゆる情報を吸い取る契約をしない限り何も話さない」とおっしゃるので使いたくありません。デスクトップの位置情報とか嫌すぎるわ


ということで、音声合成ソフトが利用できないかと考え中です。↓コレがギリギリ許せない声優ボイス



選択肢

音声で聞きたいけど、萌え文化になじめない僕にとってはアニメ声優の甘ったるい声は苦痛。
オッサンが機械に喋らせようとするだけでキモいのに、それが声優だと鳥肌が立ちます。
周波数的に考えて女性の声であって欲しいとは思いますが、そこら辺の女の子程度が普通に話す程度で十分。


ということで、 VoiceRoid という Vocaloid の兄弟分みたいなソフトは除外。


そうすると、選択肢はこんな感じ。

  • 株式会社 エーアイ: AI Talk
    • VoiceRoid も中身はコレ
    • マツコロイドがこいつを採用している
    • 個人向けに かんたん! AI Talk3 というパッケージがある。
  • 日立: RubyTalk
    • 音声合成ミドルウェア業界ではおそらく最大手。
    • PSVita のフリーダムウォーズで採用されているらしい。あれの音声合成は微妙すぎる
  • 株式会社アクエスト: AquesTalk
    • 完全にマイコン向け。合成音声もすごく合成チック
  • HOYA: VoiceText
    • 眼鏡のレンズでおなじみの HOYA がなぜか作ってる音声合成ソフト
    • SHARP のエモパーで採用されているのがコレ。それ以外にも実績がかなり多い。
    • デモを聞く限り、HARUKA あたりなら拒否反応もないし、かなり自然な発音
    • Web API もある。
    • 提供方法は SDK か 音声ガイダンス作成ソリューションのどちらか。うれしいかはともかく、C++/C# で使えるのは魅力と言える。価格は応相談。
  • 東芝: ToSpeak
    • ナレーターを使って収録したボイスデータを使ったスマホアプリ実装例を実際に聞いたことがある
    • 複雑な自由文 (メーカーの作った定型文の読み上げなど信用できないので) でも、列挙した中で一番自然に聞こえた。
    • ただし、実績がほぼなし。代理店経由での購入になるらしいけど、個人で利用できる気がしない。

この中だと VoiceText か ToSpeak が高水準なんだけど、個人が個人的に使いたいという用途で使えるんだろうか?


ToSpeak を組み込める段階まで作りこんだプログラムをもって、東芝に 「実用的なデモを作らせて下さい。」 って感じで売り込みに行ったら OK してくれないかなぁ…



PR