Minecraftとタートルと僕

PCゲームMinecraftのMOD「ComputerCraft」の情報を集めたニッチなブログです。

こちらのページは更新が滞っており、情報が古くなりつつあります。新しいCC情報サイトをはじめましたので、もしよければご参照ください。今後ともよろしくお願い申し上げます。

「百億のマインクラフトと千億のタートル」(https://hevo2.hatenablog.com/)

VoiceTextのWeb API(β版)が無料公開だそうですよ。高品質なテキスト読み上げ機能を試しました。

はじめに

テキスト読み上げソフトってご存知ですか?

手元にある文字テキストを読み込ませると、その文章のヨミを自動解析して、声で読み上げてくれるソフトです。

コンピュータによる合成音声なので、抑揚がでたらめで不自然なこともあるのですが、読み上げソフトを使うと校正作業がはかどるということで、文筆業の方はよく活用しているそうです。

また視覚に障害を持っている方、あるいはそこまで行かなくても細かい文字を読むのがつらくなってきた方にとってもテキスト読み上げソフトは便利でしょう。

ワープロソフト一太郎にも、この読み上げ機能がついたことが(一部で)話題になりました。中には、ワープロ機能はいらないので、この読み上げ機能だけ買いたいのだけど、なんて言い出す方もいたとかいないとか。

そしてニコニコ動画を普段から良く見る方にとって、テキスト読み上げソフトによる実況プレイ動画は、なじみ深いかもしれません。

テキスト読み上げソフトの種類について

一般的なユーザーがテキスト読み上げソフトに求めるものは、「自然な音声」「ソフトの使いやすさ」、そして「ソフトの手に入りやすさ(価格も含む)」でしょう。

たとえば公共放送やカーナビなど、企業が製品の中で使う法人向けのテキスト読み上げソフトは、品質の高さに比例してかなりの価格となります。個人で手に入れるのはハードルが少々高いです。

それに対して、無料で自由に使ってかまわないというソフトも数種類あります。しかし自然な音声という点では、それなりの品質でしかありません。

たとえば、「ゆっくりボイス」で有名な、ソフトーク(softalk)などが有名ですが、 聞くといかにも合成音声です*1

個人で入手しやすい手ごろな価格ということであれば、株式会社AHS(AH-Softoware)のVOICEROIDシリーズをはずすことはできないでしょう。数千円~1万円前後という価格帯、そして何より純粋な合成音声ではなく実在する人(声優?)の音声サンプリングを使用ということで、爆発的にヒットしています。

マイクラ工業動画では、結月ゆかりというキャラクターによる実況動画をよく見かけますが、これは株式会社AHSの「VOICEROID+結月ゆかり」という、テキスト読み上げソフトを使っています。

落ち着いた女性の声*2で、個人的にかなり好みの声です。 私は使ったことはないのですが、特別な設定をしなくてもデフォルトのままで比較的自然な音声を出してくれるということで、初心者が購入するにもおすすめなのだとか*3

法人向け製品であるVoiceText

VoiceTextはHOYAサービス株式会社の商品で、その高い品質に定評があります。これまでは主に法人向けにしか販売していなかったために、個人が手にすることはできませんでした。

僕はあまり詳しくないのですが、「モヤモヤさまぁ~ず」ナレーションはこちらのshowくんの声だとか*4

そして先に例に出した一太郎もこれを使っています。

そのような、すばらしい製品が個人で使えるとしたらどうします? 

「でもお高いんでしょう?」

「いえ無料なんですよ」

VoiceText Web API

2014年7月9日午後、「VoiceText Web API ベータ版」が公開されました。

f:id:hevohevo:20140710014350j:plain

一言で言うと、「あなたが作るソフトの中にこの機能を組み込んでもいいよ!」ということです。

つまり基本的には、ソフトウェア開発者向けのサービスです。

とはいえ、個人で使えないわけではありません。使い方はAPI公式ページで丁寧に説明されていますし。

早速ですが、僕も少しだけ使ってみました。

公式ページには「curl」コマンドを使った使用例があったので、これをWindowsで使うにはどうすればよいか、以下に簡単に説明します。

VoiceText Web APIの使い方(Windowsでcurlを使う場合)

cURL(curl) って?

API公式ページでは、curlコマンドを使った例が示されています。

「cRUL」は様々なコンテンツを様々なプロトコルで転送するためのソフトなのですが、Web上のコンテンツを手元にダウンロードするときによく使われます(厳密に言うとPOST/GETの実行)。

特定のページ、特定のファイルだけをダウンロードできるため、使いこなすととても便利なソフトです。 またダウンロードするときに、先方のサーバー側に様々なパラメータを渡すことができるため、WebAPIを気軽に試すことも可能です。

しかし、こんな便利なソフトなのに、Windowsには標準で入ってません。

自分でインストールしましょう。

なお、curlのインストール方法について、以下のページを参考にしました。すばらしい情報に感謝。

ダウンロード

Windows版のcurlプログラムは、SSL対応版と非対応があります。今回はhttps接続を要求されるので、SSL対応版をダウンロードしましょう。

ダウンロードするとZIP圧縮ファイルです。まずは展開してあげましょう。

インストール

展開したら、中にcurl.exeというファイルがぽつんと一つだけ入っているので、適当な場所にインストールしてあげましょう。

たとえば、Cドライブ直下に、C:¥voicetextというようなフォルダを作って、その中に入れてあげればよいですね。

あらかじめAPI_KEYを入手しておく

API公式ページでメールアドレスを入力して、そのメールでAPI_KEYを手に入れましたね?

大切に取り扱ってください。間違っても、ネット上に流出させてはいけません。

コマンドプロンプトの実行

スタートボタン→アクセサリ→コマンドプロンプトを開きましょう。

そしておもむろにcdコマンドを使って、さきほどのC:¥voicetextにカレントディレクトリを移動しましょう。

> cd ¥voicetext

そしてcurlコマンドを実行するのです。

curlコマンド実行上の注意

その1)SSL証明書のインストール面倒なので-kオプション

curlでSSL通信(https)を使うときには注意しなくてはなりません。

本来ならば、手元にあるSSL証明書を使って相手が正しいかどうかの確認・・・などを行わなくてはならず、そのためにSSL証明書をインストールしなくてはならないのです。

しかし、そこまではやってられないですよね。今回はSSL証明書を使った確認をスキップしましょう。セキュリティ的には本当はよくないのですけど、今回はテストですからテストですから・・・

スキップする方法は簡単、curlコマンド実行時に-kオプションをつけてあげればよいのです。

curlコマンドに与えるパラメータはすべて1行で

公式ページの例では、バックスラッシュを入れることで各パラメータで改行を入れていますが、Windowsでは改行無しで1行で入力したほうが良いでしょう。

もちろんバックスラッシュは抜きで、各パラメータは半角スペースで区切って。

APIキーを忘れずに

先に入手したAPIキーはここで忘れずに入力しましょう。

公式ページにも注意事項として書かれていますが、このとき、-u "API_KEY:"のように、キーのあとに「:」半角コロンをつけるのを忘れずに

入力例

(API_KEYは塗りつぶしてあります)

f:id:hevohevo:20140710013348p:plain

> curl -k "https://api.voicetext.jp/v1/tts" -o "test.wav" -u "YOUR_API_KEY:" -d "text=おはようございます" -d "speaker=hikari"

実行結果

実行後は、C:¥voicetextディレクトリ内に、「test.wav」というファイルができているはずです。

もし、問題なく成功したのならばこれは音声ファイル(WAVファイル)です。ファイルを再生してあげると自然な音声が入っているはずです。

もし何らかの原因で失敗したならば、その失敗内容(エラーメッセージ)が「test.wav」ファイルに書き込まれます。つまり、このときこのファイルはテキストファイルです。

メモ帳などで無理やり開くと、見ることができます。

よくあるエラーは、APIキーの入力ミスなどですね。

注意事項(2014/8/8追記)

ダウンロードした音声ファイル(WAVファイル)は、VoiceText Web APIの利用規約を守ってご利用ください。

本サービスで作成した音声データの商用利用、二次利用及び配布する行為は禁止されております。 利用規約をご確認の上、本サービスをご利用ください。(トップページからの引用)

おわりに

これでいろいろとパラメータをいじりつつ、合成音声を楽しむことができますね。

ちなみに、VoiceText Web APIでは、4種類の音声を選ぶことができます。

また、感情(悲、怒、喜)の設定や、その感情の強度も設定できます。遊んでみましょう。

それでは、このような素晴らしいAPIを公開してくれたHOYAサービス株式会社さんへ感謝し、

このAPIを使った楽しいサービスが増えることを願ってこの筆を置かせて頂きます。

・・・早くこのAPIを使ったWebサービスができないかなー(チラッチラッ

*1:とはいえ聴きやすい上に、慣れてくると味があるので嫌いじゃないのですよね。個人的には

*2:誰の声なのかはまだ明かされていないですよね?

*3:Amazonレビュー情報です

*4:有名なんです?識者の方教えて?