Friction River Software

  • お問い合わせ

音声読み上げシステムの説明(会話風)

A子

ねぇ、B美先生さぁ
某国営放送のニュース番組で「AIによる自動音声で…」なんてぇのがあるよね?

あれって特殊な機材が必要で、お金も結構かかっちゃうのかな?

B美

NHKがどういう機材を使ってるのかは知らないわ

でも『音声読み上げ』って、それほど難しいことじゃないのよね、今の時代…

C菜

A子社長がぼかして「某国営放送」って言ってるのに、B美部長が「NHK」って言っちゃってます~

A子

まぁそれは良いとして…(苦笑)

音声読み上げ』って簡単にできるの?

B美

ええ、いくつかの企業が『音声合成』のサービスを提供してくれているわね

GoogleとかIBMとか…

C菜

社長、どうしたんですかぁ~

うちの会社でもAI音声を何かに利用したいんですか~?

A子

いや、うちで取り扱っている商品の説明を文章だけじゃなく、声でもアナウンスできたらなぁって…
あ、Webページ上の話ね

ただ、録音作業をスタジオを借りて行うってのもどうかな?
そこまでお金はかけたくないって感じなのよね

B美

うーん、なるほどねぇ
結構良い考えかも…

それじゃ、このWebサイトね

A子

音声読み上げシステム』って、まさにその通りじゃん!

え?…これって無料で使えちゃったりするの?
いや、まさかね

B美

いいえ、無料

ただし、このWebサイトにおける累計で、音声化した文字数が月に100万文字までって制限はあるけど…

C菜

うちの会社だけじゃなくて、このサイトを見てる不特定多数の人たち全員で…ってことですかぁ~?

利用者数が多くなると、すぐに上限を超えそうです~

B美

まぁ、今のところはほとんど無名だし、我が社で使い放題かも(笑)

ちなみに月に100万文字という制限だけど、このサイトの中核部分にはGoogleの『Text-to-Speech API』というサービスが使われていて、それが月100万文字までだったら無料だからよ

A子

いいじゃん、いいじゃん!

ぜひ活用しまくりましょう!



A子

それじゃ、まずは我が社の自己紹介からね

「株式会社ふりくしょんりばーのWebページをご覧いただき、誠にありがとうございます」
…って言わせてみよう!

B美

OK、OK

それじゃあ、さっきのサイトの左下にある入力欄にその文章を打ち込んでみましょう

C菜

私がやってみるです~

えっと、「株式会社ふりくしょんりばーのWebページをご覧いただき、誠にありがとうございます」でしたっけ~?

B美

さすがはC菜ね

打ち込み終わったら【確認画面へ】ってボタンを押してね

B美

こんな感じで、月100万文字制限内かどうかのチェックが行われて、問題なければ一番下に【音声データ作成開始】ってボタンが出るの

んじゃ押してみて

C菜

えいっ!

おぉ~、すぐに画面が切り替わったです~
あっと言う間です~

B美

ここで画面上部にある再生ボタン(右を向いた三角形ね)を押すと、スピーカーから音声が出るわよ

ちなみにWebページへの音声埋め込みは
<audio controls src="○○.mp3"></audio>
というタグを使えば良いだけ
簡単でしょ?


(実際に聴いてみてください)

A子

ちょ、ちょっと会社名の部分がめっちゃなまってるんだけど!

なんとかならないの?

B美

「ふりくしょんりばー」の部分を半角文字で「Friction River」に変えてみると良いかもよ


(実際に聴いてみてください)

A子

おぉ、良い感じ!

もう少し早くしゃべったほうが良いかな?

C菜

ピッチスピードを変更してみるです~


(実際に聴いてみてください)

A子

良いじゃん、良いじゃん、完璧よ!

最近はタイパ(タイムパフォーマンス)が好まれてるし、少し早口くらいのほうが良いよね

B美

それじゃ次に、この音声データをダウンロードするんだけど、【MP3ファイルをダウンロード】ボタンを押すだけだから…
もちろん「名前を付けて保存」してね

C菜

これでうちのWebページ上で、さっきの音声データを再生できるんですね~

超簡単ですぅ~

B美

実は『https://cloud.google.com/text-to-speech?hl=ja』のサイトにアクセスすると、同じようなことができるのよ
(URLをクリックすると別ウィンドウで開きます)

いえ、もっと細かい設定も可能なのよね
言語もたくさん選べるし…

A子

なんだぁ、『車輪の再発明』じゃん

本家Googleが提供してるサービスがあるのに、このサイトの存在意義ってあるの?

B美

もちろんあるわよ

まず一つ目は、音声データをMP3ファイルとしてダウンロードできること
二つ目は、細かい設定を『設定ファイル』に保存しておいて、それを読み込ませることで設定自体を復元できることよ

C菜

Googleの公式ページを見てきましたけど、B美部長のおっしゃる通り、二つの機能はありませんね~

ファイル化できないと意味ないですぅ~

B美

どうかしら?

なかなか便利なサイトだってことが分かったでしょ?

A子

設定の保存って【現在の設定情報をダウンロード】ってボタンを押せばいいのよね?

C菜

やってみるです~

あれ~?
ダウンロードしたファイルをメモ帳で開いてみたら、ぐちゃぐちゃになりましたです~

B美

この『設定ファイル』って、暗号化されているらしいわよ

別にテキストファイルのままでも良かったと思うんだけど…

C菜

でも、ただのテキストファイルだと、勝手に中身を改ざんされちゃうかもしれませんね~

なんだか無駄に高性能です~

B美

最初の画面に戻ると、さっきの設定がそのまま残っているから、そこで【初期化】ボタンを押してね

次に【ファイルの選択】をクリックしてから、さっきダウンロードした『設定ファイル』を選択しましょう
んで、【読み込み実行】ボタンを押すと…

A子

おぉ、【初期化】する直前の状態に戻ったわね

なるほどねぇ、ベストな設定を紙にメモっても良いんだけど、ファイル化しておくほうが簡単ってことか~



A子

あ、そうだ
言語 及び 性別と声質』って何か国あるの?

B美

日本語、英語、ドイツ語、フランス語、ロシア語、スペイン語、イタリア語、中国語、韓国語の9か国分ね

それぞれの国ごとに男女の違いや音声周波数の高低という複数のパターンが用意されているわよ

C菜

それぞれの国のサンプル音声を真面目まじめな説明文のほうで聴き比べることができますですぅ~

A子

これって誰が翻訳したのよ
てか、ほんとに合ってるの?

B美

これよ

A子

…って、Google翻訳やないかーい!

まぁ、これなら正しいでしょうね(多分…)

C菜

Google翻訳でスピーカーみたいな形のアイコンをクリックすると、音声が再生されるです~

あ、でもMP3のようなファイル化はここでもできないみたいですね~

B美

どうよ
このサイトがあれば、外国語の勉強がはかどること間違いなしよね

外国語教師が生徒用の学習用教材を作ることもできるかもしれないわ

A子

うーん、確かにすごいかも…

まぁ、我が社としては日本語だけでも良いんだけどね(苦笑)



A子

あと右側の細かいオプション設定の中で、ピッチの増減ってどれくらい変わるの?
マイナス20からプラス20までってことは、えーっと1目盛が20セントだから…

C菜

5目盛で半音一つですよね~

ということは、半音4つ分を増減できるってことですかぁ~?

B美

計算上はそうね
ちなみに1オクターブは1200セントらしいから、マイナス400セントからプラス400セントってことは3分の1オクターブのプラス・マイナスが可能ってことになるわね

まぁ、これも実際に試してみれば自分の耳で実感できるでしょう



B美

最後に総括するけど、AIによる『音声読み上げ』ってのが何気なにげに簡単だってことを分かってもらえたかしら?

まぁ、このサイトに関して言えば、Google様のおかげなんだけどね(笑)

A子

だね~

C菜

ですですぅ~

登場人物紹介ページはこちら