アマゾンは、ほとんどすべてのユースケースに対応する独自のソフトウェアを持っている。 例えば、音声合成の市場では、少なくとも2つの選択肢があります。
今回は、アマゾンの2つのソリューションを使って、音声合成を利用する方法を学びます。ポリー(Polly)とアレクサ(Alexa)です。
Amazon Pollyとは?
Amazon Pollyは 、同社が開発した本物そっくりのスピーチジェネレーターです。 Googleの技術と同様、大きく2つのレベルがあります。
- AIとディープラーニングにより、さまざまな言語のリアルな音声を合成する「スタンダードTTS
- さらに機械学習の技術を駆使して、音調や読みやすさを向上させる「Neural TTS」。
Neural text to speechの 改良の一例として、ニュースキャスターの音声があります。 その名の通り、ニュースキャスターのようにテキストを読み上げる。 これには、トーン、フロー、強調が含まれます。
Amazon Pollyはどの言語をサポートしていますか?
Pollyは22ヶ国語に対応しています。 その中で、アクセントや辞書が異なる。 例えば、英語には
- アメリカ英語
- カナディアンイングリッシュ
- 英々語
- インディアンイングリッシュ
- 南アフリカ英語
- ニュージーランド英語
- ウェールズ語 英語
他の Transkriptorの代替 品と比較すると、リストはそれほど大きくはありませんが、世界で最も人気のある言語をすべてカバーしています。
Amazon pollyのPricingとは?
Pollyの価格設定は、Googleと非常によく似ています。 有料サービスでは、月100万文字が4ドル、神経音声が16ドルとなっています。 より少ない金額で、1仕事あたり0.01ドルという価格も可能です。

Amazon PollyでText to Speechを使うには?
Amazon Pollyの音声合成の使い方を理解するのは難しくない。 手順は以下の通りです。
- AWSアカウントをまだお持ちでない場合は、設定してください。
- Amazon Pollyのページにログインします。
- テキスト入力ボックスにテキストを貼り付けます。 プレーンテキスト、またはSynthesis Markup Languageで、ピッチ、音量、発話速度などの制御が可能です。
- Pollyはテキストの音声ストリームを生成します。
- 次に、文章を読み上げる音声を選びます。 本文と同じ言語である必要があります(Pollyは翻訳サービスとしては機能しません)。
- 出力形式を選択し、ファイルをダウンロードします。
Amazon Pollyはどこで使えるのか?
Amazonでの音声合成の使い方がわかったら、次は音声ファイルの使い道について考えてみましょう。 例えば、以下のようなものがあります。
学習
講義や教材の読み上げなど、学習用途にPollyをご活用ください。 例えば、外国語アプリのDuolingoは、音声合成にAmazon Pollyを使っている。 発音が重要な場面であることを考えると、ポリーの音声合成サービスの質の高さが際立つと思います。
コンテンツ制作
音声合成はコンテンツ作成に役立つ。 例えば、ブログ記事をポッドキャストに変換したり、YouTube動画のナレーションを作成したりするのに使うことができます。 また、Webサイトのコンテンツを読み上げることで、視覚障がい者のアクセシビリティにも貢献できるかもしれません。
電話サービス
コンタクトセンターでは、従来から電話メニューに人工音声を使用していました。 本物そっくりの音声合成サービスを利用するメリットは、リアルな声を聴くことが好まれることです。 しかも、電話のメニューシステムにはそれほど多くのテキストがないため、セットアップのコストはかなり低く抑えられるでしょう。

Alexaは、アマゾンの音声コマンドサービスです。 スマートスピーカー、テレビ、スマートフォンなど、さまざまなデバイスに内蔵されています。 Amazon Alexaで音声合成を利用する方法にはいくつかの選択肢がありますが、Pollyほど高度なものはありません。
Amazon Alexaのルーチンを設定する方法とは?
Amazon Alexaで音声合成を利用する方法として、ルーチンを設定する方法があります。 これらが起動すると、割り当てたテキストをAlexaが読み上げます。 例えば、朝や夜のルーティンに合わせて、ある言葉を発してもらうこともできます。 手順は以下の通りです。
- Alexアプリを開き、「その他」をタップし、「ルーチン」を選択します。
- Enter Routine Nameを選択し、入力する。
- こんなときは」をタップし、「音声」をタップします。
- ルーチンを開始したいコマンドを入力します。 例えば、「おはよう、アレクサ」。
- アクションを追加する」「Alexa Say」をタップします。
- カスタマイズをタップして、表示させたい内容を入力します。
- 保存」をタップします。
例えば、「おはよう、アレクサ」と言うと、「おはよう、デビッド」と返してくれるかもしれません。
Amazon Alexaをアプリで使うには?
また、サードパーティーのサービスをダウンロードする方法もあります。 ここでは、アプリを使ってAmazon Alexaで音声合成を利用する方法を紹介します。
- Alexaアプリを開き、「その他」をタップします。
- Skills & Gamesを選択し、検索します。
- Text to Voice」と入力し、「起動」をタップします。
- 次のメニューでAlexaデバイスを選択します。
- パソコンやスマートフォンで、 文字入れサイトに アクセスする。
- Alexa、TTVに私の暗証番号を聞いて」と言う。 4桁のコードを読み上げてくれるので、それをWebサイトに入力します。
- 次のページで、Alexaに言わせたいことを入力します。
- 保存」をタップします。
- 最後に、『Alexa、TTVに話してもらう』と言ってください。 そうすると、入力した内容をAlexaが読み上げてくれます。
Alexaでの音声読み上げの欠点
Alexaを音声合成に使うことの欠点は、以下の通りです。
- 以前に入力した内容しか表示されません。
- 質問をするとウェブページの断片を読み上げますが、深い内容までは読み上げません。
- 話す声の自由度はあまり高くない。
- Pollyのように音声合成サービスとして明確にデザインされているわけではない。