2022年、アマゾンで音声合成を利用する方法

アマゾンで音声合成機能を有効にする

アマゾンは、ほとんどすべてのユースケースに対応する独自のソフトウェアを持っている。 例えば、音声合成の市場では、少なくとも2つの選択肢があります。

今回は、アマゾンの2つのソリューションを使って、音声合成を利用する方法を学びます。ポリー(Polly)とアレクサ(Alexa)です。

Amazon Pollyとは?

Amazon Pollyは、同社が開発した本物そっくりのスピーチジェネレーターです。 Googleの技術と同様、大きく2つのレベルがあります。

  • AIとディープラーニングにより、さまざまな言語のリアルな音声を合成する「スタンダードTTS
  • さらに機械学習の技術を駆使して、音調や読みやすさを向上させる「Neural TTS」。

Neuraltext to speechの改良の一例として、ニュースキャスターの音声があります。 その名の通り、ニュースキャスターのようにテキストを読み上げる。 これには、トーン、フロー、強調が含まれます。

Amazon Pollyはどの言語をサポートしていますか?

Pollyは22ヶ国語に対応しています。 その中で、アクセントや辞書が異なる。 例えば、英語には

  • アメリカ英語
  • カナディアンイングリッシュ
  • 英々語
  • インディアンイングリッシュ
  • 南アフリカ英語
  • ニュージーランド英語
  • ウェールズ語 英語

他のTranskriptorの代替品と比較すると、リストはそれほど大きくはありませんが、世界で最も人気のある言語をすべてカバーしています。

Amazon pollyのPricingとは?

Pollyの価格設定は、Googleと非常によく似ています。 有料サービスでは、月100万文字が4ドル、神経音声が16ドルとなっています。 より少ない金額で、1仕事あたり0.01ドルという価格も可能です。

Amazon Polly

Amazon PollyでText to Speechを使うには?

Amazon Pollyの音声合成の使い方を理解するのは難しくない。 手順は以下の通りです。

  1. AWSアカウントをまだお持ちでない場合は、設定してください。
  2. Amazon Pollyのページにログインします。
  3. テキスト入力ボックスにテキストを貼り付けます。 プレーンテキスト、またはSynthesis Markup Languageで、ピッチ、音量、発話速度などの制御が可能です。
  4. Pollyはテキストの音声ストリームを生成します。
  5. 次に、文章を読み上げる音声を選びます。 本文と同じ言語である必要があります(Pollyは翻訳サービスとしては機能しません)。
  6. 出力形式を選択し、ファイルをダウンロードします。

Amazon Pollyはどこで使えるのか?

Amazonでの音声合成の使い方がわかったら、次は音声ファイルの使い道について考えてみましょう。 例えば、以下のようなものがあります。

学習

講義や教材の読み上げなど、学習用途にPollyをご活用ください。 例えば、外国語アプリのDuolingoは、音声合成にAmazon Pollyを使っている。 発音が重要な場面であることを考えると、ポリーの音声合成サービスの質の高さが際立つと思います。

コンテンツ制作

音声合成はコンテンツ作成に役立つ。 例えば、ブログ記事をポッドキャストに変換したり、YouTube動画のナレーションを作成したりするのに使うことができます。 また、Webサイトのコンテンツを読み上げることで、視覚障がい者のアクセシビリティにも貢献できるかもしれません。

電話サービス

コンタクトセンターでは、従来から電話メニューに人工音声を使用していました。 本物そっくりの音声合成サービスを利用するメリットは、リアルな声を聴くことが好まれることです。 しかも、電話のメニューシステムにはそれほど多くのテキストがないため、セットアップのコストはかなり低く抑えられるでしょう。

Amazon Alexaで音声合成を利用する方法

Amazon Alexa

Alexaは、アマゾンの音声コマンドサービスです。 スマートスピーカー、テレビ、スマートフォンなど、さまざまなデバイスに内蔵されています。 Amazon Alexaで音声合成を利用する方法にはいくつかの選択肢がありますが、Pollyほど高度なものはありません。

Amazon Alexaのルーチンを設定する方法とは?

Amazon Alexaで音声合成を利用する方法として、ルーチンを設定する方法があります。 これらが起動すると、割り当てたテキストをAlexaが読み上げます。 例えば、朝や夜のルーティンに合わせて、ある言葉を発してもらうこともできます。 手順は以下の通りです。

  1. Alexアプリを開き、「その他」をタップし、「ルーチン」を選択します。
  2. Enter Routine Nameを選択し、入力する。
  3. こんなときは」をタップし、「音声」をタップします。
  4. ルーチンを開始したいコマンドを入力します。 例えば、「おはよう、アレクサ」。
  5. アクションを追加する」「Alexa Say」をタップします。
  6. カスタマイズをタップして、表示させたい内容を入力します。
  7. 保存」をタップします。

例えば、「おはよう、アレクサ」と言うと、「おはよう、デビッド」と返してくれるかもしれません。

Amazon Alexaをアプリで使うには?

また、サードパーティーのサービスをダウンロードする方法もあります。 ここでは、アプリを使ってAmazon Alexaで音声合成を利用する方法を紹介します。

  1. Alexaアプリを開き、「その他」をタップします。
  2. Skills & Gamesを選択し、検索します。
  3. Text to Voice」と入力し、「起動」をタップします。
  4. 次のメニューでAlexaデバイスを選択します。
  5. パソコンやスマートフォンで、文字入れサイトにアクセスする。
  6. Alexa、TTVに私の暗証番号を聞いて」と言う。 4桁のコードを読み上げてくれるので、それをWebサイトに入力します。
  7. 次のページで、Alexaに言わせたいことを入力します。
  8. 保存」をタップします。
  9. 最後に、『Alexa、TTVに話してもらう』と言ってください。 そうすると、入力した内容をAlexaが読み上げてくれます。

Alexaでの音声読み上げの欠点

Alexaを音声合成に使うことの欠点は、以下の通りです。

  • 以前に入力した内容しか表示されません。
  • 質問をするとウェブページの断片を読み上げますが、深い内容までは読み上げません。
  • 話す声の自由度はあまり高くない。
  • Pollyのように音声合成サービスとして明確にデザインされているわけではない。

Amazonで音声合成を利用する方法に関するFAQ

Amazonのテキストトゥスピーチは無料ですか?

Amazonの音声合成は無料ではありませんが、低価格です。 無料トライアルはありますが、有料サービスは0.01ドルからです。

Amazon Fireタブレットは音声読み上げ機能を備えていますか?

Fireタブレットの「クイックアクション」→「設定」を開くと、音声読み上げの設定をすることができます。 設定」メニューの「キーボードと言語」→「音声よみあげ」を選択します。

 

記事を共有する

最先端のAI

今すぐSpeaktorを始めましょう!

関連記事