Come utilizzare il text to speech su Amazon nel 2022

Abilitazione della funzione text-to-speech su Amazon
Abilitazione della funzione text-to-speech su Amazon

Speaktor 2023-07-13

Amazon ha un software proprietario per quasi tutti i casi d’uso. Un esempio è il mercato del text to speech, che presenta almeno 2 opzioni.

In questo articolo scoprirete come utilizzare il text to speech su Amazon utilizzando le sue due soluzioni: Polly e Alexa.

Che cos’è Amazon Polly?

Amazon Polly è il generatore vocale realistico dell’azienda. Come per la tecnologia di Google, esistono due livelli principali:

  • TTS standard, che utilizza l’intelligenza artificiale e l’apprendimento profondo per sintetizzare voci realistiche in una gamma di lingue.
  • Neural TTS, che utilizza ulteriori tecniche di apprendimento automatico per migliorare il tono e la qualità della lettura.

Un esempio del miglioramento del text to speech neurale è la voce dei giornalisti. Come suggerisce il nome, legge il testo nello stile di un notiziario. Questo include il tono, il flusso e l’enfasi.

Quali lingue supporta Amazon Polly?

Polly supporta 22 lingue. All’interno di questi ci sono diversi accenti e dizionari. Ad esempio, l’inglese comprende:

  • Inglese americano
  • Inglese canadese
  • Inglese britannico
  • Inglese indiano
  • Inglese sudafricano
  • Inglese neozelandese
  • Gallese Inglese

Sebbene l’elenco non sia così ampio come quello di altre alternative di Transkriptor , copre tutte le lingue più diffuse nel mondo.

Qual è il prezzo di Amazon Polly?

I prezzi di Polly sono molto simili a quelli di Google. Il servizio pay as you go comprende 1 milione di caratteri al mese per 4 dollari, o 16 dollari per le voci neurali. È possibile pagare di meno e i prezzi possono essere anche solo di 0,01 dollari per lavoro.

Amazon Polly

Come utilizzare la funzione Text to Speech con Amazon Polly?

Capire come usare il text to speech su Amazon Polly non è difficile. I passaggi sono i seguenti:

  1. Create un account AWS, se non ne avete già uno.
  2. Accedere alla pagina Amazon Polly.
  3. Incollare il testo nella casella di immissione del testo. È possibile farlo come testo semplice o come Synthesis Markup Language, che consente di controllare aspetti quali l’intonazione, il volume e la velocità del parlato.
  4. Polly genererà un flusso audio del testo.
  5. Quindi, scegliere la voce che si desidera leggere il testo. Deve essere nella stessa lingua del testo (Polly non funziona come servizio di traduzione).
  6. Scegliere il formato di output e scaricare il file.

Dove si può usare Amazon Polly?

Una volta appreso come utilizzare il text to speech su Amazon, vale la pena di pensare a dove utilizzare i file audio. Alcuni esempi sono:

Apprendimento

Potete usare Polly per leggere lezioni e documenti didattici o per altre applicazioni di apprendimento. Ad esempio, l’applicazione per le lingue straniere Duolingo utilizza Amazon Polly per il text-to-speech. Considerando che si tratta di una situazione in cui la pronuncia è di vitale importanza, questo dovrebbe evidenziare la qualità del servizio text to speech di Polly.

Creazione di contenuti

Il text to speech è utile per la creazione di contenuti. Ad esempio, si può usare per convertire un post del blog in un podcast o per creare una voce fuori campo per un video di YouTube. Potrebbe anche contribuire all’accessibilità per le persone ipovedenti, leggendo i contenuti del sito web.

Servizi telefonici

I contact center utilizzano da tempo voci artificiali per i loro menu telefonici. Il vantaggio di utilizzare un servizio di sintesi vocale realistico è che le persone preferiscono ascoltare voci realistiche. Inoltre, il costo di installazione sarebbe piuttosto basso, perché un sistema di menu telefonico non contiene molto testo.

Amazon Alexa

Alexa è il servizio di comando vocale di Amazon. È integrato in una serie di dispositivi, tra cui altoparlanti intelligenti, TV, smartphone e altro ancora. Esistono alcune opzioni per utilizzare la sintesi vocale su Amazon Alexa, anche se nessuna è avanzata come Polly.

Come impostare le routine di Amazon Alexa?

Un’opzione per utilizzare la sintesi vocale su Amazon Alexa è quella di impostare delle routine. Quando si attivano, Alexa leggerà il testo assegnato. Ad esempio, si può fargli dire determinate cose per la routine mattutina o serale. I passaggi sono i seguenti:

  1. Aprire l’app Alex, toccare Altro e selezionare Routine.
  2. Selezionare Inserire il nome della routine e digitarlo.
  3. Toccare Quando questo accade e poi Voce.
  4. Digitare il comando che si desidera avviare la routine. Ad esempio, “Buongiorno, Alexa”.
  5. Toccare Aggiungi azione e Alexa Say.
  6. Toccare Personalizzato e digitare la dicitura desiderata.
  7. Toccare Salva.

Ad esempio, quando si dice “Buongiorno, Alexa”, potrebbe rispondere “Buongiorno, David”.

Come utilizzare Amazon Alexa attraverso un’app?

Un’altra opzione è quella di scaricare un servizio di terze parti. Ecco come utilizzare la sintesi vocale su Amazon Alexa tramite un’app.

  1. Aprire l’app Alexa e toccare Altro.
  2. Selezionare Abilità e giochi e cercare.
  3. Digitare Testo in voce e toccare Avvia.
  4. Selezionare il dispositivo Alexa nel seguente menu.
  5. Da un computer o da uno smartphone, visitate il sito web di text-to-voice .
  6. Dite: “Alexa, chiedi a TTV il mio PIN”. Vi leggerà un codice di 4 cifre, che dovrete digitare nel sito web.
  7. Nella pagina successiva, digitate ciò che volete che Alexa dica.
  8. Toccare Salva.
  9. Infine, dite: “Alexa, chiedi a TTV di parlare”. In questo modo Alexa leggerà ciò che avete digitato.

Svantaggi della sintesi vocale su Alexa

Gli svantaggi dell’utilizzo di Alexa per il text to speech sono:

  • Verrà visualizzato solo ciò che è stato digitato in precedenza.
  • Sebbene legga frammenti di pagine web quando si pone una domanda, non legge nulla di approfondito.
  • Non avete molta flessibilità sulla voce con cui parla.
  • Non è stato progettato esplicitamente come servizio di sintesi vocale, come Polly.

Condividi post

Sintesi vocale

img

Speaktor

Converti il testo in voce e leggi ad alta voce