לאמזון יש תוכנה קניינית כמעט לכל מקרה שימוש. דוגמה לכך היא שוק הטקסט לדיבור, שיש לו לפחות 2 אפשרויות.
במאמר זה תלמדו כיצד להשתמש בטקסט לדיבור באמזון Amazon 2 הפתרונות שלה: פולי ואלקסה.
מה זה Amazon Polly?
Amazon Polly היא מחולל הדיבור האמיתי של החברה. כמו בטכנולוגיה של גוגל, ישנן 2 רמות עיקריות:
- TTS סטנדרטי, המשתמש ב-AI ולמידה עמוקה כדי לסנתז קולות מציאותיים במגוון שפות
- Neural TTS, המשתמשת בטכניקות נוספות של למידת מכונה כדי לשפר את איכות הטון ואיכות הקריאה.
דוגמה אחת לשיפור הטקסט העצבי לדיבור היא קולו של מגיש החדשות. כפי שהשם מרמז, הוא קורא טקסט בסגנון של מגיש חדשות. זה כולל טון, זרימה והדגשה.
באילו שפות אמזון פולי Amazon Polly?
פולי תומך ב-22 שפות. בתוך אלה יש מבטאים ומילונים שונים. לדוגמה, אנגלית כוללת:
- אנגלית אמריקאית
- אנגלית קנדית
- אנגלית בריטית
- אנגלית הודית
- אנגלית דרום אפריקאית
- אנגלית ניו זילנדית
- אנגלית וולשית
למרות שהרשימה אינה גדולה כמו כמה חלופות Transkriptor אחרות, היא מכסה את כל השפות הפופולריות ביותר בעולם.
מה התמחור של פולי Amazon?
התמחור של פולי דומה מאוד לזה של גוגל. שירות ה-pay as you go כולל מיליון תווים בחודש תמורת 4 דולר, או 16 דולר עבור הקולות העצביים. אתה יכול לשלם על פחות, והמחירים יכולים להגיע עד $0.01 למשרה.
כיצד להשתמש בטקסט לדיבור עם Amazon Polly?
להבין כיצד להשתמש בטקסט לדיבור באמזון פולי זה לא קשה. השלבים הם כדלקמן:
- הגדר חשבון AWS אם עדיין אין לך אחד.
- היכנס לדף Amazon Polly.
- הדבק את הטקסט שלך בתיבת קלט הטקסט. אתה יכול לעשות זאת כטקסט רגיל או Synthesis Markup Language, המאפשרת לך לשלוט בהיבטים כגון גובה הצליל, עוצמת הקול וקצב הדיבור.
- פולי תיצור זרם שמע של הטקסט.
- לאחר מכן, בחר את הקול שאתה רוצה לקרוא את הטקסט שלך. זה חייב להיות באותה שפה כמו הטקסט (פולי לא עובדת כשירות תרגום).
- בחר את פורמט הפלט שלך והורד את הקובץ.
היכן ניתן להשתמש בפולי אמזון?
ברגע שאתה יודע איך להשתמש בטקסט לדיבור באמזון, כדאי לחשוב היכן תוכל להשתמש בקבצי האודיו. כמה דוגמאות כוללות:
לְמִידָה
אתה יכול להשתמש בפולי כדי לקרוא הרצאות ומסמכי הוראה, או ליישומי למידה אחרים. לדוגמה, אפליקציית השפה הזרה Duolingo משתמשת באמזון פולי לטקסט לדיבור שלה. בהתחשב בעובדה שזהו מצב שבו הגייה חיונית, היא צריכה להדגיש את האיכות של שירות הטקסט לדיבור של פולי.
יצירת תוכן
טקסט לדיבור מועיל ליצירת תוכן. לדוגמה, אתה יכול להשתמש בו כדי להמיר פוסט בבלוג לפודקאסט או כדי ליצור קריינות לסרטון YouTube. זה יכול גם לעזור עם נגישות לאנשים לקויי ראייה על ידי קריאת תוכן האתר.
שירותי טלפון
מרכזי קשר השתמשו זה מכבר בקולות מלאכותיים לתפריטי הטלפון שלהם. היתרון בשימוש בשירות טקסט לדיבור אמיתי הוא שאנשים מעדיפים להקשיב לקולות מציאותיים. בנוסף, עלות ההתקנה תהיה נמוכה למדי מכיוון שאין כל כך הרבה טקסט במערכת תפריטים טלפונית.
Alexa הוא Amazon's הפקודה הקולית של אמזון. הוא מובנה במגוון מכשירים, כולל רמקולים חכמים, טלוויזיות, סמארטפונים ועוד. ישנן כמה אפשרויות לשימוש בטקסט לדיבור ב-Amazon Alexa, אם כי אף אחת מהן אינה מתקדמת כמו "פולי".
כיצד להגדיר שגרות Amazon Alexa?
אפשרות אחת כיצד להשתמש בטקסט לדיבור ב-Amazon Alexa היא להגדיר שגרות. כאשר אלה יופעלו, אלקסה תקריא את הטקסט שהקצית. לדוגמה, אתה יכול לגרום לזה לומר דברים מסוימים לשגרת הבוקר או הלילה שלך. השלבים הם כדלקמן:
- פתח את אפליקציית Alex, הקש על עוד ובחר רוטינות.
- בחר הזן שם שגרה והקלד אותו.
- הקש על כשזה קורה ואז על קול.
- הקלד את הפקודה שברצונך להתחיל את השגרה. לדוגמה, "בוקר טוב, אלכסה".
- הקש על הוסף פעולה ו-Alexa Say.
- הקש על מותאם אישית והקלד את מה שאתה רוצה שיגיד.
- הקש על שמור.
לדוגמה, כשאתה אומר "בוקר טוב, אלכסה", הוא עשוי להשיב, "בוקר טוב, דיוויד".
כיצד להשתמש ב-Amazon Alexa דרך אפליקציה?
אפשרות נוספת היא להוריד שירות של צד שלישי. הנה איך להשתמש בטקסט לדיבור ב-Amazon Alexa באמצעות אפליקציה.
- פתח את אפליקציית Alexa והקש על עוד.
- בחר מיומנויות ומשחקים וחפש.
- הקלד טקסט לקול והקש על הפעל.
- בחר את מכשיר Alexa שלך בתפריט הבא.
- במחשב או בטלפון חכם, בקר באתר טקסט לקול .
- אמור, "אלכסה, בקש מ-TTV את ה-PIN שלי". זה יקרא לך קוד בן 4 ספרות, אותו תקליד באתר.
- בעמוד הבא, הקלד את מה שאתה רוצה שאלקסה תגיד.
- הקש על שמור.
- לבסוף, אמור, 'אלכסה, תבקשי מ-TTV לדבר". פעולה זו תגרום לאלקסה לקרוא את מה שהקלדת.
החסרונות של טקסט לדיבור ב-Alexa
החסרונות של השימוש באלקסה לטקסט לדיבור הם:
- זה יגיד רק את מה שהקלדת בעבר.
- למרות שהוא יקרא קטעים של דפי אינטרנט כאשר אתה שואל שאלה, הוא לא יקרא שום דבר מעמיק.
- אין לך גמישות רבה ביחס לקול שהוא מדבר בו.
- זה לא תוכנן במפורש כשירות טקסט לדיבור באותו אופן כמו פולי.