টেক্সট-টু-স্পীচ (টিটিএস) এমন একটি প্রযুক্তি যা পাঠ্যকে প্রাকৃতিক-শব্দযুক্ত কণ্ঠে রূপান্তরিত করে। টেক্সট-টু-স্পিচ প্রযুক্তি 1968 সালে চালু করা হয়েছিল, কিন্তু সম্প্রতি পর্যন্ত এটি ব্যাপকভাবে গৃহীত হয়নি। এটি অতীতে শুধুমাত্র ব্যয়বহুল হার্ডওয়্যার ডিভাইসে উপলব্ধ ছিল, কিন্তু এখন এটি বেশিরভাগ কম্পিউটার এবং স্মার্টফোনে পাওয়া যাবে।
TTS ভয়েস জেনারেশনের ক্ষমতা ব্যবহার করে। এটি পাঠ্য ফাইলগুলি নেয় এবং সেগুলিকে বক্তৃতায় পরিণত করে। এটি কাস্টম ভয়েসও ব্যবহার করতে পারে।
TTS প্রোগ্রামগুলি সাধারণত ওয়েব অ্যাপ্লিকেশনের আকারে আসে। এগুলি ওয়েবে এবং মোবাইল ডিভাইসে অনলাইনে পাওয়া যায়৷ সুতরাং, মোবাইল অ্যাপস ডাউনলোড করুন অ্যান্ড্রয়েড অথবা iOS ডিভাইস শুরু করার একটি সহজ উপায়। অ্যাপ্লিকেশানগুলি ব্যবহার করা সহজ, এবং আপনি টিউটোরিয়াল ছাড়াই বক্তৃতাকে পাঠ্যে পরিণত করা শুরু করতে পারেন৷ Whatsmore, ব্যাকএন্ড সারা বিশ্বের বিভিন্ন ভাষা এবং কণ্ঠ সমর্থন করে, যেমন ইংরেজি, স্প্যানিশ, ইতালীয়, পর্তুগিজ ইত্যাদি।
কিভাবে TTS ব্যবহার করবেন?
অনেক প্ল্যাটফর্মে ভয়েসের জন্য পাঠ্য ব্যবহার করা সম্ভব। এটি অনেক প্ল্যাটফর্ম এবং অ্যাপে উপলব্ধ যেমন TikTok , Discord , Google Docs , Instagram , এবং আরও অনেক কিছু।
যে প্ল্যাটফর্মে আপনাকে টেক্সটকে ভয়েস-এ রূপান্তর করতে হবে তা নির্ধারণ করার পরে, আপনাকে এটি করা শুরু করার জন্য সাধারণ নির্দেশাবলী অনুসরণ করতে হবে। নির্দেশাবলী প্ল্যাটফর্মের উপর নির্ভর করে পরিবর্তিত হবে, কিন্তু তারা একই রকম।
বেশিরভাগ প্ল্যাটফর্মের সেটিংস পৃষ্ঠায় একটি অ্যাক্সেসিবিলিটি বিভাগ রয়েছে। এটিতে প্রবেশ করার পরে, আপনি “কথা বলার জন্য নির্বাচন করুন”, “পাঠ্য থেকে বক্তৃতা সক্ষম করুন”, “পাঠ্যের শব্দ সক্ষম করুন” বা “ভাষণের সংশ্লেষণ” নামের একটি সেটিং দেখতে পাবেন৷ এখান থেকে, আপনি আপনার পছন্দ মতো এবং প্ল্যাটফর্ম আপনাকে এটি করার অনুমতি দিয়ে TTS সেটিংস পরিবর্তন করতে পারেন।
কে TTS ব্যবহার করে?
টেক্সট টু স্পিচ প্রথম প্রিন্ট টেক্সট পড়তে অসুবিধা হয় এমন লোকেদের সাহায্য করার জন্য তৈরি করা হয়েছিল, কিন্তু তারপর থেকে এটি অন্যান্য অনেক ব্যবহারের জন্য অভিযোজিত হয়েছে।
TTS ব্যবহার করা যেতে পারে:
- দৃষ্টি প্রতিবন্ধী বা পড়ার অসুবিধা আছে এমন লোকেদের জন্য একটি অ্যাক্সেসযোগ্যতা সহায়তা
- কম্পিউটার বা মোবাইল ফোনের দৃষ্টি প্রতিবন্ধী ব্যবহারকারীদের জন্য একটি ভয়েস সহকারী
- অন্য ভাষা পড়তে বা শিখতে শেখার শিশুদের জন্য একটি শিক্ষামূলক ডিভাইস।
টেক্সট টু স্পিচ টেকনোলজি এমন কিছু হিসেবে ব্যবহার করা হয়েছিল যা শুধুমাত্র প্রযুক্তিগত তথ্যের সাহায্যে ব্যবহার করা যেতে পারে। কিন্তু আজকাল, TTS অ্যাপ্লিকেশনগুলি সাধারণত একটি চমৎকার গ্রাহক অভিজ্ঞতা প্রদান করে। এটি আরও কন্টেন্ট নির্মাতা, বহুভাষিক ছাত্র এবং ডিসলেক্সিক ব্যক্তিদের চাহিদা অনুযায়ী উচ্চ মানের অডিও ফাইল তৈরি করতে সক্ষম করে।
TTS বিভিন্ন গোষ্ঠীর দ্বারা ব্যবহৃত হয়, যেমন:
- দৃষ্টি প্রতিবন্ধী এবং শেখার অসুবিধায় ভুগছেন মানুষ
- ছাত্ররা
- অডিওবুক শ্রোতা
- বাক প্রতিবন্ধী মানুষ
দৃষ্টি প্রতিবন্ধী এবং শেখার অসুবিধায় ভুগছেন মানুষ
TTS-এর প্রাথমিক গ্রহণকারীরা ছিল দৃষ্টিশক্তি ও পাঠ প্রতিবন্ধী এবং কম সাক্ষরতার পাঠক। এই লোকেদের তাদের পর্দায় কী আছে তা পড়ার জন্য একজন মানুষের সহায়তার উপর নির্ভর করতে হয়েছিল। টিটিএসের আবির্ভাব এটিকে বদলে দিয়েছে। TTS এর মাধ্যমে, তারা তাদের জন্য পাঠ্য পড়তে একটি কম্পিউটার ব্যবহার করতে পারে। পাঠ্য থেকে বক্তৃতায় রূপান্তরটি রিয়েল-টাইমে করা হয় এবং স্ক্রিন রিডারগুলির বিকল্প হিসাবে ব্যবহার করা যেতে পারে।
ব্যবসা
tts সফ্টওয়্যার ব্যবহার করার প্রধান সুবিধাগুলির মধ্যে একটি হল গ্রাহকদের প্রতি এর বর্ধিত প্রতিক্রিয়াশীলতা। ফোনে গ্রাহক পরিষেবার জন্য সীমিত প্রাপ্যতা সহ মানুষের বিপরীতে, ব্যবসাগুলি স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে গ্রাহকদের সাথে 24/7 মিথস্ক্রিয়া পায়। অনেক ক্ষেত্রে, টিটিএস প্রযুক্তির অগ্রগতি প্রত্যাশিত সময়সীমার চেয়ে অনেক এগিয়ে ছিল যখন এই প্রযুক্তি কথা বলার পরিস্থিতিতে মানুষের কাজের সাথে প্রতিযোগিতা করতে সক্ষম হবে।
অনেক কোম্পানি তাদের গ্রাহক মিথস্ক্রিয়া স্বয়ংক্রিয় করতে এই প্রযুক্তি গ্রহণ করছে। এই প্রযুক্তির উচ্চ কর্মক্ষমতা এবং স্কেলেবিলিটি এটিকে ব্যবসার জন্য আকর্ষণীয় করে তোলে। তাদের যা করতে হবে তা হল তাদের পছন্দের একটি TTS API এর সাথে তাদের গ্রাহক পরিষেবা ইন্টারফেস সংযুক্ত করা।
ছাত্ররা
অডিও এবং ভিজ্যুয়াল ফর্ম্যাটে উপস্থাপিত হলে শিক্ষার্থীরা আরও তথ্য ধরে রাখে। এর কারণ হল মস্তিষ্ক তথ্যকে ভালোভাবে প্রক্রিয়া করে যখন এটি ভিন্নভাবে উপলব্ধি করে।
শ্রেণীকক্ষে, TTS প্রতিবন্ধী শিক্ষার্থীদের নতুন উপাদান শিখতে বা পুরানো উপাদান পর্যালোচনা করতে সাহায্য করতে পারে। যে সকল ছাত্র-ছাত্রীরা অন্ধ বা কম দৃষ্টিশক্তি আছে তারা লিখিত সামগ্রী অ্যাক্সেস করার জন্য TTS ব্যবহার করতে পারে যা তারা ব্রেইল বা বড় প্রিন্টে পড়তে সক্ষম নাও হতে পারে। উদাহরণস্বরূপ, যদি একজন শিক্ষার্থীর ডিসলেক্সিয়া থাকে এবং তিনি একটি বই থেকে উচ্চস্বরে পড়ছেন, তাহলে শিক্ষক টিটিএসের মাধ্যমে বইটির অডিও সংস্করণটি চালাতে পারেন, এবং শিক্ষার্থী উচ্চস্বরে পড়ার সাথে সাথে অনুসরণ করতে সক্ষম হবে। এটি অটিজমে আক্রান্ত শিক্ষার্থীদেরও সাহায্য করে যাদের সহপাঠীদের কাছ থেকে সামাজিক সংকেত পড়তে অসুবিধা হতে পারে।
দ্বিতীয় ভাষা হিসাবে ইংরেজি শেখার ছাত্ররা প্রায়ই কিভাবে কথা বলতে বা পড়তে হয় তা শিখে না। তারা টেক্সট-টু-স্পিচের মাধ্যমে আরও ভাল শিখতে পারে কারণ তারা তাদের উচ্চারণ অনুশীলন করতে পারে এবং একই সাথে কীভাবে পড়তে হয় তা শিখতে পারে।
TTS-এর মতো কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে, শিক্ষার্থীরা শিখতে পারে কীভাবে নতুন শব্দ আরও সঠিকভাবে উচ্চারণ করতে হয়। বিজ্ঞানীরা বলছেন যে এই অডিও পদ্ধতিটি আপনাকে দীর্ঘ সময়ের জন্য তথ্য মনে রাখতে সাহায্য করতে পারে, আপনার মস্তিষ্ককে ডেটা প্রক্রিয়া করতে এবং একই সাথে আপনার উচ্চারণ উন্নত করতে আরও সময় দেয়।
অডিওবুক শ্রোতা
সাম্প্রতিক বিশ্বব্যাপী ঘটনা বা প্রযুক্তির নতুন বিকাশের সাথে তাল মিলিয়ে রাখা কঠিন। তাই, অনেক লোক নিজেরা পড়ার পরিবর্তে অডিও সংবাদ এবং নিবন্ধগুলি শুনতে পছন্দ করে। কিছু ক্ষেত্রে, তারা কর্মক্ষেত্রে বা বাড়িতে মাল্টিটাস্ক করার সময় শুনতে পারে।
কিছু লোক পড়া শুনতে পছন্দ করে কারণ এটি আরও প্যাসিভ ক্রিয়াকলাপের মতো অনুভব করে এবং ততটা মানসিক শক্তি আকর্ষণ করে না। যদিও কিছু মানুষ এখনও নিজের জন্য পড়তে চান!
বিভিন্ন টিটিএস প্রযুক্তি কোম্পানি যেমন Speaktor এবং রিড স্পিকার সাশ্রয়ী মূল্যের মানের সরবরাহ করে।
প্রযুক্তি যা তাদের শ্রবণে সম্পূর্ণরূপে নিযুক্ত করে তা ব্যস্ত লোকেদের জন্য চমৎকার।
TTS জনপ্রিয়তা ক্রমশ বেড়েছে, কারণ লোকেরা বিভিন্ন চ্যানেলের মাধ্যমে পড়ার ঐতিহ্যবাহী মাধ্যম হিসেবে তাদের আগ্রহের বিষয় হতে পারে এমন খবরের সাথে পরিচিত হয়। এখানেই সাবস্ক্রিপশন আসে – আপনি মাসিক ফিতে একটি সাধারণ সাবস্ক্রিপশনের মাধ্যমে আপনার পডকাস্ট টিটিএস পাবেন।
টেক্সট টু স্পিচ কিভাবে কাজ করে?
টেক্সট টু স্পিচ যেকোনো টেক্সট ফাইলকে ইনপুট হিসেবে নেয় এবং ফলস্বরূপ স্পিচ ফাইল রিটার্ন করে। টিএক্সট-টু-স্পীচ প্রযুক্তি লিখিত পাঠকে সংশ্লেষিত ভয়েসে রূপান্তর করতে পারে। ফলাফল হল একটি কম্পিউটার-জেনারেটেড স্পিচ আউটপুট যা একই কথা বলার মতো একজন সত্যিকারের লোকের মতো শোনাচ্ছে।
ভয়েসের জন্য প্রাকৃতিক-শব্দযুক্ত পাঠ্যের জন্য সবচেয়ে সাধারণ ব্যবহার হল একটি অনলাইন পরিষেবার আকারে যা দৃষ্টি প্রতিবন্ধী বা পড়ার সমস্যাযুক্ত ব্যক্তিদের জন্য ওয়েব পৃষ্ঠা এবং নথিগুলি পড়ে৷ TTS বিভিন্ন সফ্টওয়্যার অ্যাপ্লিকেশন এবং ভিডিও গেমগুলির পাশাপাশি মোবাইল ফোন এবং অন্যান্য পোর্টেবল ডিভাইস যেমন ট্যাবলেট কম্পিউটার বা ই-বুক রিডারগুলিতেও রয়েছে৷
টেক্সট টু ভয়েস উদ্দেশ্য কি?
টেক্সট টু স্পিচ হল একটি মেশিন লার্নিং টুল যাদের ভাষা শিখতে হবে এবং যাদের অক্ষমতা আছে তাদের জন্য। আপনি এটি স্বয়ংক্রিয় করতে এবং কার্যগুলিতে কার্যকারিতা যুক্ত করতে ব্যবহার করতে পারেন। এটি লিখিত পাঠকে অডিওতে রূপান্তর করতে পারে যাতে প্রতিবন্ধী বা শেখার সমস্যাযুক্ত লোকেরা বিষয়বস্তু পড়তে এবং শুনতে পারে। টেক্সট-টু-স্পিচ সফ্টওয়্যার অন্ধ, বধির বা অন্যথায় অক্ষম ব্যক্তিদের জন্য সহায়ক প্রযুক্তি।
টেক্সট টু ভয়েস বিভিন্ন উপায়ে ব্যবহার করা যেতে পারে, যেমন স্বয়ংক্রিয় সিস্টেম, ই-লার্নিং এবং ওপেন সোর্স প্রকল্প। এগুলি এই প্রযুক্তির অনেকগুলি ব্যবহারের ক্ষেত্রে কিছু।
ই-লার্নিং এবং ওপেন-সোর্স প্রকল্পগুলির জন্য প্রক্রিয়াগুলি স্বয়ংক্রিয়ভাবে এবং টেমপ্লেট স্থাপন করার এটি একটি দুর্দান্ত উপায়। টেক্সট-টু-স্পীচ ইংরেজি উচ্চারণ এবং স্বর শেখানোর জন্য একটি কার্যকর হাতিয়ার হতে পারে।
টেক্সট টু স্পিচ টুলের বিভিন্ন প্রকার কি কি
পাঠ্য থেকে বক্তৃতা সরঞ্জামগুলির জন্য অনেকগুলি বিভিন্ন বিকল্প রয়েছে। এগুলি আপনার ফোনে বিল্ট-ইন টেক্সট টু স্পিচ এবং Google ডক্সের মতো ওয়েব-ভিত্তিক টুল সহ অনেকগুলি বিভিন্ন ফর্ম্যাটে উপলব্ধ, যা আপনি যা টাইপ করেন তা জোরে জোরে পড়তে পারে৷ এছাড়াও আপনি আপনার ফোনের জন্য একটি অ্যাপ ডাউনলোড করতে পারেন যা আপনার নির্বাচন করা যেকোনো নিবন্ধ বা পাঠ্য জোরে জোরে পড়বে:
অন্তর্নির্মিত পাঠ্য থেকে বক্তৃতা
অনেক ডিভাইসে অন্তর্নির্মিত TTS টুল রয়েছে । কিছু জনপ্রিয় টেক্সট টু স্পিচ টুলের মধ্যে রয়েছে Siri, Google Assistant, এবং Amazon Alexa।
ওয়েব-ভিত্তিক টুল: বিভিন্ন ওয়েব-ভিত্তিক টুল আমাদেরকে টেক্সটকে অডিও ফাইলে রূপান্তর করতে সাহায্য করতে পারে বা ভয়েস সিন্থেসাইজার যেমন Google ডক্স বা মাইক্রোসফ্ট ওয়ার্ড অনলাইনের মাধ্যমে জোরে জোরে কন্টেন্ট পড়তে পারে।
টেক্সট-টু-স্পিচ অ্যাপস: বাচ্চারা স্মার্টফোন এবং ডিজিটাল ট্যাবলেটেও TTS অ্যাপ ডাউনলোড করতে পারে। এই অ্যাপগুলিতে প্রায়শই বিভিন্ন রঙে টেক্সট হাইলাইট করা এবং ওসিআরের মতো বিশেষ বৈশিষ্ট্য থাকে। কিছু উদাহরণের মধ্যে রয়েছে ভয়েস ড্রিম রিডার, ক্লারো স্ক্যানপেন এবং অফিস লেন্স।
ক্রোম টুলস: ক্রোম ওয়েব স্টোরের বিভিন্ন এক্সটেনশন রয়েছে যা ওয়েবসাইটগুলিকে স্পীসে রূপান্তর করতে এবং সেগুলি পড়তে সাহায্য করতে পারে৷ এই ক্রোম এক্সটেনশনগুলি আপনার জন্য নিখুঁত হতে পারে যদি আপনার প্রচুর পড়া থাকে এবং আপনি আপনার চোখকে চাপ দিতে না চান।
টেক্সট-টু-স্পিচ সফটওয়্যার প্রোগ্রাম
টেক্সট-টু-স্পিচ সফ্টওয়্যার প্রোগ্রামগুলি পাঠ্যকে অডিও ফাইলে রূপান্তর করার একটি দুর্দান্ত উপায়। এছাড়াও বিভিন্ন ধরনের সফ্টওয়্যার টুল রয়েছে যা আমাদের পাঠ্যকে অডিও ফাইলে রূপান্তর করতে সাহায্য করতে পারে। Speaktor হল একটি বিনামূল্যের, ওয়েব-ভিত্তিক সাস (একটি পরিষেবা হিসাবে সফ্টওয়্যার) যা লিখিত পাঠ্য থেকে অডিও ফাইল তৈরি করতে পারে। এটি ট্রান্সক্রিপশন এবং স্পিচ রিকগনিশনের মতো অন্যান্য সরঞ্জামগুলির সাথেও আসে।
টেক্সট টু স্পিচ সবচেয়ে সাধারণ ব্যবহার কি কি
TTS প্রযুক্তি পঠন-অক্ষমতা এবং দৃষ্টি প্রতিবন্ধী ব্যক্তিদের সাহায্য করে, বোধগম্যতা এবং ব্যস্ততা বাড়ায় এবং ভাষা শেখার সুবিধা দেয়।
ভার্চুয়াল সহকারী
স্মার্ট স্পিকার এবং ভার্চুয়াল সহকারী হল পাঠ্য থেকে বক্তৃতার সবচেয়ে সাধারণ ব্যবহার। এর মধ্যে রয়েছে সিরি, কর্টানা এবং অ্যামাজন অ্যালেক্সা।
ই-বুক পাঠক
কিছু সর্বাধিক বিক্রিত ইবুক পাঠকের পাঠ্য থেকে বক্তৃতা ক্ষমতা রয়েছে। এটি শুধুমাত্র দৃষ্টি প্রতিবন্ধী ব্যবহারকারীদের জন্যই একটি ভাল বৈশিষ্ট্য নয়, এটি পাঠকদের জন্য শব্দভান্ডার প্রশিক্ষণ এবং যারা চান বা সক্ষমতা প্রয়োজন তাদের সাথে কথা বলার একটি কার্যকর উপায়ও হতে পারে। টেক্সট টু স্পিচ প্রযুক্তি কয়েক দশক ধরে চলে আসছে, কিন্তু এটি সম্প্রতি অডিওবুক এবং কিন্ডলের মতো ডিজিটাল পাঠকদের আবির্ভাবের সাথে জনপ্রিয় হয়ে উঠেছে।
ওয়ার্ড প্রসেসর
প্রায়শই, এটি লেখকদের তাদের বিষয়বস্তু উচ্চস্বরে “শুনতে” সাহায্য করে। টেক্সট টু ভয়েস ফাংশন যেকোনো ওয়ার্ড প্রসেসরের জন্য একটি উপযুক্ত সংযোজন হতে পারে। মাইক্রোসফ্ট ওয়ার্ড ব্যাপক, এবং “পড়ুন জোরে” ফাংশন সহ, এই ওয়ার্ড প্রসেসর আপনাকে কৃত্রিম সামগ্রী তৈরি করতে দেয়।
কম্পিউটার অপারেটিং সিস্টেম
উন্নত ভয়েস রিকগনিশন সফ্টওয়্যার উন্নত হতে চলেছে, তাই ল্যাপটপ এবং ফোন নির্মাতারা তাদের মডেলগুলিকে অন-স্ক্রিন পাঠ্য পাঠক বা সহকারী দিয়ে সজ্জিত করে৷ আপনি Windows-এ “Ease of Access” সেটিংস মেনুতে Narrator চালু করতে পারেন। এই বৈশিষ্ট্যটি চালু থাকলে, আপনার ডিভাইসের অডিও চালু থাকা অবস্থায় এটি আপনাকে পাঠ্য পাঠ করবে।
এখন আপনি সহজেই Speaktor দিয়ে টেক্সটকে স্পিচে কনভার্ট করতে পারবেন। বিনামূল্যে শুরু করুন!
টেক্সট টু স্পিচের অ্যাপ্লিকেশন সম্পর্কে আরও পড়া
Text to Speech সম্পর্কিত প্রায়শ জিজ্ঞাস্য প্রশ্নাবলী
লিখিত পাঠকে বক্তৃতায় রূপান্তর করতে ব্যবহৃত প্রযুক্তি কী?
টিটিএস (টেক্সট টু স্পিচ) একটি প্রযুক্তির নাম যা পাঠ্যকে বক্তৃতায় রূপান্তর করে।
টেক্সট থেকে স্পিচ এবং স্পিচ-টু-টেক্সটের মধ্যে পার্থক্য কী?
টেক্সট টু স্পিচ লিখিত টেক্সট থেকে একটি স্পিচ ফাইল তৈরি করতে স্পিচ সংশ্লেষণ ব্যবহার করে। অন্যদিকে, স্পিচ টু টেক্সট স্পিচ ফাইল ট্রান্সক্রাইব করতে এবং সেগুলিকে টেক্সটে পরিণত করতে স্পিচ রিকগনিশন ব্যবহার করে।