× ই-পেপার প্রচ্ছদ সর্বশেষ বাংলাদেশ রাজনীতি দেশজুড়ে বিশ্বজুড়ে বাণিজ্য খেলা বিনোদন মতামত চাকরি শিক্ষা ধর্ম ফিচার ভিডিও সকল বিভাগ ছবি ভিডিও লেখক আর্কাইভ কনভার্টার

প্রযুক্তিতে বাংলা ভাষা সহজ করতে ভয়েস ডাটা ডোনেটের আহ্বান

প্রবা প্রতিবেদক

প্রকাশ : ০৬ এপ্রিল ২০২৫ ২০:০৪ পিএম

ছবি : সংগৃহীত

ছবি : সংগৃহীত

প্রযুক্তিতে বাংলা ভাষাকে আরও সহজ করতে মানসম্মত এবং স্বয়ংসম্পূর্ণ একটি উন্মুক্ত বাংলা অডিও ডাটাসেট তৈরির উদ্যোগ নেয়া হয়েছে। প্রযুক্তির নানা মাধ্যমে বাংলাকে শক্তিশালী করার এই উদ্যোগ নিয়েছে 'ডাটা এলিসিয়াম সফটওয়্যার ইনক' নামে একটি প্রতিষ্ঠান। ইতোমধ্যে 'দ্য বাবেল ম্যাস' নামে একটি প্রকল্পের আওতায় তারা ভয়েস ডাটা সংগ্রহ শুরু করেছে। এই উদ্যোগে যুক্ত হয়েছেন বিশ্ববিদ্যালয় শিক্ষক, গবেষক ও কনটেন্ট ক্রিয়েটরসহ প্রযুক্তি সংশ্লিষ্ট ব্যক্তিরা।

সংশ্লিষ্টরা বলছেন, বাংলা ভাষা বিশ্বের সপ্তম সর্বাধিক ব্যবহৃত ভাষা হলেও প্রযুক্তি ক্ষেত্রে এটি এখনো পিছিয়ে রয়েছে। বিশ্বজুড়ে অন্যান্য ভাষার জন্য উন্নত ভয়েস রিকগনিশন এবং টেক্সট-টু-স্পিচ প্রযুক্তি তৈরি হলেও বাংলার ক্ষেত্রে তেমন উন্নতি হয়নি। এই সমস্যা সমাধানে, 'ডাটা এলিসিয়াম সফটওয়্যার ইনক' অলাভজনক এই উদ্যোগ গ্রহণ করেছে। তাদের লক্ষ্য বাংলার ভয়েস ডাটা সংগ্রহ এবং সেটি উন্মুক্ত করে দেওয়ার মাধ্যমে একটি শক্তিশালী প্ল্যাটফর্ম তৈরি করা।

দ্য বাবেল ম্যাস প্রকল্পের সংগঠক মিরাজ রেজা গণমাধ্যমকে বলেন, আমরা বাংলা ভাষার প্রতি দায়বদ্ধতা থেকে এই উদ্যোগ গ্রহণ করেছি। কিন্তু এই উদ্যোগকে সফল করতে বাংলা ভাষাভাষীদের অংশগ্রহণ প্রয়োজন। এই প্রজেক্টটি থাকবে সম্পূর্ণরূপে ওপেন সোর্স এবং সকল শ্রেণির মানুষের অংশগ্রহণের মাধ্যম। আমরা মোজিলা কমন ভয়েস প্ল্যাটফর্মে বাংলা ভাষার ভয়েস ডাটা সংগ্রহ করছি। এই উদ্যোগ সফল করতে অন্তত ১ লাখ ঘণ্টার ভয়েস ডেটা প্রয়োজন। আপনার ভয়েস ডাটা ডোনেট করুন এবং বাংলার প্রযুক্তিগত অগ্রগতিতে অংশ নিন।

জানা গেছে,  এই উদ্যোগ সফল হলে মাধ্যমে ভয়েস ডাটা ব্যবহার করে স্বয়ংক্রিয় ভয়েস রিকগনিশন সিস্টেম তৈরি করা যাবে। এটি ভার্চুয়াল অ্যাসিস্ট্যান্ট, কল সেন্টার অটোমেশন এবং ভয়েস-চালিত অ্যাপ্লিকেশন উন্নয়নে সহায়ক হবে। এছাড়াও গ্রামীণ অঞ্চলের মানুষ, যারা ইংরেজি জানে না, তাদের জন্য ভয়েস-চালিত অ্যাপ্লিকেশন সহজ হবে। বাংলা ভাষা আন্তর্জাতিক পর্যায়ে আরও বেশি অন্তর্ভুক্ত হবে, যেমন গুগল, অ্যামাজন বা মাইক্রোসফটের মতো প্ল্যাটফর্মে।  অন্যদিকে কম রিসোর্সভিত্তিক ভাষা হিসেবে বাংলা ভাষার গবেষণার সুযোগ বাড়বে। এটি বিশ্বজুড়ে গবেষক, ডেভেলপার এবং প্রযুক্তি সংশ্লিষ্ট প্রতিষ্ঠানের জন্য উন্মুক্ত থাকবে।

যেভাবে ভয়েস ডাটা ডোনেট করবেন: প্রথমে https://commonvoice.mozilla.org/bn ওয়েবসাইটে গিয়ে একটি একাউন্ট খুলতে হবে। পরবর্তী ধাপে ভয়েস রেকর্ড করুন অথবা অন্যের রেকর্ড ভেরিফাই করুন। ডাটা ডোনেটের এই প্রক্রিয়ার মধ্যে রয়েছে, স্পিকিং, লিসেনিং, রাইটিং ও রিসার্চ কাজের জন্যে ডাটাসেট ডাউনলোড করা।

স্পিকিং: হোম পেজ থেকে “Speaking” এ ক্লিক করলেই ভয়েস ডাটা ইনপুট দেয়ার ইন্টারফেস চলে আসবে। ইনপুট দেয়ার জন্য মাইক্রোফোন আইকনে ক্লিক করে, স্ক্রিনে দেয়া টেক্সট ডাটা স্পষ্ট ও সাবলীলভাবে বলতে হবে। প্রতি ভয়েস ইনপুটের জন্য ইউজারকে পয়েন্ট দেয়া হবে। লিসেনিং: হোম পেজে “Listen” বাটনে ক্লিক করলে ডাটা ভেরিফিকেশন বাই লিসেনিং সেগমেন্টটা চলে আসবে। প্লে বাটনে ক্লিক করে স্ক্রিনে দেয়া টেক্সট আর ভয়েস ডাটার মধ্যে সামঞ্জস্য চেক করার মাধ্যমে ডাটা ভেরিফিকেশন করতে হবে। রাইটিং: রাইটিং সেগমেন্ট ২টা ভাগে বিভক্ত। প্রথম সেগমেন্টে ইউজার ভয়েস ডাটা ইনপুটের জন্য প্রয়োজনীয় টেক্সট ইনপুট নেয়া হয়। আর দ্বিতীয় সেগমেন্টে ইউজারকে বেশ কিছু শর্তের এগেইন্সটে চেক করতে হবে যে টেক্সট ডাটা সঠিকভাবে দেয়া আছে কিনা।

শেয়ার করুন-

মন্তব্য করুন

Protidiner Bangladesh

ভারপ্রাপ্ত সম্পাদক : মোরছালীন বাবলা

প্রকাশক : কাউসার আহমেদ অপু

রংধনু কর্পোরেট, ক- ২৭১ (১০ম তলা) ব্লক-সি, প্রগতি সরণি, কুড়িল (বিশ্বরোড) ঢাকা -১২২৯

যোগাযোগ

প্রধান কার্যালয়: +৮৮০৯৬১১৬৭৭৬৯৬ । ই-মেইল: [email protected]

বিজ্ঞাপন (প্রিন্ট): ই-মেইল: [email protected]

বিজ্ঞাপন (অনলাইন): +৮৮০১৭৯৯৪৪৯৫৫৯ । ই-মেইল: [email protected]

সার্কুলেশন: +৮৮০১৭১২০৩৩৭১৫ । ই-মেইল: [email protected]

বিজ্ঞাপন মূল্য তালিকা