এআই-র সাহায্যে ভারতে ১২১ ভাষার ডেটাবেস হচ্ছে
০৮ ডিসেম্বর ২০২৩, ১২:৪০ পিএম | আপডেট: ০৮ ডিসেম্বর ২০২৩, ১২:৪০ পিএম
ভারতে চালু ১২১টি ভাষার মানুষের কাছে অনুবাদের মাধ্যমে পৌঁছে যাবে যে কোনো তথ্য। ইংরেজির উপর নির্ভরশীলতা কমবে।
দক্ষিণ ভারতের রাজ্য কর্ণাটকের একটি গ্রামের মানুষ কয়েক সপ্তাহ ধরে একটার পর একটা বাক্য কন্নড় ভাষায় বলে যাচ্ছিলেন। আর তা একটি অ্যাপে তুলে নেয়া হচ্ছিল। এই অ্যাপটি হলো টিবি-র জন্য দেশের প্রথম কৃত্রিম মেধা বা এআই-ভিত্তিক চ্যাটবট।
ভারতে চার কোটি মানুষ কন্নড় বলেন। দেশের ২২টি স্বীকৃত সরকারি ভাষার মধ্যে কন্নড় একটি। ভারতে এমন ১২১টি ভাষা আছে, যা ১০ হাজার বা তার বেশি মানুষ ব্যবহার করেন। কিন্তু খুব কম ভাষাই ন্যাচরাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি)-তে আছে।
এনএলপি হলো এআই-এর একটি শাখা, যার মাধ্যমে কম্পিউটার কথ্য ও লিখিত ভাষা বুঝতে পারে। তাই এনএলপি-তে তথ্য না থাকলে সেই ভাষাকে কম্পিউটার বা নেটবাহিত বিভিন্ন মাধ্যম মানুষের কাছে পৌঁছে দিতে পারে না। ফলে কোটি কোটি ভারতীয় নিজের ভাষায় প্রয়োজনীয় তথ্য জানা থেকে বঞ্চিত হচ্ছেন এবং আর্থিক সুবিধাও পাচ্ছেন না।
এবার এই খামতিটুকু দূর করতে উদ্যোগী হয়েছে, মাইক্রোসফট, গুগলের মতো সংস্থাগুলি। তারা ১২১টি ভারতীয় ভাষায় লিখিত ও কথ্য ডেটা সংগ্রহ করছে, যার মাধ্যমে নিজের ভাষায় সব তথ্য ভারতীয়দের কাছে পৌঁছে যায়।
মাইক্রোসফট রিসার্চ ইন্ডিয়ার প্রধান গবেষক কালিকা বালি বলেছেন, ‘কৃত্রিম মেধাভিত্তিক টুলগুলিকে যদি সকলের কাছে পৌঁছাতে হয়, তাহলে ইংরেজি, ফরাসি, স্প্যানিশ ভাষার বাইরের মানুষদের কাছে যেতে হবে।’ কালিকা জানিয়েছেন, ‘ভারতীয় ভাষাগুলির যদি বিশাল ডেটাবেস তৈরি করতে হয়, তাহলে ১০ বছর সময় লেগে যাবে। তাই আমরা পর্যায়ক্রমে কাজটা করতে পারি। চ্যাটজিপিটি ও লামার মতো এআই মডেলের সাহায্যে তা করা সম্ভব।’
মাইক্রোসফট বা গুগলের জন্য ডেটা বা তথ্য সংগ্রহ করছে টেক ফার্ম কারিয়া। কর্ণাটকের ওই গ্রামের মানুষের মতো বিভিন্ন জায়গায় মানুষরা তাদের ভাষায় সমানে কথা বলছেন। তা রেকর্ড করা হচ্ছে। পরে শিক্ষা, স্বাস্থ্য ও অন্য পরিষেবার ক্ষেত্রে এই তথ্য ব্যবহার করবে কৃত্রিম মেধা ভিত্তিক টুলগুলি।
ভারত সরকারও চাইছে, ডিজিটালি আরো বেশি পরিষেবা মানুষের কাছে পৌঁছে দিতে। তারাও একটা ভাষার তথ্যভাণ্ডার গড়ে তুলতে চাইছে। এআইয়ের মাধ্যমে ভাষা অনুবাদ ব্যবস্থা ভাষিনী টুলের মাধ্যমে তারা করতে চাইছে। এর ফলে এআই টুল তৈরির জন্য স্থানীয় ভাষায় ওপেন ডেটা সোর্স তৈরি থাকছে।
এই প্ল্যাটফর্মে অংশ নেয়ার জন্য মানুষকে এগিয়ে আসতে বলা হচ্ছে। তারা নিজের ভাষায় বাক্য বলছেন। টেক্সট অনুবাদ করছেন। ভাষিনীতে কয়েক লাখ ভারতীয় অংশ নিয়েছেন। মুম্বাইয়ের কম্পিউটেশন ফর ইন্ডিয়ান ল্যাঙ্গুয়েজ টেকনলজি ল্যাবের প্রধান পুষ্পক ভট্টাচার্য বলেছেন, ‘সরকার বিভিন্ন ভারতীয় ভাষায় ডেটা সেট তৈরির কাজে খুবই গুরুত্ব দিচ্ছে। শিক্ষা, পর্যটন ও আদালতে এই অনুবাদ টুলগুলির ব্যবহার শুরু হয়ে গেছে।’
তিনি জানিয়েছেন, ‘এর মধ্যে চ্যালেঞ্জও আছে। অনেক ভারতীয় ভাষায় কথা বলার একটা ঐতিহ্য আছে, কিন্তু ইলেকট্রনিক রেকর্ড বেশি নেই। তাছাড়া প্রচুর কোড মিক্সিং আছে। তাছাড়া যে সব ভাষা খুব প্রচলিত নয় বা খুব বেশি মানুষ কথা বলেন না, তার তথ্য সংগ্রহ করার জন্য বিশেষ তাগিদ দরকার।’
গোটা বিশ্বে সাত হাজারের বেশি ভাষা প্রচলিত আছে। তার মধ্যে এনএলপি-তে আছে একশটিরও কম ভাষা। এখানে সবচেয়ে বেশি গুরুত্ব পেয়েছে ইংরেজি ভাষা। চ্যাটজিপিটি ও গুগল বার্ডে শুধু ইংরেজি ব্যবহার হয়। অ্যামাজন অ্যালেক্সা নয়টি ভাষা ব্যবহার করে। তার মধ্যে ইউরোপের বাইরে তিনটি ভাষাই আছে, আরবি, হিন্দি ও জাপানি।
ভারতে ১১ শতংশের মতো মানুষ ইংরাজি ভাষায় কথা বলতে পারেন। একটা বড় অংশই ইংরেজি লিখতে বা পড়তে পারেন না। তাই বেশ কিছু এআই মডেল স্পিচ ও স্পিচ রেকগনিশনের উপর জোর দিয়েছে। গুগলের প্রজেক্ট ‘বাণী' বা ‘ভয়েস' ১০ লাখ ভারতীয়র স্পিচ ডেটা সংগ্রহ করেছে। তারা সেটা ওপেন সোর্সিং করেছে, যাতে স্পিচ রেকগনিশনে কাজে লাগে ও স্পিচ টু স্পিচ অনুবাদ করা যেতে পারে। সূত্র: ডয়চে ভেলে।
বিভাগ : আন্তর্জাতিক
মন্তব্য করুন
আরও পড়ুন
ভারতের কাছে হারানো ২০০ একর জমি ফেরত পাচ্ছে বাংলাদেশ
সাবেক রেলমন্ত্রী নুরুল ইসলাম সুজন গ্রেপ্তার
যৌথ বাহিনীর অভিযানে ১৩দিনে ১৫৫ অস্ত্র উদ্ধার, গ্রেপ্তার ৭২
ইলিয়াস আলীকে ফিরিয়ে দেওয়ার দাবীতে বালাগঞ্জে স্বেচ্ছাসেবক দলের মিছিল
সাংবাদিক মুশফিকুল ফজল আনসারীর সাথে সিলেট অনলাইন প্রেসক্লাবের সৌজন্য সাক্ষাৎ
গুলশানে বিএনপির স্থায়ী কমিটির বৈঠক
যশোরে ৪ দিনের বৃষ্টিপাতে নিম্নাঞ্চলে জলাবদ্ধতা, বিপর্যস্ত জনজীবন
যাত্রাবাড়ী থানার সাবেক ওসি আবুল হাসান টেকনাফ থেকে গ্রেপ্তার
৪ ধরনের জ্বালানি তেলের দাম কমালো পাকিস্তান
তারাকান্দায় সাবেক এমপি শরীফসহ ৫৯ আ’লীগ নেতাকর্মীর নামে মামলা
শার্শায় বাবার কোদালের আঘাতে ছেলে নিহত
গোলাপগঞ্জে ইয়াবাসহ মাদক ব্যবসায়ী আটক
কিশোরগঞ্জে ঈদে মিলাদুন্নবীর র্যালিকে কেন্দ্র করে সংঘর্ষ, মসজিদ-মাজার ভাঙচুর, নিহত- ১
রিমান্ডে জিজ্ঞাসাবাদে চাঞ্চল্যকর তথ্য হাবিব-বিপ্লব গংদের নির্দেশে পুলিশ নেতা সেজে বিভ্রান্ত করেছিলেন কনস্টেবল জয়
ইসলামের বিধি-বিধান প্রতিষ্ঠা হলে ইসলামের প্রকৃত সৌন্দর্য জগতবাসী দেখতে পাবে -মাওলানা আহমদ আবদুল কাইয়ূম
যানজটের সমাধান খুঁজতে প্রধান উপদেষ্টার নির্দেশ
মহানবী (সঃ) এর আদর্শ অনুসরণ করা হলে কোন রাষ্ট্র প্রধানকে পালাতে হবেনা-মিলাদুন্নবী (সঃ) এর আলোচনা সভায় বক্তারা
মসজিদ-মাদরাসা কমিটি থেকে ফ্যাসিবাদের সুবিধাভোগীদের বিতাড়িত করতে হবে: আজিজুল হক ইসলামাবাদী
প্রশাসক হতে চান শিক্ষকরা, ঠেকাতে একাট্টা ৪ সংগঠন
বাংলাদেশের এই দলকে সেরা বললেন হার্শা