৯৫ শতাংশ নির্ভুলতার সাথে বিড়ালের ডাক অনুবাদ করতে সক্ষম নতুন এআই প্রযুক্তি

লেখক: Svetlana Velhush

৯৫ শতাংশ নির্ভুলতার সাথে বিড়ালের ডাক অনুবাদ করতে সক্ষম নতুন এআই প্রযুক্তি-1

বিড়াল

দীর্ঘদিন ধরে ধারণা করা হতো যে বিড়ালের মিউ মিউ শব্দ কেবল মানুষের মনোযোগ আকর্ষণের একটি বিশৃঙ্খল প্রক্রিয়া। তবে ২০২৬ সালে প্রকৌশলী এবং প্রাণী আচরণবিদদের একটি দল এমন এক প্রকল্প উপস্থাপন করেছেন যা এই ধারণাকে সম্পূর্ণ বদলে দিয়েছে। কনভোলিউশনাল নিউরাল নেটওয়ার্ক (CNN) এবং এলএসটিএম (LSTM) আর্কিটেকচারের সমন্বয়ে গবেষকরা একটি মোবাইল অ্যাপ্লিকেশন তৈরি করেছেন, যা রিয়েল-টাইমে বিড়ালের সংকেতগুলোকে মানুষের বোধগম্য ভাষায় রূপান্তর করতে পারে। এই সিস্টেমটি 'আমি ক্ষুধার্ত', 'আমি বিরক্ত', 'আমার দাঁতে ব্যথা করছে' এবং এমনকি বিড়ালের বিশেষ 'শিকারের আহ্বান'-এর মতো সূক্ষ্ম পার্থক্যগুলোও শনাক্ত করতে সক্ষম।

অনুবাদক অ্যাপের আগের সংস্করণগুলো প্রায়ই ভুল করত, কিন্তু বর্তমানের এই উন্নত কৃত্রিম বুদ্ধিমত্তা শব্দের স্পেকট্রোগ্রাম বিশ্লেষণ করে। এটি পশুচিকিত্সকদের দ্বারা যাচাইকৃত লক্ষ লক্ষ রেকর্ডিংয়ের একটি বিশাল ডাটাবেসের সাথে বিড়ালের ডাক তুলনা করে। এর ফলে বিড়াল মালিকরা কেবল বিনোদনের জন্যই নয়, বরং তাদের পোষা প্রাণীর অসুস্থতার লক্ষণগুলোও সময়মতো বুঝতে পারেন। উদাহরণস্বরূপ, একটি নির্দিষ্ট নিম্ন-ফ্রিকোয়েন্সির শব্দ যা মানুষের কানে ধরা পড়ে না, তা বিড়ালের কিডনির সমস্যা সম্পর্কে অনেক আগেই সতর্ক করতে পারে। এই সিস্টেমটি বাড়ি, আশ্রয়কেন্দ্র এবং পশু হাসপাতাল থেকে সংগৃহীত হাজার হাজার বাস্তব রেকর্ডিংয়ের ওপর ভিত্তি করে প্রশিক্ষণপ্রাপ্ত এবং এটি বিড়ালের শব্দগুলোকে পাঁচটি প্রধান আচরণগত গ্রুপে বিভক্ত করে: খাবার সংক্রান্ত, জীবনের বিশেষ ঘটনা, সুরক্ষা বা আগ্রাসন, প্রজনন এবং অভিযোগ বা কষ্ট।

স্মার্টফোনে এটি যেভাবে কাজ করে:

  • ব্যবহারকারীরা MeowTalk, MeowTranslator বা এফজিসি-ভিত্তিক ভবিষ্যৎ অ্যাপগুলোর মাধ্যমে বিড়ালের ডাক রেকর্ড করতে পারেন।
  • কৃত্রিম বুদ্ধিমত্তা তখন শব্দের উচ্চতা, স্থায়িত্ব, স্পেকট্রোগ্রামের আকৃতি, কম্পাঙ্কের পরিবর্তন এবং ছন্দের মতো বিভিন্ন শাব্দিক বৈশিষ্ট্য বিশ্লেষণ করে।
  • এটি তাৎক্ষণিকভাবে অনুবাদ প্রদান করে যেমন— 'আমি ক্ষুধার্ত', 'আমি একঘেয়েমি অনুভব করছি', 'আমার কষ্ট হচ্ছে', 'আমি সন্তুষ্ট' কিংবা 'আমাকে একা থাকতে দাও' এবং আরও অনেক কিছু।

'সাধারণ একঘেয়েমি' এবং 'লুকানো ব্যথা'র মধ্যে পার্থক্য করার উপায়:

  • একঘেয়েমি বা মনোযোগের দাবি: বিড়ালের ডাক সাধারণত ছোট, পুনরাবৃত্তিমূলক এবং তুলনামূলকভাবে উচ্চস্বরের হয় যা একটি নির্দিষ্ট ছন্দে চলে।
  • লুকানো ব্যথা বা অস্বস্তি: শরীরে কোনো কষ্ট থাকলে বিড়ালের ডাক দীর্ঘতর, গম্ভীর এবং আর্তনাদপূর্ণ হয়। এআই এই শব্দগুলোকে 'ডিসট্রেস' বা 'কমপ্লেইন্ট' বিভাগে অন্তর্ভুক্ত করে, যা দাঁত, জয়েন্ট বা মূত্রনালীর সমস্যার ইঙ্গিত দিতে পারে যা বিড়ালরা সাধারণত লুকিয়ে রাখে।

পশুচিকিত্সার ক্ষেত্রে এই উদ্ভাবন কেন বৈপ্লবিক:

  • বিড়ালরা তাদের ব্যথা লুকিয়ে রাখতে পারদর্শী, কিন্তু এই প্রযুক্তির মাধ্যমে প্রাথমিক পর্যায়েই শারীরিক সমস্যাগুলো শনাক্ত করা সম্ভব হচ্ছে।
  • দূরবর্তী পরামর্শের সময় মালিকরা বিড়ালের ডাকের রেকর্ডিং এবং তার অনুবাদ পশুচিকিত্সককে পাঠাতে পারেন, যা সঠিক রোগ নির্ণয়ে সহায়ক হয়।
  • এটি প্রাণী এবং মালিক উভয়ের মানসিক চাপ কমায়, কারণ এখন আর অনুমানের ওপর নির্ভর করতে হয় না।
  • ভবিষ্যতে এই সিস্টেমের সাথে বিড়ালের মুখের অভিব্যক্তি (Feline Grimace Scale) এবং অন্যান্য বায়োমেট্রিক ডেটা যুক্ত করার পরিকল্পনা রয়েছে।

যদিও এটি এখনো মানুষের মতো কোনো পূর্ণাঙ্গ কথোপকথন নয়, তবে এটি বিড়ালের ইচ্ছা এবং মানসিক অবস্থার একটি অত্যন্ত নির্ভরযোগ্য শ্রেণিবিন্যাস পদ্ধতি। বিশেষজ্ঞরা আশা করছেন যে ২০২৬ সালের মধ্যেই এই প্রযুক্তি আরও উন্নত হয়ে সাধারণ মানুষের নাগালে চলে আসবে। প্রযুক্তিটি ক্রমাগত নিজেকে উন্নত করছে এবং এটি বিড়ালের মনের না বলা কথাগুলো মানুষের কাছে পৌঁছে দিচ্ছে।

সফলতা সত্ত্বেও বিশেষজ্ঞরা সতর্ক করেছেন যে, এআই কেবল একজন সহকারী হিসেবে কাজ করবে, এটি সরাসরি পশুচিকিত্সকের বিকল্প নয়। তবুও, ২০২৬ সালে বিভিন্ন প্রজাতির মধ্যে তৈরি হওয়া এই 'ডিজিটাল সেতু' বিশ্বজুড়ে প্রায় ৪০০ মিলিয়ন গৃহপালিত বিড়ালের জীবনকে আরও নিরাপদ এবং মানুষের কাছে আরও বোধগম্য করে তুলেছে।

এই প্রযুক্তিগত অগ্রগতির মূলে রয়েছে নতুন এফজিসি ২.৩ (Feline Glossary Classification) মডেল, যা আগের ১১টির পরিবর্তে এখন ৪০ ধরণের কণ্ঠস্বর শনাক্ত করতে পারে। এই অ্যালগরিদমটি কেবল শব্দই নয়, বরং সুরের সূক্ষ্ম পরিবর্তন এবং বিরতিগুলোও নিখুঁতভাবে বিশ্লেষণ করে। এছাড়া, এই এআই মাত্র ২৪ ঘণ্টার মধ্যে নির্দিষ্ট বিড়ালের স্বতন্ত্র ডাকের ধরন বা 'ব্যক্তিগত একসেন্ট' শিখে নিতে সক্ষম, যা এর নির্ভুলতাকে আরও বাড়িয়ে দেয়।

23 দৃশ্য

উৎসসমূহ

  • ResearchGate — Научная публикация о классификации 40 типов вокализаций кошек с точностью 95%

  • National Geographic — Анализ того, как технологии ИИ меняют наше понимание поведения домашних животных.

  • MDPI (Applied Sciences) — Исследование глубокого обучения в распознавании звуков домашних животных.

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।