২০২৬ সালে সংগীতের নান্দনিকতা স্বয়ংক্রিয়ভাবে মূল্যায়নের ক্ষেত্রটি এক নতুন উচ্চতায় পৌঁছেছে: আন্তর্জাতিক সম্মেলন ICASSP-এর অধীনে শুরু হয়েছে Automatic Song Aesthetics Evaluation Challenge।
এর লক্ষ্য হলো সংগীতের নান্দনিকতা সম্পর্কে মানুষের মূল্যায়নের পূর্বাভাস দিতে অ্যালগরিদমগুলোকে প্রশিক্ষিত করা। এখানে সংগীত তৈরির কথা বলা হচ্ছে না।
বরং এটি সংগীত কেন সুন্দর শোনায়, তা বোঝার একটি প্রচেষ্টা।
যখন সংগীত যন্ত্রের অনুধাবনের বিষয় হয়ে ওঠে
সাম্প্রতিক বছরগুলোতে কৃত্রিম বুদ্ধিমত্তা সক্রিয়ভাবে শব্দ তৈরিতে পারদর্শী হয়ে উঠেছে:
সুর
সংগতি
শব্দের বৈশিষ্ট্য
কণ্ঠস্বর
তবে এবারের চ্যালেঞ্জটি ভিন্ন: একজন শ্রোতার মতো কি কোনো অ্যালগরিদম সংগীতের মান বিচার করতে পারে?
ICASSP ২০২৬-এর এই প্রতিযোগিতা মূলত এই বিষয়ের ওপরই আলোকপাত করছে।
মডেলগুলো বিভিন্ন অডিও ক্লিপ বিশ্লেষণ করে বেশ কিছু সংবেদনশীল প্যারামিটারের ভিত্তিতে মানুষের নান্দনিক মূল্যায়নের পূর্বাভাস দেওয়ার চেষ্টা করছে:
শব্দের অখণ্ডতা
শব্দের স্বাভাবিকতা
স্মরণযোগ্যতা
শব্দের স্বচ্ছতা
সাঙ্গীতিকতা
এই প্যারামিটারগুলো রেকর্ডিংয়ের কারিগরি মান নয়, বরং মানুষ কীভাবে সংগীতকে উপলব্ধি করে তা প্রতিফলিত করে।
সৃষ্টি থেকে অনুধাবনের পথে
সংগীত বিষয়ক কৃত্রিম বুদ্ধিমত্তার বিকাশে এটি একটি গুরুত্বপূর্ণ মোড়।
আগে সিস্টেমগুলো যেখানে কেবল শব্দ তৈরি করতে শিখত, সেখানে এখন তারা শব্দের নান্দনিক তাৎপর্য ব্যাখ্যা করতে শিখছে।
প্রকৃতপক্ষে এটি একটি রূপান্তর: সংশ্লেষণ থেকে উপলব্ধির দিকে, পরিবেশক অ্যালগরিদম থেকে
শ্রোতা অ্যালগরিদমের দিকে।
সংগীতের নান্দনিকতা গবেষণার একটি পরিমাপযোগ্য ক্ষেত্রে পরিণত হচ্ছে
ICASSP ২০২৬ চ্যালেঞ্জটি মূলত SongEval 2025 ডেটাসেটের মাধ্যমে শুরু হওয়া ধারাটিরই ধারাবাহিকতা, যেখানে প্রথমবারের মতো সংগীতের ক্লিপগুলোর ওপর মানুষের নান্দনিক মূল্যায়নের একটি বিশাল তথ্যভাণ্ডার সংগ্রহ করা হয়েছিল।
এখন এই বিষয়টি মডেলগুলোর মধ্যে একটি আন্তর্জাতিক প্রতিযোগিতার পর্যায়ে পৌঁছেছে।
এর অর্থ হলো: সংগীতের সৌন্দর্য ধীরে ধীরে কম্পিউটেশনাল বিশ্লেষণের বিষয়ে পরিণত হচ্ছে
এবং একই সঙ্গে এটি মানুষের এক গভীর অনুভূতির জায়গা হিসেবেও টিকে থাকছে।
যৌথ শ্রবণের ক্ষেত্র
এর পাশাপাশি কুইন মেরি ইউনিভার্সিটি অফ লন্ডন এবং ইম্পেরিয়াল কলেজ লন্ডনের গবেষক দলগুলো সংগীতের উপলব্ধি এবং প্রযুক্তিগতভাবে তৈরি সংগীতের সাথে শ্রোতার মিথস্ক্রিয়া নিয়ে কাজ চালিয়ে যাচ্ছে।
সংগীত শোনা এখন ক্রমশ মানুষ ও অ্যালগরিদমের মধ্যে পারস্পরিক বিনিময়ের একটি ক্ষেত্রে পরিণত হচ্ছে।
এটি কোনো প্রতিস্থাপন নয়, বরং একটি সহযোগিতা।
পৃথিবীর শব্দমাধুর্যে এটি যা যোগ করেছে
আজ প্রথমবারের মতো অ্যালগরিদমগুলো কেবল শব্দ তৈরি করতেই শিখছে না।
তারা এখন শুনতে শিখছে। আর এই অগ্রযাত্রায় সংগীত কেবল পরিবেশনার শিল্পই থাকছে না, বরং তা উপলব্ধির এক বিজ্ঞানে পরিণত হচ্ছে, যেখানে মানুষ এবং প্রযুক্তি একসাথে শুনতে শুরু করেছে।




