গুগল উন্মোচন করল লিরিয়া ৩: জেমিনিতে সরাসরি যুক্ত হলো এআই মিউজিক স্টুডিও
লেখক: Veronika Radoslavskaya
২০২৬ সালের ১৮ ফেব্রুয়ারি, গুগল ডিপমাইন্ড তাদের সবচেয়ে উন্নত মিউজিক জেনারেশন মডেল 'লিরিয়া ৩' (Lyria 3) বিশ্বব্যাপী উন্মোচনের ঘোষণা দিয়েছে। গবেষণার পর্যায় পেরিয়ে গুগল এখন এই টুলটি জেমিনি (Gemini) ওয়েব ইন্টারফেস এবং অ্যাপের মাধ্যমে বিশ্বজুড়ে ব্যবহারকারীদের জন্য উন্মুক্ত করেছে। এর ফলে জনপ্রিয় এই চ্যাটবটটি এখন একটি পূর্ণাঙ্গ মিউজিক প্রোডাকশন স্টুডিওতে রূপান্তরিত হয়েছে, যা সাধারণ ব্যবহারকারীদের সৃজনশীলতাকে নতুন মাত্রা দেবে।
লিরিয়া ৩-এর সক্ষমতা আগের পরীক্ষামূলক সংস্করণগুলোর তুলনায় অনেক বেশি বিস্তৃত এবং এটি মূলত তিনটি প্রধান স্তম্ভের ওপর ভিত্তি করে তৈরি করা হয়েছে। এর মধ্যে রয়েছে মাল্টিমোডাল ইনপুট, লিরিক্স ও ভোকাল জেনারেশন এবং উন্নত নিয়ন্ত্রণ ব্যবস্থা। এই নতুন ফিচারের মাধ্যমে গুগল এআই-চালিত সংগীত তৈরির প্রক্রিয়াকে আরও সহজ এবং পেশাদার করে তুলেছে।
- মাল্টিমোডাল ইনপুট: ব্যবহারকারীরা এখন কেবল টেক্সট প্রম্পটেই সীমাবদ্ধ নন; তারা ফটো বা ভিডিও আপলোড করেও সেই ভিজ্যুয়ালের ছন্দ ও মেজাজের সাথে মিল রেখে সাউন্ডট্র্যাক তৈরি করতে পারবেন। উদাহরণস্বরূপ, বৃষ্টির দিনের রাস্তার একটি ভিডিও স্ক্যান করে এটি অনায়াসেই লো-ফাই জ্যাজ সংগীত তৈরি করতে সক্ষম।
- লিরিক্স এবং ভোকাল জেনারেশন: আগের সংস্করণগুলোর সীমাবদ্ধতা কাটিয়ে লিরিয়া ৩ এখন গানের কথা লেখার পাশাপাশি কণ্ঠস্বর তৈরি করতে পারে। বর্তমানে এটি ইংরেজি, স্প্যানিশ, জাপানিজ, কোরিয়ান এবং হিন্দিসহ মোট ৮টি ভাষায় ভোকাল সাপোর্ট করছে, যেখানে আরবি ভাষাটি বর্তমানে বিটা সংস্করণে উপলব্ধ রয়েছে।
- সূক্ষ্ম নিয়ন্ত্রণ ব্যবস্থা: নতুন ইন্টারফেসের মাধ্যমে ব্যবহারকারীরা মিউজিকের টেম্পো, জেনারের ধরন এবং বাদ্যযন্ত্রের ঘনত্ব বা ডেনসিটি সমন্বয় করতে পারবেন। লিরিয়া ৩ উচ্চমানের ৩০ সেকেন্ডের অডিও ক্লিপ তৈরি করে, যা পরবর্তীতে প্রয়োজন অনুযায়ী নির্বিঘ্নে বাড়ানো বা লুপ হিসেবে ব্যবহার করা যায়।
সৃজনশীলতাকে পূর্ণতা দিতে গুগল তাদের সর্বশেষ ইমেজ জেনারেশন মডেল 'ন্যানো ব্যানানা' (Nano Banana)-কে এর সাথে একীভূত করেছে। এটি জেমিনি ২.৫ ফ্ল্যাশ ইমেজ ফ্যামিলির একটি অংশ। এই সিস্টেমটি স্বয়ংক্রিয়ভাবে তৈরি করা গানের লিরিক্স এবং মেজাজ বিশ্লেষণ করে প্রতিটি গানের জন্য অনন্য এবং উচ্চমানের অ্যালবাম আর্টওয়ার্ক তৈরি করে দেয়, যা একজন শিল্পীকে তার কাজ উপস্থাপনে সহায়তা করে।
নিরাপত্তা এবং কপিরাইট সুরক্ষার বিষয়ে গুগল বিশেষ গুরুত্বারোপ করেছে। লিরিয়া ৩ প্রশিক্ষণের সময় কপিরাইট আইন এবং শিল্পীদের নিরাপত্তার বিষয়টি কঠোরভাবে মেনে চলা হয়েছে যাতে কোনো মেধাস্বত্ব লঙ্ঘিত না হয়। গুগলের পক্ষ থেকে জানানো হয়েছে যে, এই মডেলটি এমনভাবে তৈরি করা হয়েছে যা শিল্পীদের মৌলিক কাজকে সম্মান জানায়।
- অ্যান্টি-মিমিক্রি গার্ডরেল: এই মডেলটি নির্দিষ্ট কোনো শিল্পীর হুবহু অনুকরণ করার অনুরোধ প্রত্যাখ্যান করে। যদি কোনো ব্যবহারকারী 'টেইলর সুইফট'-এর স্টাইলে গান তৈরির অনুরোধ করেন, তবে সিস্টেমটি কেবল সেই সৃজনশীল ধারণাটি গ্রহণ করবে, কিন্তু শিল্পীর কণ্ঠ বা সিগনেচার মেলোডি নকল করবে না।
- সিনথআইডি (SynthID): সমস্ত অডিও আউটপুটে সিনথআইডি নামক একটি অদৃশ্য ওয়াটারমার্ক যুক্ত করা হয়েছে। এটি এমন এক প্রযুক্তি যা অডিও কম্প্রেস, এডিট বা মিক্স করলেও শনাক্তযোগ্য থাকে, ফলে এআই-জেনারেটেড কন্টেন্ট সহজেই চিহ্নিত করা সম্ভব হবে।
আজ থেকেই বিশ্বজুড়ে ১৮ বছরের বেশি বয়সী জেমিনি ব্যবহারকারীদের জন্য এই ফিচারটি পর্যায়ক্রমে চালু করা হচ্ছে। গুগল এই রিলিজের মাধ্যমে সরাসরি 'সুনো' (Suno) এবং 'উডিও' (Udio)-র মতো পরিষেবাগুলোর সাথে প্রতিযোগিতায় নেমেছে। নিজেদের বিশাল ইকোসিস্টেমকে কাজে লাগিয়ে সাধারণ মানুষের কাছে উন্নত সংগীত তৈরির সরঞ্জাম পৌঁছে দেওয়াই গুগলের মূল লক্ষ্য।
9 দৃশ্য
উৎসসমূহ
Google DeepMind
এই বিষয়ে আরও খবর পড়ুন:
আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।
