প্যারিস, ফ্রান্স - মেটা V-JEPA 2 চালু করেছে, যা ভৌত জগৎ বুঝতে এবং তার পূর্বাভাস দেওয়ার জন্য ডিজাইন করা একটি উন্নত এআই “বিশ্ব মডেল”।
এই নতুন ওপেন-সোর্স মডেল 3D পরিবেশ এবং বস্তুর গতিবিধি বুঝতে পারে। এটি বৃহৎ ভাষা মডেলগুলির থেকে এক উল্লেখযোগ্য পদক্ষেপ, যা এআইকে মানুষের মতো শিখতে, পরিকল্পনা করতে এবং সিদ্ধান্ত নিতে সক্ষম করে।
V-JEPA 2 বুঝতে পারে যে টেবিল থেকে গড়িয়ে পড়া একটি বল নিচে পড়বে। এটি বস্তুগুলি কীভাবে নড়াচড়া করে এবং ইন্টারঅ্যাক্ট করে তা বোঝার জন্য একটি সরলীকৃত “ল্যাটেন্ট” স্থানে যুক্তি দেয়।
মেটার প্রধান এআই বিজ্ঞানী ইয়ান লেকুন ভাষা এবং ভৌত জগৎ বোঝার মধ্যে পার্থক্য তুলে ধরেন। তিনি ব্যাখ্যা করেন যে একটি বিশ্ব মডেল বাস্তবতার একটি বিমূর্ত ডিজিটাল যমজ হিসাবে কাজ করে, যা এআইকে তার ক্রিয়াকলাপের ফলাফলগুলি পূর্বাভাস দিতে দেয়।
মেটা এআই-তে বিশাল বিনিয়োগ করছে, স্কেল এআই-তে ১৪ বিলিয়ন ডলার বিনিয়োগের পরিকল্পনা রয়েছে। কোম্পানিটি OpenAI এবং Google-এর মতো অন্যান্য প্রযুক্তিগত জায়ান্টদের সঙ্গে প্রতিযোগিতা করার জন্য এআই-এর উপর মনোযোগ দিচ্ছে।
V-JEPA 2 ডেলিভারি রোবট এবং স্ব-চালিত গাড়িতে ব্যবহারের জন্য তৈরি করা হয়েছে। এই মেশিনগুলিকে নেভিগেশনের জন্য রিয়েল টাইমে তাদের চারপাশের পরিবেশ বুঝতে হবে।
অন্যান্য কোম্পানিও বিশ্ব মডেল তৈরি করছে। গুগলের DeepMind Genie-এর উপর কাজ করছে, যা গেম এবং 3D পরিবেশের অনুকরণ করতে পারে। Fei-Fei Li World Labs নামক একটি স্টার্টআপের জন্য ২৩০ মিলিয়ন ডলার সংগ্রহ করেছেন, যা বৃহৎ বিশ্ব মডেলের উপর কেন্দ্রীভূত।