@AnthropicAI mapped how AI personalities work. Persona vectors = personality patterns you can actually measure and control. Evil mode lighting up? You'll see it. Model getting too agreeable? Dial it back. Makes me think AI characters in games are going to be a bunch of fun.
অ্যানথ্রপিকের 'পার্সোনা ভেক্টর': এআই ব্যক্তিত্ব নিয়ন্ত্রণে নতুন পদ্ধতি
সম্পাদনা করেছেন: gaya ❤️ one
অ্যানথ্রপিকের নতুন গবেষণা: এআই ব্যক্তিত্ব নিয়ন্ত্রণে 'পার্সোনা ভেক্টর'
অ্যানথ্রপিক নামক একটি এআই নিরাপত্তা ও গবেষণা সংস্থা সম্প্রতি 'পার্সোনা ভেক্টর' নিয়ে নতুন গবেষণা শুরু করেছে । এই গবেষণা এআই ব্যক্তিত্বের বৈশিষ্ট্যগুলি পর্যবেক্ষণ ও নিয়ন্ত্রণের দিকে বিশেষভাবে নজর দেয় ।
'টিকা' কৌশল
এই উদ্ভাবনী গবেষণায় একটি 'টিকা' কৌশল ব্যবহার করা হয়েছে । এই কৌশলের মাধ্যমে প্রশিক্ষণের সময় ক্ষতিকারক আচরণ যুক্ত করা হয়, যা পরবর্তীতে অবাঞ্ছিত বৈশিষ্ট্যগুলির বিরুদ্ধে মডেলকে স্থিতিশীল করে ।
পার্সোনা ভেক্টরের ব্যবহার
'পার্সোনা ভেক্টর' বিদ্বেষের মতো বৈশিষ্ট্য নিয়ন্ত্রণ করতে সক্ষম । এটি মাইক্রোসফটের বিং এবং xAI-এর গ্রোকের মতো মডেলগুলোতে দেখা যাওয়া এআই ব্যক্তিত্বের অস্থিরতা কমাতে সাহায্য করে ।
বিনিয়োগ এবং নিরাপত্তা
এআই খাতে বিনিয়োগের পরিমাণ বাড়ছে, Goldman Sachs Research-এর মতে ২০২৫ সাল নাগাদ বিশ্বব্যাপী এই বিনিয়োগ $২০০ বিলিয়ন ডলার ছাড়িয়ে যেতে পারে । এই পরিস্থিতিতে, অ্যানথ্রপিকের এই পদক্ষেপ এআই-এর ভবিষ্যৎকে আরও নিরাপদ করতে পারে ।
নৈতিক ব্যবহারের গুরুত্ব
এআই বিকাশে নৈতিক ব্যবহারের ওপর জোর দেওয়া হয়েছে, যেখানে ডেটা সুরক্ষা এবং পক্ষপাতিত্বের ঝুঁকিগুলি নিয়ে উদ্বেগ প্রকাশ করা হয়েছে । 'পার্সোনা ভেক্টর' ব্যবহারের মাধ্যমে এআই মডেলগুলির অবাঞ্ছিত আচরণ নিয়ন্ত্রণ করা যেতে পারে ।
প্রযুক্তিগত বিবরণ
অ্যানথ্রপিকের এই গবেষণা মডেলে ক্ষতিকারক বৈশিষ্ট্য যুক্ত করার মাধ্যমে প্রশিক্ষণ ডেটার সমস্যা চিহ্নিত করে । এছাড়াও, বাস্তব কথোপকথনের ডেটাসেটে পার্সোনা ভেক্টর পরীক্ষা করা হয়েছে, যা সমস্যাযুক্ত আচরণ বৃদ্ধি করে এমন প্রশিক্ষণ নমুনা চিহ্নিত করে ।
ভবিষ্যতের প্রভাব
অ্যানথ্রপিকের এই পদক্ষেপ এআই-এর ভবিষ্যৎকে আরও নিরাপদ এবং নির্ভরযোগ্য করতে সাহায্য করবে । 'পার্সোনা ভেক্টর' এআই মডেলের ব্যক্তিত্ব নিয়ন্ত্রণে একটি নতুন দিগন্ত উন্মোচন করেছে ।
উৎসসমূহ
Benzinga
Anthropic's Official Announcement on Persona Vectors
Anthropic's Research Paper on Persona Vectors
AI Models Can Secretly Influence Each Other, Study Reveals
AI LLMs Can Independently Plan and Execute Cyberattacks, Study Finds
AI Is Entering an 'Unprecedented Regime.' Should We Stop It?



