Semua Berita
Logo

Pusat Notifikasi

Tidak ada pesan!

Pusat Notifikasi

Tidak ada pesan!

Kategori

    • •Semua Subkategori “Teknologi”
    • •Kecerdasan Buatan
    • •Mobil
    • •Gadget
    • •Internet
    • •Energi Baru
    • •Luar Angkasa
    • •Semua Subkategori “Ilmu Pengetahuan”
    • •Kedokteran & Biologi
    • •Sejarah & Arkeologi
    • •Astronomi & Astrofisika
    • •Fisika & Kimia
    • •Matahari
    • •Fisika Kuantum
    • •Genetika
    • •Semua Subkategori “Planet”
    • •Hewan
    • •Flora
    • •Penemuan
    • •Lautan
    • •Fenomena Tidak Biasa
    • •Cuaca & Ekologi
    • •Antartika
    • •Semua Subkategori “Masyarakat”
    • •Rekaman
    • •Seni
    • •Musik
    • •Gosip
    • •Mode
    • •Arsitektur
    • •Film
    • •Pengungkapan
    • •Makanan
    • •Semua Subkategori “Uang”
    • •Lelang
    • •Pajak
    • •Mata Uang Kripto
    • •Pasar Saham
    • •Perusahaan
    • •Bank & Mata Uang
    • •Hiburan
    • •Semua Subkategori “Peristiwa Dunia”
    • •Ringkasan
    • •Organisasi Internasional
    • •Berita Terkini
    • •Acara Global Mendatang
    • •Pertemuan Puncak
    • •Trump AS
    • •Semua Subkategori “Manusia”
    • •Kesadaran
    • •Meong
    • •Psikologi
    • •Pemuda
    • •Pendidikan
    • •Desain
    • •Perjalanan
    • •Bahasa

Ikuti Kami

  • •Teknologi
  • •Ilmu Pengetahuan
  • •Planet
  • •Masyarakat
  • •Uang
  • •Peristiwa Dunia
  • •Manusia

Bagikan

  • •Lelang
  • •Pajak
  • •Mata Uang Kripto
  • •Pasar Saham
  • •Perusahaan
  • •Bank & Mata Uang
  • •Hiburan
  • Tentang Kami
  • Ketentuan Penggunaan
  • Kebijakan Privasi
  • Beranda
  • Uang
  • Perusahaan

Anthropic Memperkenalkan 'Vektor Persona' untuk Pengendalian Kepribadian AI dan Pencegahan Perubahan Berbahaya

10:00, 04 Agustus

Diedit oleh: gaya ❤️ one

Anthropic telah mengembangkan metode baru yang disebut 'vektor persona' untuk memantau dan mengendalikan ciri-ciri kepribadian dalam model bahasa besar (LLM). Metode ini memungkinkan identifikasi dan pengendalian sifat-sifat seperti kejahatan, sikap menjilat, dan kecenderungan untuk berhalusinasi dalam model AI.

Vektor persona berfungsi dengan mengidentifikasi pola aktivitas dalam jaringan saraf model yang mengontrol sifat-sifat tertentu. Dengan menggunakan vektor ini, pengembang dapat memantau perubahan kepribadian model selama penggunaan dan pelatihan, serta mencegah munculnya sifat-sifat yang tidak diinginkan. Selain itu, vektor persona dapat digunakan untuk mengidentifikasi data pelatihan yang berpotensi menyebabkan perubahan kepribadian yang tidak diinginkan.

Metode ini telah diuji pada model sumber terbuka seperti Qwen 2.5-7B-Instruct dan Llama-3.1-8B-Instruct, menunjukkan efektivitasnya dalam berbagai arsitektur model. Pendekatan ini menawarkan cara yang lebih transparan dan dapat dipahami untuk mengelola perilaku model AI, yang penting untuk memastikan keselarasan dengan nilai-nilai manusia dan meningkatkan keselamatan penggunaan AI.

Sumber-sumber

  • Benzinga

  • Anthropic's Official Announcement on Persona Vectors

  • Anthropic's Research Paper on Persona Vectors

  • AI Models Can Secretly Influence Each Other, Study Reveals

  • AI LLMs Can Independently Plan and Execute Cyberattacks, Study Finds

  • AI Is Entering an 'Unprecedented Regime.' Should We Stop It?

Baca lebih banyak berita tentang topik ini:

04 Agustus

Elon Musk Mengumumkan Pemulihan Arsip Vine dan Peluncuran Alat Video AI Grok Imagine di X

02 Agustus

Meta Luncurkan Gelang Cerdas untuk Kontrol Digital Intuitif: Masa Depan di Ujung Jari Anda

01 Agustus

Apple Percepat Investasi AI dengan Rencana Pengeluaran $500 Miliar di AS

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.