Anthropic Xác Nhận Mô Hình AI Claude Mythos Sau Sự Cố Rò Rỉ Dữ Liệu Nội Bộ

23:42, 27 tháng 3

Chỉnh sửa bởi: Tetiana Pin

Татьяна Пинчук

@Tapin013

·Follow

digitaltoday.co.kr/en/view/43564/…

11:39 PM · Mar 27, 2026

Read more on X

Watch on X

Anthropic Claude. [Ảnh: Shutterstock]

Vào ngày 27 tháng 3 năm 2026, tập đoàn nghiên cứu trí tuệ nhân tạo Anthropic đã chính thức xác nhận việc phát triển và thử nghiệm mô hình AI có năng lực vượt trội mang tên Claude Mythos. Sự xác nhận này diễn ra ngay sau một sự cố rò rỉ dữ liệu không mong muốn, qua đó các bản nháp chưa được công bố đã tiết lộ sự tồn tại của mô hình này cùng với khả năng vượt trội hơn hẳn các phiên bản trước đó, như Claude Opus 4.6, vốn được phát hành vào ngày 5 tháng 2 năm 2026.

Sự cố rò rỉ dữ liệu này bao gồm gần 3.000 bản nháp bài đăng trên blog và các tài liệu nội bộ liên quan đến hệ thống quản lý nội dung (CMS) của Anthropic, khiến chúng có thể được tìm kiếm công khai. Anthropic đã quy trách nhiệm cho sự cố này là do "lỗi của con người" trong quá trình cấu hình hệ thống và ngay lập tức đã hạn chế quyền truy cập vào kho lưu trữ dữ liệu bị lộ. Các tài liệu bị rò rỉ mô tả Claude Mythos, còn được gọi nội bộ là Capybara, là mô hình đạt được "điểm số cao hơn đáng kể" so với Claude Opus 4.6 trên các tiêu chí đánh giá về lập trình phần mềm, lý luận học thuật và an ninh mạng.

Dữ liệu bị lộ đã được nhà nghiên cứu an ninh mạng Alexandre Pauwels thuộc Đại học Cambridge và Roy Paz, Nhà nghiên cứu An ninh AI Cấp cao tại LayerX Security, phân tích độc lập, qua đó xác nhận tính xác thực của các tài liệu. Các bản nháp nội bộ đã chỉ định một cấp độ mô hình mới, cao hơn, là Capybara, được định vị là có năng lực và chi phí cao hơn so với dòng sản phẩm chủ lực hiện tại là Opus. Anthropic hiện đang cung cấp các mô hình trong ba cấp độ chính là Opus, Sonnet và Haiku.

Các tài liệu rò rỉ cũng bao gồm thông tin về một hội nghị thượng đỉnh kín sắp tới tại Vương quốc Anh, nơi CEO của Anthropic, Dario Amodei, dự kiến sẽ trình bày các bản trình diễn về mô hình mới này. Dario Amodei trước đó đã cảnh báo về mối nguy hiểm sắp xảy ra của trí tuệ siêu nhân trong bài tiểu luận tháng 1 năm 2026 của ông có tựa đề "The Adolescence of Technology", trong đó ông so sánh quỹ đạo AI hiện tại với một giai đoạn tuổi teen đầy biến động của nhân loại.

Chủ đề trung tâm trong các tài liệu bị rò rỉ là những rủi ro an ninh mạng chưa từng có liên quan đến Claude Mythos, được mô tả là có khả năng khai thác các lỗ hổng ở quy mô vượt xa khả năng phòng thủ hiện tại. Anthropic đã kết luận rằng cần phải có một quy trình triển khai cực kỳ thận trọng, ban đầu chỉ cung cấp quyền truy cập cho các tổ chức tập trung vào phòng thủ mạng, nhằm mục đích giúp các đơn vị phòng thủ củng cố hệ thống trước các cuộc tấn công do AI điều khiển. Sự việc này làm nổi bật những lỗ hổng đáng kể trong các biện pháp bảo mật dữ liệu của các nhà phát triển AI lớn, ngay cả khi họ đang xử lý thông tin nhạy cảm trước khi phát hành.

Sự liên quan của tin tức này nằm ở sự tiến bộ nhanh chóng trong khả năng của AI, đặc biệt là liên quan đến các mối đe dọa an ninh mạng tiềm tàng do các mô hình siêu mạnh mẽ gây ra. Anthropic đã phải đối mặt với những lo ngại về việc sử dụng sai mục đích, bao gồm cả việc một chiến dịch do nhà nước Trung Quốc bảo trợ đã sử dụng Claude Code để xâm nhập khoảng 30 tổ chức. Việc lên kế hoạch triển khai thận trọng, ưu tiên các tổ chức phòng thủ mạng, thừa nhận bản chất sử dụng kép của công nghệ mạnh mẽ này, cân bằng giữa đổi mới và giảm thiểu rủi ro.

Sự việc này cũng gây ra phản ứng trên thị trường tài chính, với cổ phiếu của các công ty an ninh mạng lớn như Palo Alto Networks và CrowdStrike sụt giảm do lo ngại về việc các giải pháp bảo mật hiện tại có thể bị lỗi thời do sự cạnh tranh từ AI.