OpenAI Ra Mắt GPT-5.2 Với Kiến Trúc Ba Cấp Độ Tối Ưu Cho Quy Trình Làm Việc Chuyên Nghiệp

20:38, 11 tháng 12

Tác giả: Veronika Radoslavskaya

OpenAI

@OpenAI

·Follow

Replying to @OpenAI

GPT-5.2 Thinking evals

6:18 PM · Dec 11, 2025

3.8K

Read 341 replies

Watch on X

Vào ngày 11 tháng 12 năm 2025, OpenAI chính thức công bố GPT-5.2, một bản phát hành đánh dấu bước tiến lớn với hệ thống mô hình ba biến thể, được thiết kế chuyên biệt cho khối lượng công việc tri thức chuyên môn và các ứng dụng tác nhân tự hành. Công ty khẳng định đây là dòng mô hình mạnh mẽ nhất từ trước đến nay của họ, thể hiện những cải tiến có thể đo lường được trong việc tạo bảng tính, xây dựng bài thuyết trình, lập trình, xử lý thị giác và khả năng suy luận với ngữ cảnh mở rộng.

Carl Vellotti 🥞

@carlvellotti

·Follow

Replying to @OpenAI

6:44 PM · Dec 11, 2025

177

Read 3 replies

Watch on X

Hệ thống GPT-5.2 được chia thành ba cấu hình chuyên biệt, đáp ứng các mức độ phức tạp và nhu cầu sử dụng khác nhau. Ba biến thể này bao gồm Instant, Thinking và Pro. Trong đó, Instant được ưu tiên tốc độ cao cho các truy vấn thông thường như tìm kiếm thông tin, viết lách và dịch thuật. Ngược lại, Thinking lại nổi trội trong các tác vụ cấu trúc phức tạp hơn, chẳng hạn như viết mã, phân tích tài liệu dài, tính toán toán học và lập kế hoạch. Phiên bản Pro đại diện cho cấp độ năng lực cao nhất, được chế tạo để mang lại độ chính xác và độ tin cậy tối đa cho những vấn đề khó nhằn nhất.

Thành tích của GPT-5.2 Thinking thực sự gây ấn tượng mạnh. Mô hình này đã đạt được độ chính xác tuyệt đối 100% trong kỳ thi toán AIME 2025, thiết lập một kỷ lục chuẩn mực mới. Trên GDPval – một hệ thống đánh giá kiến thức chuyên môn bao quát 44 ngành nghề – mô hình đã thắng hoặc hòa với các chuyên gia trong ngành ở 70.9% các lần so sánh trực tiếp. Đây là lần đầu tiên một mô hình của OpenAI chạm đến ngưỡng hiệu suất chuyên gia trong các tác vụ mang lại giá trị kinh tế cao. Trên các biểu đồ chuẩn của OpenAI, GPT-5.2 Thinking đã vượt qua Gemini 3 và Claude Opus 4.5 của Anthropic ở hầu hết các bài kiểm tra suy luận được liệt kê, từ SWE-Bench Pro đến các bộ tiêu chí GPQA Diamond và ARC-AGI.

Trong lĩnh vực lập trình và kỹ thuật phần mềm, GPT-5.2 Thinking đã ghi dấu ấn trên SWE-Bench Pro, một bài kiểm tra kỹ thuật phần mềm thực tế áp dụng nhiều ngôn ngữ lập trình. Mô hình này đạt được 55.6%, cao hơn đáng kể so với mức 50.8% của GPT-5.1. Thậm chí, nó còn đạt 80% trên SWE-bench Verified. Các công ty khởi nghiệp về mã hóa như Windsurf và CharlieCode đã báo cáo về hiệu suất tác nhân lập trình tiên tiến và những cải thiện rõ rệt trong các quy trình làm việc đa bước phức tạp.

Về mặt độ tin cậy, các phản hồi từ GPT-5.2 Thinking chứa ít lỗi hơn 30% so với GPT-5.1, giúp mô hình trở nên đáng tin cậy hơn cho các quyết định hàng ngày, nghiên cứu và viết lách. Mô hình này hỗ trợ cửa sổ ngữ cảnh mở rộng lên đến hàng trăm nghìn token, với độ chính xác gần như hoàn hảo trong các nhiệm vụ phân giải đồng tham chiếu đa vòng. Khả năng thị giác cũng được cải thiện đáng kể, giảm tỷ lệ lỗi khoảng một nửa trong các bài kiểm tra về diễn giải biểu đồ và hiểu giao diện phần mềm.

Sự ra mắt này diễn ra trong bối cảnh cạnh tranh ngày càng gay gắt với Gemini 3 của Google, vốn đang dẫn đầu bảng xếp hạng của LMArena trên hầu hết các tiêu chí, ngoại trừ lĩnh vực lập trình. Đầu tháng này, CEO Sam Altman được cho là đã gửi một bản ghi nhớ nội bộ “báo động đỏ” tới nhân viên sau khi có dấu hiệu sụt giảm lưu lượng truy cập ChatGPT và những lo ngại về việc mất thị phần người dùng vào tay Google. Bản ghi nhớ kêu gọi thay đổi ưu tiên, bao gồm việc tạm dừng các cam kết như giới thiệu quảng cáo và thay vào đó tập trung vào việc tạo ra trải nghiệm ChatGPT tốt hơn.

Hiện tại, GPT-5.2 đang được triển khai dần cho những người đăng ký trả phí của ChatGPT (bao gồm các gói Plus, Pro, Business, Enterprise) và đã sẵn sàng thông qua API với cả ba biến thể. OpenAI cũng công bố các biện pháp an toàn mới liên quan đến việc sử dụng liên quan đến sức khỏe tâm thần và xác minh độ tuổi đối với thanh thiếu niên, mặc dù những điểm này không được nhấn mạnh trong buổi giới thiệu ra mắt sản phẩm.

OpenAI

ChatGPT

Reasoning AI

Large Language Models (LLMs)

Generative AI

38 Lượt xem

Nguồn

OpenAI Blog

Đọc thêm bài viết về chủ đề này:

27 tháng 4

DeepSeek-V4: Chiến lược hạ giá từ Trung Quốc thách thức sự độc quyền trong lĩnh vực AI

23 tháng 4

Phát thải vô hình từ máy móc thông minh: Minh bạch hóa chi phí môi trường của LLM

09 tháng 4

Grammarly đối mặt với vụ kiện vi phạm quyền công khai do trình biên tập văn phong bằng AI

Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.