Google DeepMind Ra Mắt AlphaGenome: Bước Tiến Đột Phá Trong Phân Tích DNA Với Cửa Sổ Ngữ Cảnh 1 Mb
Chỉnh sửa bởi: Maria Sagir
Nhóm nghiên cứu tại Google DeepMind vừa chính thức công bố AlphaGenome, một mô hình trí tuệ nhân tạo đánh dấu bước tiến quan trọng trong lĩnh vực di truyền học tính toán. Công trình nghiên cứu chi tiết về AlphaGenome đã được đăng tải trên tạp chí danh tiếng Nature vào ngày 28 tháng 1 năm 2026. Điểm nổi bật nhất của mô hình này là khả năng phân tích các trình tự DNA có độ dài lên tới một triệu cặp base (1 Mb) với độ chính xác vượt trội so với các công nghệ trước đây.
AlphaGenome được phát triển như một phiên bản kế nhiệm hoàn hảo cho mô hình Borzoi, vốn chỉ xử lý được các trình tự có độ dài khoảng 500.000 cặp base. Việc mở rộng cửa sổ ngữ cảnh cho phép kiến trúc mới này nắm bắt được các tương tác điều hòa kéo dài hơn trong bộ gen, điều mà các mô hình cũ thường bỏ lỡ. Về mặt kỹ thuật, kiến trúc của AlphaGenome dựa trên cấu trúc U-Net, bao gồm một bộ mã hóa (encoder) để tổng hợp dữ liệu, một khối transformer để mô hình hóa các phụ thuộc dài hạn và một bộ giải mã (decoder) để khôi phục dữ liệu đầu ra với độ phân giải chi tiết đến từng cặp base đơn lẻ.
Một trong những ưu điểm cốt lõi của AlphaGenome là tính đa năng đáng kinh ngạc: mô hình có thể dự đoán đồng thời kết quả của 11 quy trình di truyền chính, bao gồm biểu hiện gen, quá trình cắt nối (splicing) và khả năng tiếp cận chất nhiễm sắc. Khác với người tiền nhiệm Borzoi, AlphaGenome dự đoán một cách rõ ràng cả vị trí cắt nối lẫn cách thức sử dụng chúng, từ đó cung cấp thông tin chi tiết hơn về quá trình xử lý RNA. Theo dữ liệu từ các tác giả, mô hình này đã vượt qua các phương pháp thay thế khác, đạt kết quả tốt nhất trong hầu hết các bài kiểm tra đánh giá hệ quả chức năng của các biến thể di truyền. Đặc biệt, đối với các tác vụ dự đoán eQTL (các locus tính trạng số lượng liên quan đến biểu hiện gen), AlphaGenome mang lại sự cải thiện rõ rệt về chất lượng so với Borzoi.
Công nghệ này hứa hẹn sẽ đẩy nhanh quá trình xác định các yếu tố di truyền gây bệnh và phát triển các phương pháp trị liệu mới. Nó cho phép các nhà khoa học nghiên cứu sâu hơn vào các vùng không mã hóa của bộ gen—vốn chiếm khoảng 98% DNA của con người và chứa đựng các yếu tố điều hòa then chốt. Nhiều chuyên gia trong ngành nhận định rằng những mô hình như AlphaGenome đang biến mã di truyền "tĩnh" thành một ngôn ngữ dễ hiểu hơn cho các khám phá khoa học. Tuy nhiên, các nhà nghiên cứu cũng nhấn mạnh rằng AlphaGenome hiện chưa được thiết kế để chẩn đoán lâm sàng trực tiếp hoặc chỉ định điều trị, vì việc dự đoán chính xác những thay đổi biểu hiện gen ở từng cá thể cụ thể vẫn còn là một thách thức lớn.
Nhằm hỗ trợ cộng đồng khoa học toàn cầu, mã nguồn và trọng số của mô hình đã được cung cấp công khai cho các mục đích nghiên cứu phi thương mại, đi kèm với đó là một API để tích hợp vào quy trình làm việc của các phòng thí nghiệm. Theo thông tin từ đội ngũ phát triển, hiện đã có hàng nghìn nhà khoa học trên khắp thế giới bắt đầu ứng dụng các công cụ này vào các dự án nghiên cứu biến thể điều hòa và cơ sở di truyền của bệnh tật. Các chuyên gia trong lĩnh vực ung thư và di truyền học tin rằng những phương pháp tiếp cận này đang đặt nền móng cho việc giải thích chức năng bộ gen một cách toàn diện hơn, từ đó mở đường cho việc phát triển các chiến lược điều trị nhắm trúng đích chính xác hơn.
13 Lượt xem
Nguồn
GIGAZINE
Google DeepMind
IFLScience
SiliconANGLE
Science Media Centre
Science News
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.
