Nghiên cứu đột phá phanh phui những sai lệch nghiêm trọng trong bản đồ bộ gen người

13:13, 09 tháng 12

Chỉnh sửa bởi: Katia Cherviakova

Nghiên cứu đột phá phanh phui những sai lệch nghiêm trọng trong bản đồ bộ gen người-1

Một nghiên cứu mới được công bố trên tạp chí Nature Communications đã chỉ ra những “điểm mù” sinh học nghiêm trọng trong các bản đồ bộ gen người nền tảng, vốn đang được ứng dụng rộng rãi trong y sinh học hiện đại. Vấn đề cốt lõi nằm ở sự mất cân đối lịch sử trong việc thu thập dữ liệu di truyền, khi dữ liệu từ các cá nhân có nguồn gốc châu Âu chiếm tỷ lệ quá lớn. Điều này dẫn đến việc giải mã DNA không đầy đủ đối với một phần đáng kể dân số toàn cầu.

Nhóm nghiên cứu, dưới sự dẫn dắt của các chuyên gia từ Trung tâm Siêu máy tính Barcelona (BSC) và Trung tâm Điều hòa Gen (CRG), đã chứng minh rằng sự thiên vị trong các danh mục tham chiếu đang khiến hàng nghìn bản ghi chép RNA (RNA-transcript) đặc trưng cho các quần thể từ châu Phi, châu Á và châu Mỹ bị bỏ sót. Ông Pau Clavell-Revelles, tác giả đầu tiên, nhấn mạnh rằng bản đồ gen đang được sử dụng đã làm sai lệch cách diễn giải các biến thể di truyền. Đồng tác giả chính, Roderic Guigó từ CRG, xác nhận rằng phần lớn các trình tự tham chiếu đều xuất phát từ người châu Âu, vô hình trung bỏ qua các gen hoặc bản ghi chép độc đáo của các nhóm dân tộc ngoài châu Âu.

Sự thiếu sót về cấu trúc trong dữ liệu này đang che giấu những thông tin vô cùng quan trọng liên quan đến nguy cơ mắc bệnh của từng cá nhân. Nghiên cứu đã viện dẫn các trường hợp đã biết, chẳng hạn như sự khác biệt về hiệu quả điều trị thuốc giãn phế quản ở trẻ em châu Phi, hay các phản ứng phụ không mong muốn của bệnh nhân châu Á đối với thuốc chống đông máu tiêu chuẩn. Những khác biệt này có thể được lý giải chính xác bởi những khoảng trống dữ liệu này. Để khám phá ra sinh học bị ẩn giấu này, đội ngũ đã áp dụng kỹ thuật giải trình tự RNA đọc dài, phân tích các mẫu máu từ 43 người hiến tặng thuộc tám quần thể khác nhau.

Kết quả phân tích cho thấy các nhà khoa học đã phát hiện ra 41.000 bản ghi chép tiềm năng không hề tồn tại trong các cơ sở dữ liệu chính thức. Trong số đó, 2.267 bản ghi chép được xác định là độc quyền cho một quần thể duy nhất, chủ yếu là châu Phi, châu Á hoặc châu Mỹ, và trước đây chưa được khoa học biết đến. Hơn nữa, 773 bản ghi chép dường như có nguồn gốc từ các vùng gen chưa được xác định trước đây, trong đó có tới 476 gen mới được nhận dạng. Bà Marta Melé, đồng tác giả chính từ BSC, chỉ ra rằng nhiều bản ghi chép phụ thuộc vào sắc tộc mới này được tìm thấy trong các gen liên quan đến rối loạn tự miễn dịch, hen suyễn và các đặc điểm trao đổi chất.

Phân tích đã khẳng định rằng một biến thể gen SUB1 cụ thể, đóng vai trò then chốt trong việc sửa chữa DNA, có mặt ở người gốc Peru nhưng lại hoàn toàn bị các bản đồ tham chiếu hiện tại bỏ qua. Để khắc phục tình trạng này, các tác giả kêu gọi sự hợp tác toàn cầu nhằm xây dựng một bộ phiên mã toàn diện của con người (human pan-transcriptome) – một danh mục bao quát tất cả các phân tử RNA được sử dụng trong mọi quần thể. Siêu máy tính MareNostrum 5, đặt tại BSC, đã đóng vai trò then chốt trong việc xử lý hơn mười terabyte dữ liệu được tạo ra.

Giáo sư Guigó kết luận rằng phát hiện này mới chỉ là “phần nổi của tảng băng chìm”, bởi lẽ nghiên cứu chỉ giới hạn ở việc phân tích tế bào máu của người trưởng thành. Theo ông, điều này đang làm chậm lại tốc độ tiến bộ dự kiến trong lĩnh vực y học cá nhân hóa, đồng thời nhấn mạnh tầm quan trọng của việc mở rộng dữ liệu bộ gen để đảm bảo tính chính xác của các phương pháp điều trị y tế trong tương lai.