Google DeepMind 發表 AlphaGenome:具備 1 Mb 超長上下文處理能力的 DNA 分析人工智慧

编辑者: Maria Sagir

Google DeepMind 研究團隊近日正式發表了名為 AlphaGenome 的全新人工智慧模型,標誌著計算基因組學領域邁出了重要的一步。這項研究成果已於 2026 年 1 月 28 日刊登在國際權威期刊《自然》(Nature)上。AlphaGenome 展現了卓越的技術突破,能夠以極高的精確度分析長達 100 萬個鹼基對(1 Mb)的 DNA 序列,為基因研究提供了前所未有的視野。

作為先前 Borzoi 模型的繼任者,AlphaGenome 將處理能力從約 50 萬個鹼基對提升了一倍。這種擴展後的上下文窗口使新架構能夠捕捉基因組中更長距離的調控相互作用。在技術架構上,該模型採用了 U-Net 結構,其中包含用於數據概括的編碼器、用於建模長期依賴關係的 Transformer 模塊,以及能將輸出還原至單個鹼基對解析度的解碼器。

AlphaGenome 的核心優勢在於其強大的多功能性,能同時預測十一種關鍵的基因組過程,包括基因表達、剪接(splicing)以及染色質開放性。與 Borzoi 不同,AlphaGenome 能明確預測剪接位點及其使用情況,從而提供關於 RNA 剪接過程更詳盡的資訊。根據開發團隊的數據,該模型在多項遺傳變異功能影響評估測試中均優於現有方法,特別是在 eQTL(與基因表達相關的數量性狀基因座)預測任務上,表現較 Borzoi 有顯著提升。

這項技術的應用前景廣闊,旨在加速疾病遺傳因素的識別並推動創新療法的開發。它讓科學家能更深入地探索佔人類 DNA 約 98% 的非編碼區,這些區域包含了關鍵的調控元件。許多基因組學專家指出,此類模型正將「靜態」的基因組代碼轉化為更易理解的科學發現語言。然而,研究人員也強調,AlphaGenome 目前尚不適用於直接的臨床診斷或治療方案制定,因為模型在可靠預測特定個體的基因表達變化方面仍面臨挑戰。

為了促進科學界的共同進步,Google DeepMind 已將 AlphaGenome 的原始碼與模型權重開放給非營利性研究使用,並提供 API 供實驗室整合至工作流程中。據開發者統計,全球已有數千名科學家開始利用這些工具研究調控變異與疾病的遺傳基礎。腫瘤學與基因組學專家認為,這類方法為更全面的基因組功能解讀奠定了基礎,並為開發更精準的治療策略開闢了道路。

13 浏览量

來源

  • GIGAZINE

  • Google DeepMind

  • IFLScience

  • SiliconANGLE

  • Science Media Centre

  • Science News

发现错误或不准确的地方吗?我们会尽快处理您的评论。