Google DeepMind 发布 AlphaGenome:支持 1Mb 超长上下文的基因组分析 AI 模型
编辑者: Maria Sagir
2026年1月28日,Google DeepMind 在权威学术期刊《自然》(Nature)上发表了一项突破性研究,正式推出了名为 AlphaGenome 的新型人工智能模型。这一进展标志着计算基因组学领域迈出了重要一步。AlphaGenome 能够以极高的精度分析长达 100 万个碱基对(1 Mb)的 DNA 序列,为理解复杂的生命密码提供了更强大的数字化工具。
作为 Borzoi 模型的继任者,AlphaGenome 将处理能力从约 500,000 个碱基对提升了一倍。这种大幅扩展的上下文窗口使模型能够捕捉到基因组中更长距离的调节相互作用,而这在以往的模型中往往难以实现。在架构设计上,该模型采用了先进的 U-Net 结构,巧妙地结合了用于数据概括的编码器、用于建模长期依赖关系的 Transformer 模块,以及能够以单碱基对分辨率恢复输出数据的解码器。
AlphaGenome 的核心优势在于其卓越的多功能性,它能够同时预测 11 种关键的基因组过程,涵盖了基因表达、剪接以及染色质可及性等核心领域。与前代模型 Borzoi 不同,AlphaGenome 可以明确预测剪接位点及其利用情况,从而提供关于 RNA 剪接过程的详尽信息。研究数据显示,该模型在多数遗传变异功能后果评估测试中均优于同类方法,特别是在 eQTL(表达定量性状位点)预测任务中,其表现较 Borzoi 有了显著的质量提升。
这项技术的应用前景十分广阔,旨在加速疾病遗传因素的识别并推动新疗法的开发。由于人类 DNA 中约 98% 为非编码区,其中蕴含着大量的调节元件,AlphaGenome 的深度分析能力对于探索这些“生命暗物质”显得尤为重要。基因组学专家指出,此类模型正在将“静态”的基因组代码转化为易于理解的科学语言,从而促进新的发现。不过,研究人员也强调,AlphaGenome 目前尚不适用于直接的临床诊断或治疗方案制定,因为模型在可靠预测特定个体的基因表达变化方面仍存在局限性。
为了促进全球科学界的协作,Google DeepMind 已将 AlphaGenome 的源代码和模型权重向非商业研究任务开放,并提供了可集成至实验室工作流的 API 接口。据开发者透露,全球已有数千名科学家开始利用这些工具研究调节变异和疾病的遗传基础。肿瘤学和基因组学领域的专家一致认为,这种方法为更全面的基因组功能解读和精准治疗策略的制定奠定了坚实基础,预示着精准医疗新时代的到来。
13 查看
来源
GIGAZINE
Google DeepMind
IFLScience
SiliconANGLE
Science Media Centre
Science News
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。
