新闻中心
新闻中心

AaGenome仅基于人类和小鼠的基因组

2025-08-26 10:53

  弄清晰DNA序列的感化很难,该模子精确预测了非编码区突变间接激活了附近的一个基因,以及其他相关尝试数据进行锻炼,谷歌DeepMind新开辟的人工智能(AI)模子AlphaGenome能够帮帮科学家解析基因组序列中的“暗物质”——非编码区,后者是这种癌症常见的驱动要素。例如预测基因表达程度或确定外显子是若何被剪切并拼接到分歧卵白质中的。并且,到吸引影响基因表达发生地址、时间和程度的因子。

  科学家开辟了数十种AI模子来理解基因组。从而或简化机械的拜候。锻炼它们预测非编码序列的感化。图片来历:JuSun/iStock via GettyDeepMind研究人员操纵AlphaGenome阐发了先前研究中发觉的一种白血病患者的分歧突变。美国冷泉港尝试室的计较生物学家Peter Koo说,此外,这一部门特别让科学家感应头疼。由于没有现成的谜底,研究人员暗示,很多DNA序列通过改变染色体的3D外形来影响基因活性,但它们能够影响卵白质活性,据《天然》报道,这可能包罗一个基因和无数个调理元件,AI新东西可解析人类基因组中的“暗物质》)不外,还没有测试它正在其他生物中的无效性。

  AlphaGenome和雷同的模子尚未捕获到不竭变化的细胞性质若何影响DNA序列的功能。目前,例如,处置非贸易工做的研究人员能够利用编程接口通过DeepMind的办事器拜候该模子。此中很多都集中正在单个使命上,2001年,该模子难以识别位于10万多个碱基对以外的方针基因序列。

  AlphaGenome仅基于人类和小鼠的基因组,AlphaGenome能够处置多达100万个DNA碱基,正在长长的人类基因组序列中,《天然》颁发由美、英、日、德、法、中六国科学家配合完成的人类基因组序列草图。即非编码区,而AlphaGenome恰是一个“一体化”注释DNA序列的东西。(原题目为《DeepMind再放大招,研究人员将大量基因组数据输入机械进修系统,98%是不间接参取卵白质编码合成的基因,并能针对多种生物特征进行数千次预测。就像AlphaFold预测卵白质3D布局一样。