Science:华人团队利用生成式AI设计,迈向只有19种氨基酸的生命
本文来自微信公众号: 生物世界 ,编辑:王多鱼,作者:生物世界
众所周知,细胞利用20种标准氨基酸来构建蛋白质,这是当今地球上所有生命共有的保守特性。尽管翻译后修饰和非标准氨基酸的扩展可以增加构建蛋白质的氨基酸种类,但目前尚未发现任何已知的自由生活生物使用少于20种氨基酸“字母表”。
这引发了一个根本性问题:能否用简化的氨基酸“字母表”创建出一个可行的细胞?创建这样的细胞能够阐明塑造早期进化的关键生化限制,并使由更简单成分构成的合成生命成为可能。
2026年5月1日,哥伦比亚大学Harris H.Wang团队(Liu Liyuan等人为论文第一作者)在国际顶尖学术期刊Science上发表了题为:Toward life with a 19–amino acid alphabet through generative artificial intelligence design的研究论文。
该研究利用生成式人工智能,系统性替换了大肠杆菌核糖体中的所有382个异亮氨酸(Ile),并将21个重新设计的不含异亮氨酸的核糖体亚基整合到了大肠杆菌基因组中,从而生成了一个可行且在进化上稳定的细胞——Ec19。这项研究为自早期进化以来创建首个19种氨基酸的生物体提供了路线图。
研究团队表示,这项研究为设计出具备超越自然界细胞能力的细胞提供了蓝图,同时也暗示了进化早期生命依赖更有限的构建模块。

长期以来,科学家们一直试图重写生命的遗传密码,既为了拓展细胞的功能,也为了探究生命的基本法则。例如,科学家们通过去除那些与其它序列编码相同氨基酸的序列来精简DNA。但都未曾对“标准”的20种氨基酸进行改动,原因在于,改变蛋白质的氨基酸序列就如同修改精密仪器的核心部件——即使微小的变动,也极有可能导致其整体功能丧失。
实际上,已有证据支持生命有可能由更简化的氨基酸“字母表”构成,几种标准氨基酸具有相似的生化特性,它们可能在功能上存在冗余。例如,全局进化序列分析表明,异亮氨酸(Ile)是保守性最低的氨基酸之一,常常被功能相似的缬氨酸(Val)所替代。此外,计算蛋白质建模也表明,原则上仅用9-12种氨基酸就可能实现所有蛋白质折叠。
从构成蛋白质的氨基酸“字母表”中去掉一个“字母”的挑战吸引了Harris H.Wang的注意,最初,他将大肠杆菌中的39种必需或高表达的蛋白质中的所有异亮氨酸替换为大小和形状略有不同的缬氨酸或亮氨酸,但结果表明,只有约43%的替换后的蛋白质仍能在大肠杆菌中发挥功能,这表明简单的全局氨基酸替换方案是不够的。
最初不成功的尝试让Harris H.Wang把这个项目搁置了好几年。直到新一代的人工智能(AI)工具的出现,例如AlphaFold2能够预测蛋白质三维结构,而各种蛋白质语言模型能够从头设计出与天然序列有很大差异但仍具功能的全新蛋白质。这些AI工具或许能够帮助找到使用哪些氨基酸来替代异亮氨酸,同时又不会影响蛋白质性能。
接下来,研究团队使用最先进的蛋白质结构预测模型和蛋白质设计模型来提出异亮氨酸替代方案。研究团队部署了基于序列的语言模型(ESM2和MSA Transformer)以及基于结构的模型(ProteinMPNN和AlphaFold2)来生成从头设计的不含异亮氨酸的蛋白质变体,这些变体能够保持结构和功能。
不过,对大肠杆菌的4000多种蛋白质进行重新设计,显然是一项过于艰巨的任务。于是,研究团队选择了更具针对性但依然雄心勃勃的目标——核糖体。核糖体是由50多种蛋白质和具有催化作用的RNA组成的复合体,其在细胞中发挥着核心作用——将遗传指令转化为蛋白质,是细胞的蛋白质合成机器。如果这样一个系统能够在没有异亮氨酸的情况下运行,那么同样的方法或许也能应用于其他蛋白质组。
因此,研究团队专注于重新设计构成大肠杆菌核糖体的52种核糖体蛋白(其中50种含有异亮氨酸),通过迭代设计-构建-测试(DBT)框架,研究团队证明了在每种核糖体蛋白中成功重新设计并替换所有382个异亮氨酸,同时与野生型相比,保持相对细胞适应性在90%以上。值得一提的是,对异亮氨酸的替换的同时,需要进行必要的补偿性突变,因为单纯替换异亮氨酸可能会导致蛋白质局部结构失衡或功能缺陷,这就需要对异亮氨酸附近或远处有结构关联的其他氨基酸进行协同修改,以稳定结构和功能。这些由AI提出的补偿性突变,往往是人类设计者难以凭经验和直觉想到的。这也意味着着这项研究并非简单的氨基酸替换,而是整个蛋白质序列的协同重新设计。
然后,研究团队将21个不含异亮氨酸的核糖体亚基整合到大肠杆菌的单个基因组位点中以支持细胞生长。这种Ec19大肠杆菌菌株在实验室连续传代超过450代后,基因组仍保持稳定,全基因组测序未发现异亮氨酸回复突变。

这是自地球上所有现存生命的最后一个共同祖先(LUCA)确立20种标准氨基酸的“通用语言”以来,人类首次成功、稳定地简化了这套基础语法。这不是修改一个“字母”,而是永久性地从字母表中剔除一个“字母”,并让生命体在新的语法规则下稳定运行。
这项研究不仅证明了一个深刻的生物学原理(生命的氨基酸“字母表”具有可塑性),更展示了一套强大的技术工具包,它标志着合成生物学从“模仿和修饰自然”迈向了“按工程学原理重新编码生命基础”的新阶段,为创造具有定制化功能的下一代合成生物体铺平了道路。
论文链接:
https://www.science.org/doi/10.1126/science.aeb5171
#Science华人团队利用生成式AI设计迈向只有19种氨基酸的生命