Nature:基于进化数据深度生成模型的疾病变异预测系统

量化人类疾病相关基因中蛋白质变异的致病性将对临床方案产生显著影响,但这些变异中的绝大多数(超过 98%)仍然具有未知的功能。原则上,计算方法可以提供对遗传变异的大规模解释。然而,最先进的计算方法依赖于已知疾病标签的训练机器学习模型。由于这些标签稀缺、具有偏倚性且质量参差不齐,因此,通常该模型结果被认为不够可靠。有鉴于此,美国哈佛大学医学院的Debora S. Marks和英国牛津大学的Yarin Gal等研究人员,研发出基于进化数据深度生成模型的疾病变异预测系统。
本文要点
1)研究人员提出了一种利用深度生成模型来预测变异致病性而不依赖标签的方法。通过对跨生物体的序列变异分布进行建模,研究人员摆脱了对保持适应性蛋白质序列的约束。
2)该模型EVE(变异效应的进化模型)不仅优于依赖标签数据的计算方法,而且能达到基于高通量实验的预测甚至更好,后者越来越多地被用作变异分类的证据。
3)研究人员预测了3,219个疾病基因中超过3,600万个变异基因的致病性,并为超过256,000个功能不明的变异蛋白分类提供了证据。
本文研究表明,进化信息模型可以为变异解释提供有价值的独立证据,其将在研究和临床诊断过程中具有广泛应用。
参考文献:
Jonathan Frazer, et al. Disease variant prediction with deep generative models of evolutionary data. Nature, 2021.
DOI:10.1038/s41586-021-04043-8
https://www.nature.com/articles/s41586-021-04043-8
版权声明:
本平台根据相关科技期刊文献、教材以及网站编译整理的内容,仅用于对相关科学作品的介绍、评论以及课堂教学或科学研究,不得作为商业用途。