热门资讯> 正文
2025-08-04 13:05
迄今为止发布的最全面的基于家族的变异数据集将使用基于人工智能的工具改进变异分类
加州门洛帕克,2025年8月4日(GLOBE NEWSWIRE)——领先的高质量、高精度测序平台提供商PacBio(纳斯达克股票代码:PACB)今日宣布了一项发表在《自然方法》( Nature Methods)杂志上的研究成果,该研究描述了一套全新、全面的基因组变异真值集,能够表征简单变异和复杂变异。这些改进的基准测试已用于重新训练谷歌的DeepVariant(一款流行的基于人工智能的变异检出工具),结果将错误检出的变异减少了34%。该资源(Platinum Pedigree)由PacBio的科学家与华盛顿大学、犹他大学和其他几家机构的研究人员合作开发。
该基准将基于遗传的验证与长读测序相结合,准确地表征变异,即使在基因组中困难的、重复丰富的区域中也是如此,从而产生迄今为止最完整的已验证遗传变异视图。
“涵盖所有变异类型的全面基准数据集,对于基因组学方法开发和AI驱动工具的应用,以及我们理解基因组变异在研究和诊断方面的应用至关重要,”PacBio首席作者兼高级经理Zev Kronenberg表示。“Platinum Pedigree基准不仅涵盖易于测序区域中的简单变异,还涵盖了整个基因组的变异,包括之前由于其复杂性而被排除在基准之外的区域。”
Platinum Pedigree 数据集基于三个测序平台对一个包含 28 名成员的多代家族 (CEPH-1463) 进行深度测序而开发。通过追踪从父母到多个子女的遗传变异,该研究可靠地记录了超过 37 Mb 的家族内遗传变异,涵盖从单核苷酸变异到大型结构变异的各种类型。
该数据集引入了首个大型谱系验证串联重复序列和结构变异真值集。它还增加了超过 2 亿个碱基,将基准区域扩展至 2.77 Gb,涵盖了难以映射的区域,例如片段重复和低复杂度区域。
为暗基因组建立的基准
为了证明改进的基准测试对改进人工智能和机器学习方法的价值,研究人员使用 Platinum Pedigree 基准数据重新训练了谷歌的 DeepVariant(一款利用深度学习识别基因变异的流行软件工具)。更新后的 DeepVariant 模型将全基因组范围内的错误率降低了高达 34%,并且在基因组中最具挑战性的区域取得了更高的收益。
“这项基准测试在最重要的方面提升了准确性,”PacBio 计算生物学资深作者兼副总裁 Michael Eberle 表示。“它能够更好地评估变异调用流程,并加速最终覆盖全基因组(包括一些对人类健康至关重要的复杂区域)的方法的开发。”
临床和群体基因组学的新标准
Platinum Pedigree 基准测试免费提供,目前已被科学家用于开发新的序列分析工具和验证临床测序工作流程。它还为未来的基准测试工作提供了路线图,尤其是涉及 T2T-CHM13 等更完整基因组的基准测试。
完整的数据集、分析代码和流程均公开发布于:https://github.com/Platinum-Pedigree-Consortium。
关于研究
这项研究名为“白金谱系:基因变异的长读基准”,于 2025 年 8 月 4 日发表在《自然方法》杂志上。它由 PacBio、华盛顿大学和犹他大学的科学家领导,并得到了美国国立卫生研究院和霍华德休斯医学研究所的支持。
关于PacBio
PacBio (NASDAQ: PACB) 是一家领先的生命科学技术公司,致力于设计、开发和生产先进的测序解决方案,帮助科学家和临床研究人员解决复杂的遗传学问题。我们的产品和技术(包括 HiFi 长读长测序)涵盖广泛的研究应用,包括人类生殖系测序、动植物科学、传染病和微生物学、肿瘤学以及其他新兴应用。欲了解更多信息,请访问www.pacb.com并关注 @PacBio。
PacBio产品仅供研究使用。不可用于诊断程序。
前瞻性陈述
本新闻稿包含经修订的1934年《证券交易法》第21E条和1995年《美国私人证券诉讼改革法》所定义的“前瞻性陈述”。除历史事实陈述外,所有陈述均为前瞻性陈述,包括与PacBio产品或技术的用途、优势、质量或性能,或使用PacBio产品或技术的益处或预期益处相关的陈述,包括与Platinum Pedigree数据集相关的陈述、其在更好地评估变异调用流程和加速开发全基因组方法方面的潜力以及其他未来事件。您不应过分依赖前瞻性陈述,因为它们受假设、风险和不确定性的影响,这些假设、风险和不确定性可能导致实际结果与当前预期结果存在重大差异。这些风险包括但不限于基因组测序技术的快速变化和激烈竞争;成本或费用的意外增加;以及与一般宏观经济状况和地缘政治不稳定相关的其他风险。其他可能对实际结果产生重大影响的因素,请参阅PacBio最近提交给美国证券交易委员会的文件,包括PacBio最新的8-K、10-K和10-Q表格报告,以及“风险因素”标题下列出的因素。这些前瞻性陈述基于当前预期,仅代表截至本声明发布之日的观点;除非法律另有规定,否则PacBio不承担修改或更新这些前瞻性陈述以反映未来事件或情况的义务,即使有新的信息可用。
联系方式
各位投资者、媒体朋友:
托德·弗里德曼
ir@pacificbiosciences.com
媒体: