1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录
麻省理工科技评论 2020-07-22

2020-07-22

覆盖胃癌、食管癌、结直肠癌、肺癌和肝癌。
覆盖胃癌、食管癌、结直肠癌、肺癌和肝癌。

人们都害怕得癌症,如果是已发生的事实,退一步的希望是,早筛查早治疗。

最新的研究报道,一项基于血液的检测技术,有潜力提前常规诊断4 年,对 5 种常见癌症做出早期筛查。这 5 种癌症分别是胃癌、食管癌、结直肠癌、肺癌和肝癌。除了乳腺癌,它几乎囊括了中国人发病最多的六大癌症种类。

该论文今日发表在《自然 - 通讯》上,研究的通讯作者一共有五位,分别是瑞典卡罗琳斯卡医学院终身教授叶为民,华人学者高远和张鹍、刘蕊,复旦大学常务副校长、生命科学学院教授金力院士。

其中,张鹍是加利福尼亚大学圣地亚哥分校生物工程系终身教授,高远为约翰霍普金斯大学生物工程系副教授。两位学者的学术渊源颇深,在哈佛医学院时,一起师从著名遗传学大牛 George Church 教授。刘蕊是美国宾夕法尼亚大学遗传学博士,曾在加州大学圣地亚哥分校(UCSD)生物工程系担任博士后和副研究员。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

图|论文《在常规诊断前 4 年用血液检测进行癌症的无创早期检测》(来源:Nature Communication)

相比于传统的影像筛查、侵入式组织活检,近年来 “液体活检” 技术被寄予厚望。液体活检(liquid biopsy),也就是通过血液样本检测来进行早期癌症筛查。

亚洲网正因为被寄予厚望,才可能出现臭名昭著的骗局:一滴血验癌。创业公司 Theranos 在没有核心技术的情况下,靠讲述 “仅仅一滴血就可以检验出多种癌症” 的故事,在硅谷一路融资,行骗十年。现在人们已经知道,一滴血的样本量过小,没有足够的癌症标志物,不可能实现所谓的筛查。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

亚洲网图|滴血验癌骗局“主人公” 伊丽莎白 · 霍姆斯(来源:Sovereign)

但是通过较小剂量的血浆(5-10ml),检测其中的标志物,从而实现癌症早筛,一直是非常有前景的技术。

新方法:找到最佳的肿瘤信号位点

在影像检验出人体明显的癌变症状前,早期癌症患者的血液中就已经出现了一些标志物。这就是通过血液来筛查癌症的原理。

循环肿瘤 DNA(circulating Tumer DNA,简称ctDNA )就是一种标志物。自然或非自然死亡的细胞会释放出 DNA 到血液中,这其中,来自死亡肿瘤细胞的 DNA,就是 ctDNA。当肿瘤负荷增加时,患者 ctDNA 的水平会升高。因此它可以被当作检测肿瘤的指标。研究已经证明,ctDNA 可以用作多种不同实体瘤类型和临床适应症的生物标记,成为最有应用前景的肿瘤标志物。

要尽量早筛查出癌症,需要检测方法对标志物的高灵敏度。

这篇研究论文设计了一种基于 ctDNA 甲基化的无创性血液检测方法,研究人员将其命名为:PanSeer。

首先,以 ctDNA 甲基化作为更敏感的标志物。

在肿瘤的早期阶段,ctDNA 在血液中的含量其实较低,需要极深的测序深度才能有效检测。而 ctDNA 甲基化相较于 ctDNA 肿瘤体细胞突变,可以作为更早的肿瘤标志物被检测到。

DNA 甲基化是基因表观遗传学修饰方式之一,DNA甲基化发生的区域被称为 CpG 岛。健康人基因组中,CpG 岛中的 CpG 位点通常是处于非甲基化状态,当一些抑癌基因 CpG 岛中的 CpG 序列呈高甲基化状态时,引发肿瘤生长或组织癌变。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

图 | 循环肿瘤 DNA

为了提高检测灵敏度,这项研究使用了一种叫做半靶向 PCR 的核心技术。张鹍介绍,半靶向 PCR 方法团队过去四五年开发的一个核心技术,目前在中美都申请了专利。

传统测序文库构建方法具有较高的 DNA 丢失率,检测灵敏度可能会受到限制。采用半靶向 PCR 方法, 每个扩增子只需要一个连接事件和一个 PCR 引物,使得单分子计数的分子回收率比传统方法高。

检测的点位也很关键。张鹍告诉 Deeptech,这项工作覆盖的 10613 个 CpG 位点分布在 595 个区,是根据过去十几年的文献,包括美国肿瘤基因组计划(TCGA)的数据,再加上团队在更多肿瘤样本筛选的内部数据整合起来,挑选出了最有可能检测出肿瘤信号的位点。

也正是这些点位的选择,使得 Panseer 技术能够一次检测覆盖 5 种癌症。张鹍表示,PanSeer 技术在性能上比现有的 DNA 甲基化测序方法高效、快速、成本可控。

回顾性样本分析:敏感度 95%

这项研究的样本来自一项逾 12 万人的大型调查——泰州人群健康跟踪调查(Taizhou Longitudinal Study,TZL)。

泰州人群健康跟踪调查由上海复旦大学和泰州政府合作进行 ,始于 2007 年。目的是通过对人群慢性疾病的长期追踪,来探讨常见非传染性疾病的环境和遗传风险因素。在 TZL 中,123115 名受试者提供的血浆样本进行了长期储存。张鹍团队对来自于其中的样本进行了回顾性分析。

经过筛选,研究人员确定了 414 个健康的样本(截至 2017 年,都没有癌症记录),191 个诊断前样本(最初采集时无症状,在之后的 4 年内确诊为癌症),223 个诊断后样本(在最初采集样本时即为癌症患者)。并将样本划分为训练集和测试集,进行分析时,使用平均 12ng 血浆 DNA。

为了确保识别的信号来自癌组织,研究人员还使用了来自商业生物样品供应商的 200 份原发肿瘤和正常组织样本。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

亚洲网图 | 复旦大学泰州健康科学研究院(来源:官网截图)

对于每个样本,先计算单个样本每个靶基因区域的平均甲基化分数,然后用使用机器学习算法,将样本分为健康人和癌症患者。张鹍介绍,“我们用机器学习的算法,把基因组里 595 个区的甲基化信号整合起来转换成一个打分,用于判断是否有肿瘤。”

基于训练集样本的平均甲基化分数,研究人员训练出了一个逻辑回归(LR)分类器,再使用测试集进行验证。在训练集中,当选择的特异性为 95% 时,对诊断后样本的敏感性为 88%,对诊断前样本的敏感性为 91%。

在测试集上进行验证的结果显示,整体的特异性为 96% 时,对诊断后样本的敏感性为 88%。敏感性达到了与训练集相近的水平,这表明 PanSeer 能够检测出后诊断样本,即肿瘤患者的血液样本。

Panseer 这一方法能否尽早筛查出癌症样本?

研究人员重点分析了测试集的 98 个诊断前样本,这些样本的主人在之后的 4 年内被诊断为癌症。测试集的结果显示,对这些样本的敏感度为 95%。

张鹍表示,利用复旦泰州人群队列的独特样本库,团队证明了在肿瘤病人常规诊断的 1-4 年前就可以看到肿瘤特异性的甲基化信号,真正证明了肿瘤早筛的可行性。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

图|训练集和测试集的敏感性和特异性,并根据常规测试在癌症诊断前的年数将其分为子类(来源:论文)

此外,研究进一步使用 Kruskal-Wallis 方法进行事后检验,对患者年龄、性别、采集日期、采集地点、吸烟状况等因素进行协变量分析,以及提取的总 DNA 量,以确保其他临床或采集因素不会影响 PanSeer 试验在常规诊断前检测癌症的能力。

观察到的唯一影响分析准确度的因素是,2010 年之前采集的健康样本的特异性降低(约占本研究健康样本的四分之一),而敏感性保持一致。由于 DNA 降解,这些样本的较长储存时间可能导致特异性降低。

尽管存在这种变异性,不管临床协变量状态如何,总体敏感性和特异性仍然很高。因此,PanSeer 分析能够在常规诊断前 4 年利用甲基化信号检测癌症,而不考虑临床协变量。

亚洲网论文也提及了研究目前的局限性。首先,分析是回顾性,PanSeer 能否大幅改善癌症患者的门诊治疗效果仍需要一个长期的前瞻性研究。

其次,TZL 样本的时间范围较长,在样本采集过程中没有使用现代血浆保存技术,可能导致不同程度的基因组 DNA 污染,且每个样本只有 1 毫升血浆可用,如果采用通常医院体检使用的 10 毫升抽血和更好的血浆保存技术,PanSeer 检测灵的敏度可能会进一步提高。

此外,一些基因组区域在癌组织和癌血浆之间并没有表现出一致的甲基化模式,虽然这可能是由于样本类型之间的内在差异,但也可能存在一些未知的混杂因素,接下来对癌症诊断前检测的额外验证也非常重要。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

图|张鹍 (左) 和高远(右)(来源:鹍远基因)

商业化尝试始于 2014 年

商业化的探索其实早已开始。张鹍除了是美国加利福尼亚大学圣地亚哥分校(UCSD)生物工程系终身教授,还是 “鹍远基因” 的联合创始人兼科学顾问。该公司是国内肿瘤早期筛查和精准诊断公司。

2014 年 7 月,张鹍和美国约翰霍普金斯大学生物工程系副教授高远联合创办了鹍远基因(Singlera Genomics),“鹍远”便来自这两位创始人的名字。两人在哈佛医学院时,一起师从著名遗传学大牛 George Church 教授(George Church 现在也是该公司的科学顾问),后来,前赛默飞世尔(Thermo Fisher Scientific)中国区医疗业务副总裁 / 总经理张江立也加入其中,担任 CEO 一职。此次研究的通讯作者刘蕊,也是鹍远基因的联合创始人之一,担任CTO一职。

目前,鹍远旗下包括鹍远基因和鹍远健康两个子品牌,致力于开发基于高通量测序和甲基化技术的肿瘤早期筛查和诊断产品。据公开资料查询,该公司已获得超过 8000 万美元的融资。

1次验血,提前4年预警5种高发癌症,华人学者刷新癌症早筛纪录

图|鹍远基因融资历程(来源:企查查)

张江立向 DeepTech 表示,接下来,团队将开展扩大样本、扩大癌种的多中心验证和临床试验,争取早日能够推向市场。同时研发团队也可利用类似的策略,开发其它单项癌种的早筛产品,其中肠癌早筛产品已经在美国和中国同步开始 FDA/NPMA 注册申报。其它如肺癌、胰腺癌、甲状腺等早筛产品也接近研发完成。

麻省理工科技评论

From Tech to Deeptech