GRAIL与多癌种早期检测的探索

发布日期:2020-03-26武汉艾米森生命科技有限公司
Joshua J. Ofman, MD, MSHS; Megan P. Hall, PhD; Alexander M. Aravanis, MD, PhDGRAIL, Inc., 1525 O’Brien Dr., Menlo Park, CA 94025
work

尽管癌症的治疗方面取得了巨大的进步,癌症依然是全球第二大健康杀手。在2018年,全球超过950万人死于癌症,平均每分钟大约18人死于癌症。除了死亡人数及其对病人和家庭的毁灭性影响外,癌症还对社会造成了惊人的经济损失。在美国,由于2019年癌症死亡情况预计导致美国收入损失944亿美元,更有甚者,预计2020年癌症医疗总成本为1570亿美元。

在大多数情况下,癌症导致的损失如此巨大,主要是由于患者被检测时已经是中晚期,往往发生转移并扩散到身体的其他部位。一旦发生转移,治疗将变得困难并且价格昂贵,然而生存率显著降低(如图1):局部癌症患者5年生存期为89%,然而转移癌患者的5年生存期仅有21%。肺癌是美国男性与女性的头号癌症杀手,早期肺癌与晚期肺癌的5年生存率分别为56%与5%,然而,晚期肺癌患者治疗花费是早期肺癌患者治疗花费的2倍以上。对于所有的癌症而言,即便是降低1%的癌症死亡率,也会对社会带来千亿美金的价值。

work
按诊断时疾病发展阶段划分的美国五年癌症生存率(2009-2015年)

局部癌症(绿色条)的患者比转移癌(褐色条)的患者的5年生存期显著更长,转移癌表示癌症已经扩散到身体的其他部位。

在美国,一生中被诊断出癌症的概率高达1/3,但目前普通人群中仅有少数癌症被筛查包括乳腺癌、宫颈癌、结肠癌、肺癌和前列腺癌。超过60%的癌症诊断和死亡属于缺乏筛查模式的癌症类型,2019年美国估计有1,762,450例新癌症病例,其中仅有614,010例是由于筛查癌症筛查发现的。不同的是,1,148,410例是由于未经筛查的癌症而导致的新病例数量,这可能会随着未来人口的增长而升高。

大多数癌症没有进行筛查,因为它们在普通人群中的患病率太低,无法根据单个癌症进行筛查。然而,当在一次检测中对多种癌症进行筛查时,需要进行癌症筛查的人数就会下降。因为体内的所有细胞都可以(直接或间接)进入循环系统,血液是一种极具前景的多癌种检测分析物

work
癌症筛查模式

(A)目前,癌症筛查是针对特定器官的,这意味着一个器官的一项检测结果不能向患者或其医生提供身体其他部位其他类型癌症的任何信息。在普通人群中,只有五种癌症(乳腺癌、肺癌、结肠癌、宫颈癌和前列腺癌)被筛查出来。

(B) 一项基于血液的多种癌症早期检测试验可以从一次抽血中检测出50多种以上的癌症,其中许多是未经筛选的。CT,计算机断层扫描。*前列腺癌筛查是按每个病人进行的。

在GRAIL,我们相信基于血液的多种癌症早期筛查方法可以帮助克服器官特异性筛查试验的局限性,在治疗更可能成功的时候更早地发现癌症。实现这一目标是医疗领域最雄心勃勃的事业之一,这正是我们致力于做的事情。

过去的成功,现在的局限

宫颈癌Pap筛查检测是早期发现减轻癌症负担的最好例子之一。自1950年以来,Pap检测使美国宫颈癌10年的死亡率降低了约70%。其他癌症筛查检测,如乳腺摄影、结肠镜/粪便检查和低剂量计算机断层扫描(LDCT),也分别有助于降低乳腺癌、结直肠癌和肺癌的死亡率。

尽管取得了这些成功,但由于现有检测的高假阳性率和对非致命性癌症的潜在过度诊断,对癌症筛查的建议仍存在争议。如果所有50至79岁的美国人都按照美国预防服务特别工作组(USPSTF)的现行筛选建议,按照历史符合率,将有大约900万例阳性检测结果,其中15.1万例为实际癌症,即假阳性率是真阳性率的60倍。

基于PSA的前列腺癌筛查是高假阳性和过度诊断典型。2018年,美国USPSTF前列腺癌筛查得出结论,尽管PSA筛查可以使一些男性受益,但由于过度诊断和过度治疗,许多男性会受到伤害,包括假阳性结果带来的心理伤害和随后活检和治疗带来的痛苦体验及并发症。大型随机临床试验表明,20%到50%的男性在没有前列腺癌的情况下PSA检测结果显示阳性。此外,在患有前列腺癌的男性中,许多人没有必要接受治疗,因为大多数前列腺癌进展非常缓慢,可能永远不会出现症状。

阳性预测值,即阳性检测结果为真阳性的可能性,对于大多数现有的指导性筛查试验来说也是非常低的(通常<5%),结肠镜检测除外,它是结直肠癌的金标准。因此,大多数筛查试验只有在用于检测有较高患筛查癌症风险的个体时才是可行的,而且在一般人群中检测癌症的能力有限。

一种新的癌症筛查方法

为了克服单个器官筛查试验的局限性,GRAIL开发了一种研究性多癌种早期检测试验,可以从单管血液中检测DNA中的癌源性信号。本试验符合我们认为的安全有效的多癌种早期检测试验的关键标准(表1),包括在高风险人群(例如,50岁以上)中的最大癌症检测(同时检测50多种癌症);优先检测致命癌症以避免过度诊断惰性癌症;极低的假阳性率;易用性;以及对起源组织的预测(也包括)或癌症开始的部位,临床医生需要对其进行进一步的临床和诊断评估并指导治疗。

work

癌症生物学、DNA测序技术和大数据数据分析等方面的巨大进展,为多癌种早期检测提供了技术基础。例如,癌症细胞会向血液中释放DNA片段的科学发现,是我们从血液样本中检测癌症的物质基础。由于cfDNA片段来自于细胞基因组,因此对这些基因片段进行测序和分析可以揭示体内的细胞是正常的还是已经癌变。

然而,血液样本中的癌症信号噪声比通常非常低,相当于数千个正常cfDNA片段中仅有一个肿瘤cfDNA片段,这使得检测和分析面临巨大挑战。有三个问题限制了临床敏感性:
(1)体内正细胞比肿瘤细胞多,导致背景cfDNA片段比肿瘤cfDNA片段显著丰富;
(2)大多数正常cfDNA来自血细胞,它们积累了常见的与衰老相关的变异(由于克隆性造血),类似于癌症变异;
(3)DNA测序不完美,会引入测序错误。

许多化学和计算方法(例如,数字PCR和分子条形码)已经被开发出来,用于放大信号和减少错误以实现早期癌症检测所需的临床敏感性。然而,要实现多癌种检测所需的临床性能(例如,临床有用的敏感性、高特异度和组织器官准确定位)一直是挑战,因为这些大多是基于肿瘤突变的检测。与非癌症来源的突变相比,肿瘤突变在人类基因组的每兆碱基中相对罕见,例如那些起源于克隆性造血的突变,很少有突变能确定确切的癌症类型。

在我们的测试中,我们采用DNA甲基化实现了高特异性(低假阳性率),DNA甲基化是一种控制何时何地不同基因组指令的生物机制。与只影响少数基因组位置的基因突变相比,人类基因组中有近3000万个CpG位点,可以被甲基化或非甲基化,使它们成为检测癌症的普遍而丰富的信号来源。 利用高效的靶向亚硫酸氢盐测序和机器学习技术,我们可以阅读DNA甲基化序列并识别异常甲基化的DNA序列。 在我们的多癌种早期检测试验中,我们分析了超过10万个甲基化区域(包括约100万CpG位点),通过评估基因组中甲基化模式表明是否存在癌症。 此外,我们还利用不同的细胞类型有独特的DNA甲基模式,用来确定癌症在身体中的位置(见上图1)。

我们的早期研究表明,WGBS分析甲基化模式方法优于WGS测序和靶向基因突变测序。这主要是由于DNA甲基化的生物学特性,使其在低信噪比情况下更加有效。具体来说,DNA甲基化位点数量多、分布广,与癌症检测和组织溯源相关的DNA甲基化区域可以用于深度测序。测序深度是衡量测序数据质量重要指标,对于检测低丰度cfDNA的肿瘤突变并将其与DNA测序错误区分开来至关重要。 此外,使用靶向突变方法检测肿瘤突变也可能被自然衰老相关的克隆造血变异所混淆,这些变异可能被错误分析为癌症。为了避免这些潜在的假阳性以实现高特异性,基于突变的方法需要对白细胞进行平行测序,以筛选出这些非癌症变体。由于这些变异很少影响DNA甲基化位点,基于甲基化的癌症检测测试不再需要额外的测序。我们开发了一种叫做Classifiers的机器学习模型,它可以区分癌症特异性信号(异常甲基化模式)和非癌症信号(正常甲基化模式)。使用专有的DNA甲基化模式数据库对Classifiers进行训练,这些数据来自数千名被诊断患有不同类型癌症的患者和非癌症人群(包括健康人群和其他疾病患者)。据我们所知,这个甲基化数据库是世界上最大的甲基化数据库,同时也是用于靶向甲基化多癌种早期检测试验分类器性能的关键。

从实验室到临床应用

我们设计了一个严格的流程来开发基于血液的多癌种早期检测试验,用于大规模人群的癌症筛查(图4)。该过程包括迄今为止最大的临床基因组学计划之一,涉及4项临床研究,涵盖北美和英国总共有180,000多名参与者。这些参与者具有不同的人口统计特征,包括癌症患者(所有类型和阶段)和非癌症患者(健康或其他疾病人群),确保我们的多癌种早期检测测试对尽可能多的人是安全、有效和有用的。

work
利用血液中的DNA甲基化模式追踪肿瘤

一种基于靶向甲基化的多癌种早期检测方法可以识别血液样本中cfDNA片段中DNA甲基化模式的差异。这些模式是不同细胞类型的特征,异常甲基化的cfDNA可以用来检测癌症并定位癌症发生位置。

这4项研究中的第一项,即CCGA研究(www.clinicaltrials.gov NCT02889978),已经从142个地点招募了15,254名参与者。将CCGA分为三个预先指定的子研究,以开发用于多癌种早期检测和多癌种早期识别的机器学习分类器:子研究1(发现,先前已报道),确定了具有最高性能检测方法,以供进一步开发;子研究2(训练和验证),基于更新的靶向甲基化测序方法对癌症检测和癌症定位分类器进行训练与验证;子研究3(最终验证)用于验证优化版本的靶向甲基化方法(该分析正在进行中)。第二个亚研究包括来自CCGA的近4500个癌症(包含所有分期的超过50个癌症类型)和非癌症样本,分为3133个样本的训练集和1354个样本的独立验证集。为了优化测试特异性,该数据集与来自无癌症参与的STRIVE研究的2200多个样本(训练集中的1587个样本,验证集中的615个样本)相结合(NCT03085888)。第二个亚研究的靶向甲基化方法正在用于临床研究(NCT04241796)中使用,该研究将结果返回给医生和患者。

在验证数据集中,多癌种早期检测的假阳性率为0.7%,总的检测灵敏度(真阳性率)为54.9%(95%可信区间[CI]:51.0-58.8%)。所有已知肿瘤分期的癌症样本的敏感度和95%的顺式指数分别为:I期(n=185),18%(13-25%);II期(n=166),43%(35-51%);III期(n=134),81%(73-87%);和IV期(n=148),93%(87-96%)。96%的阳性样本进行癌症溯源分析;其中93%的溯源预测是正确的。癌症溯源结果的准确性不受癌症类型或肿瘤分期的影响。以上结果表明,多癌种早期检测试验可以同时检测50多种癌症类型,低假阳性率小于1%,并且能够准确定位癌症部位。

研究遵循人群层面的癌症筛查,早期研究结果支持多癌种早期检测试验的进一步临床应用,包括将结果返回给患者和医生。

work

创建了机器学习分类器开发多癌种早期检测试验,随后在人群规模的临床研究中进行了分析验证和试验。这种严格的方法将有助于优化测试性能,并证实其在广大人群中的实用性。NCT,ClinicalTrials.gov;TBD,待定。

我们用五项研究对多癌种早期检测试验进行了分析验证:
a. 非癌症样品中的特异性;
b. 癌症样品中的敏感性;
c. 重复性(试剂之间、仪器之间、实验之间和操作人员之间的一致性)
d. 不同cfDNA片段数量的测试性能;
e. 四种潜在干扰物质(血红蛋白、胆红素、甘油三酯和白细胞基因组DNA)的测试性能。

此外,我们的四个前瞻性临床试验,以开发多癌种早期检测试验并验证其在现实世界、预期使用人群中的检测性能:
a. CCGA(NCT02889978)-一项前瞻性的、多中心的、观察的、病例对照的纵向随访研究。这项研究的目的利用15000名美国癌症或非癌症人群cfDNA甲基化数据开发和验证基于血液的多癌种早期检测试剂。
b. STRIVE(NCT03085888)–一项前瞻性、多中心、观察性、队列研究,并进行纵向随访。这项研究旨在验证多癌种早期检测试验在真实世界中的有效性,在美国接受乳房X光检查的女性约有10万;
c. SUMMIT(NCT 03934866)–一项前瞻性、多中心、观察性、队列研究,并进行纵向随访。这项研究的目的是在第二个真实世界中验证多癌种早期检测试验,在英国,预期使用人群约为5万非癌症人群,其中一半不是高风险人群,一半是高风险肺癌吸烟者;
d. PATHFINDER(NCT 04241796)–一项前瞻性多中心研究,对美国约6200名不同癌症风险水平的患者进行纵向随访。这项研究将首次将多癌种早期检测结果返回给临床医生。

总之,这些研究将使我们能够开发出最好的多癌种早期检测试剂,高特异性的检测癌症信号,并准确进行癌症溯源定位,补充现有的癌症筛查指南。

多癌种早期检测的价值

多癌种早期检测早期检测有望成为一项非常有价值的医疗服务,它不仅能够同时检测癌症和确定癌症部位,同时尽量减少假阳性结果。对美国国家癌症研究所监测、流行病学和最终结果(SEER)数据库的分析以及对癌症自然史的估计预测,对50至79岁的个人进行多癌种早期检测,每年可能避免约11万人死亡。考虑到癌症诊断从晚期转移到早期阶段对个人和社会的潜在益处,在当前指南建议的筛查中增加多癌种早期检测试验,癌症预防和治疗干预措施方面的每个生命年成本预计更加符合卫生经济学。早期发现花费少并且生存期长,而晚期癌症患者治疗费用高达数十万美元,往往只能延长几个月的生存期。此外,注重癌症的早期发现和早期治疗符合不断变化的卫生服务模式,有利于预防和保健,以降低成本。

通过早期发现转变癌症护理

基于血液的多癌种早期检测试剂可以潜在地减轻癌症给患者、患者家庭、医疗系统和社会的巨大负担。在现有癌症筛查检测的基础上增加这项测试,将扩大目前未筛查癌症的检测网络,使更多的癌症能够比目前更有效地被发现。

根据SEER数据库中的癌症发病率数据和第二个CCGA子研究中的测试性能数据,我们预测在当前美国指南推荐的乳腺、肺筛查试验中加入多癌种早期检测试验,在50至79岁的美国人中,符合筛查条件的结肠癌和宫颈癌患者可以检测出约615,000例,而通过标准筛查仅检测到150,000例。值得注意的是,目前筛查试验的真阳性结果将伴随着估计900万假阳性,而多癌种早期检测试验的增加预计只会产生的64万假阳性。这些数字相对于标准癌症筛查试验的信噪比(真阳性与假阳性比)为1:60,而筛查试验加上多癌种早期检测试验的信噪比为1:16,提高了四倍。因此,在目前的筛查测试中,多癌种早期检测测试可以帮助检测出4倍多的癌症,而误报率仅为7%。

在GRAIL,我们通过早期癌症检测改善和挽救生命的使命比以往任何时候都更接近现实。在医疗保健领域,癌症早筛将对公共卫生产生最为重大的影响,我们致力于改变癌症死亡率的轨迹,并将利益相关者聚集在一起,以便能够广泛采用创新、安全和有效的技术,从而改变癌症防控和癌症护理。这条道路可能并不容易,但我们相信这是对全世界的患者、提供者、社区和医疗系统而言正确的道路。

REFERENCES
1. World Health Organization. All Cancers Fact Sheet (2018). Available at: http://gco.iarc.fr/today/data/factsheets/cancers/39-All-cancers-fact-sheet.pdf [accessed 11 February 2020].
2. Islami, F. et al. JAMA Oncol. 5, e191460 (2019).
3. Mariotto, A. B., Yabroff, K. R., Shao, Y., Feuer, E. J. & Brown, M. L. J. Natl Cancer Inst. 103, 117–128 (2011).
4. Siegel, R. L., Miller, K. D. & Jemal, A. CA: Cancer J. Clin. 69, 7–34 (2019).
5. Hawkes, N. BMJ 364, l408 (2019).
6. Howlader, N. et al. SEER Cancer Statistics Review, 1975–2016. Available at: https://seer.cancer.gov/csr/1975_2016> (2019) [accessed 11 February 2020].
7. Banegas, M. P. et al. J. Natl Compr. Canc. Netw. 16, 402–410 (2018).
8. Murphy, N. K. & Topel, R. H. The value of health and longevity (NBER Working Paper 11405). (National Bureau of Economic Research, Cambridge, MA, 2005).
9. Ahlquist, D. A. NPJ Precis Oncol. 2, 23 (2018).
10. Wingo, P. A. et al. Cancer 97, 3133–3275 (2003).
11. Ofman, J. J. in Patient-Centered Oncology Care 2019 (American Journal of Managed Care, Philadelphia, PA, 2019).
12. U. S. Preventive Services Task Force et al. JAMA 319, 1901–1913 (2018).
13. Liu, M. C. et al. (in press).
14. Huang, C. C., Du, M. & Wang, L. Cancers (Basel) 11, 805 (2019).
15. Thierry, A. R., El Messaoudi, S., Gahan, P. B., Anker, P. & Stroun, M. Cancer Metastasis Rev. 35, 347–376 (2016).
16. Razavi, P. et al. Nat. Med. 25, 1928–1937 (2019).
17. Pfeiffer, F. et al. Sci. Rep. 8, 10950 (2018).
18. Soto, J., Rodriguez-Antolin, C., Vallespin, E., de Castro Carpeno, J. & Ibanez de Caceres, I. Transl Res. 169, 1–18 e11 (2016).
19. Oxnard, G. R. et al. Ann. Oncol. 30, v912 (2019).
20. Oxnard, G. R. et al. J. Clin. Oncol. 37, 1545 (2019).