二、基因测序的误区和瓶颈
1.水晶球只是童话——风险评估预测为何不靠谱
人类对不确定性的恐惧和好奇一直存在,基因测序可否用来做患病风险评估,成为一个预测未来的水晶球?理论上来讲是可以的,反正人生都是在各种概率中前行。但实际上能用于指导实践还是有很多疑问。首先要确定个体基因测序的结果是否偏离了正常人群,就要有一个统一、科学、标准的数据库,遗憾的是现在还没有。大部分公司的做法是自己构建数据库,加入临床上确认的和科研上研究比较多的一些突变位点,受检者测序后和这个数据库进行比对,看看有没有出现这些突变。然后根据这些突变发生的情况,给出一个患病的百分比概率。但是,问题在于:1)这个数据库是否可靠,很难证明。有相关性也不代表就是因果;2)已明确和临床疾病有关的突变实际上是相当少的,很多突变即使有了也不一定就意味着会发病;3)除了遗传病(如罕见病)以外,大部分疾病是多基因相关,并且和后天环境也很有关系,单靠基因测序并不能够完全模拟发病的所有相关因素;4)这个百分比概率是用什么软件模型算出来的,软件是否靠谱,很难说。即便说个体的患病风险比正常人群高了5个百分点,是否说该个体就有更高的患病可能,很值得商榷,对临床也没有任何指导意义,概率并不能用于进入临床诊疗标准。基于上述原因,目前几乎每一家公司测出来的疾病风险都不同。目前的风险评估预测,除了影响心情以外,没什么实际意义。
风险评估预测不靠谱:至于一些什么儿童性格基因和天赋基因商业检测,更加荒唐。学术界至今没有公认哪个基因跟天赋有必然联系,拿着一些发表的探索性研究文章,就说是业界证实的结果,忽悠行业外的老百姓赚钱,既不科学,也不道德。
2.是否应该进行全基因组测序?
从科研角度来说,完全没有问题,但在临床应用方面就不是了。除了遗传病以外,目前很多基因和疾病的关系都只是“可能”,还没有定论,即便是BRCA1,也只能说近乎“公认”跟遗传性的乳腺癌有关。一堆解释不清的测序结果,对医生和病人来说都没有意义,病人却因此要承担更高的检测成本,未来不会得到卫生政策部门的赞同。检测某肿瘤,是否一定要测一大群基因?和肿瘤的关系都明确相关吗?这些基因对该肿瘤的诊治意义有多大?临床诊断指标,“多”不重要,“明确”才最重要,有多个明确相关指标,则是好上加好,利于综合判断,而做多少检测,还要从临床实际判断出发。这就好像你发烧咳嗽到医院去看病,医生除了给你验血常规以外,又给你查生化全套,又给你查SARS病毒,又让你去做包括PETCT在内的所有影像学检查看看是不是癌症,末了再来个骨髓穿刺查白血病,因为癌症和白血病也可能引起发热,会不会有人接受呢?具体工作中,医生还是会结合病人主诉、流行病学资料、病人经济能力、生活行为、前期治疗观察等因素,确定首选检查手段,根据经验分步进行鉴别诊断。所以,全基因组测序的结果,目前给临床带来的无所适从要多于指导意义。更不用说应该测多少倍的深度,这方面连个标准都没有。各种全基因组测序数据库,跟大量的重要临床数据(如肿瘤大小,家族史,药物使用,其他诊断数据)没有足够关联,因此未来也不一定有用。
医生的诊疗,会包括通行的标准诊疗和标准流程之外的探索性诊疗两部分。后者是医学进步的动力,但在当前中国的医患环境下越来越少。尽管如此,对于标准诊疗无解的病人,医生会尝试非常规的诊疗寻找突破,这种极端情况下全基因组测序是有一定价值的。我们有时会见到这样的例子,无法确诊或治愈的病例,通过测全基因组后发现了某个突变,根据该基因突变对应的蛋白质功能和表观性状,最终得到确诊或是找到了某种对应的药物(用于其他疾病的或是还没上市的)。但是也有测了全基因组什么办法也没找到的,比如说乔布斯同志。这种诊疗不能成为目前医疗的主体,因为不确定性太多,它没有办法替代现行的医疗模式。
3.任重而道远——生物信息学的瓶颈
高通量测序是通过把提取的样品DNA打成小片段,在机器上进行大量平行测序,然后将读取的序列信息拼接成完整序列,和参考序列进行比对,这里需要很多的生物信息学工作。因此,在拼接的过程中难免有算法误差,另外打碎DNA片段的实验步骤也有重复性的问题。由于突变位点不是每一次测序都能测到,因此需要测很多次,有时候甚至测到上千次,这也是高通量测序会产生海量数据的原因。测到目标区域的平均次数称为测序深度,如测100次就称为100×(倍)的测序深度,专业一点来说是测到的碱基总量除以基因组碱基数量的的大小。患者得到的数据,到底是30×还是100×还是2000×测序来的,一般人不知道。而测序后通过生物信息学分析出的突变,是真实存在还是测序产生的误差,也见仁见智。目前来说,到底要测多少倍才算比较准,都是按照业界通行的理解来进行的,在临床应用上尚没有法定的标准,也给如何统一各家公司自己的数据库出了个难题。如果这个数据库要用于治疗目的,那么是在什么临床环境下测的数据,也很少有人提及。
另一个是海量数据带来的计算机存储问题。人类基因组3.2个G,测50倍的通量就要160G,光数据存储一个小硬盘就用掉了,想发展大数据,搞云计算来比对,以现在的网络传递起来还是很慢的。做科研还好,但在临床上,基因组数据带来的效果还不足以无视这些额外产生的计算机集群负担,有点像互联网之初要用Modem等待漫长的滴答音后才能接通Internet一样,影响了公众对互联网的接受度。这方面的瓶颈也许要等到新的技术出现才会突破,如新的图形存储格式,新的算法,新的通信协议,等等。或是新的测序技术出现将现有的生物信息学过程彻底抛弃。
目前的生物信息学解读主要还是侧重于测序结果的解读,随着HTML5协议的出现,可视化的基因组学浏览器已经有了很多发展,界面更加直观,也减轻了很多后台服务器的负荷,但是还是面向专业技术人员的,并没有完全发展到临床信息的解读,因为这个同时需要很深的临床专业知识。仅仅是基因测序的结果拿给临床医生看,可以说几乎没有人看得懂,在临床的应用程度可想而知,更不用提医生如何向病人解释他为何根据基因测序结果要采取某种临床干预。大多数临床医生更希望把基因测序作为一种标准化操作工具,而非了解该工具本身。而目前基因测序的数据结果到临床医生工作中的直观指导,还存在相当的距离,基因组数据无法被医生搜索、共享和理解。临床客户的两个基本诉求:“安全”和“标准”,基因测序尚不能实现。数据格式标准不能统一,临床指征与基因检测结果关系的专业数据库的缺失,使得基因测序在临床应用上受到生物信息学的很大束缚。
4.肿瘤基因测序难以大范围推广
肿瘤的基因测序是当下的一个热点。由于肿瘤和基因组有一定的关系,使得行业外产生了很高的期望值。但它有两方面的主要瓶颈:临床机理和临床操作。目前市场上肿瘤基因测序有肿瘤的靶向治疗指导和肿瘤的易感性基因检测。肿瘤的易感性基因检测存在相当大的争议,严格来说没有临床价值,因为肿瘤与基因关系的基础理论仍然不足,可临床确认为高度肿瘤相关生物标记物的基因几乎没有,单是“肿瘤易感性基因”这个有因果意味的定义就很有问题,作为肿瘤的大面积常规筛查说服力有限,即便做了,基因结果和肿瘤的确切关系也根本说不清楚。从这个角度来说,所谓肿瘤易感性基因检测不是一个合理的方向。肿瘤的的家族史倒是跟遗传有关,但像遗传性乳腺癌检测与其说是肿瘤基因检测,不如说是广义的遗传病基因检测更好解释些。相对而言,用于靶向用药指导的意义比较明确,但这个市场会被定量PCR和常规一代测序分走一些,另外人种和地域可能会影响对同一基因的突变位点的选择,没有标准。现在的靶向药物类别不多,进入标准指南的就是肺癌的EGFR和ALK基因,转移性结直肠癌的kras基因,和黑色素瘤的braf基因检测,其他的基因靶点检测都属于医院自行开展,测算市场刚性需求时比较容易有水分。一个与学术无关的现象是,即便基因检测结果表明该药物可能无效,病人若没有其他选择,还是可能会抱着试一试的心态使用该药物,使得基因检测的意义可有可无,导致医生做基因检测的动力下降或动机改变。
在临床操作层面,目前肿瘤基因测序没有专门的收费标准,基本上都是套用按位点做基因测试的收费标准来的,各省物价,一个位点在250-600元不等,这个价格对高通量基因测序来说不合算,但由于高通量测序可在成本不变的情况下一次性测很多位点,因此一般来说是按照多个位点进行收费,限于病人经济承受能力,一般市场收费在4000-8000元不等。这方面该测多少位点,收费怎么计算,还缺少相关的政策。另外,肿瘤基因检测临床实施并不方便(血液肿瘤除外),区别正常突变和肿瘤基因突变对人员技术能力要求较高。由于肿瘤的基因组不稳定,常产生耐药突变,作为疗效检测的话,需对肿瘤病人多次肿瘤部位取样活检,无疑增加了病人的痛苦和操作难度。而且,是否要同时取癌旁正常组织一同测序,这部分收费是否要病人承担,政策上都没有定论。
最近液体活检受到重视,是指在外周血中寻找脱落或凋亡释放的肿瘤细胞DNA(ctDNA)进行基因测序。这种取样方式大大好于组织取样,长远来说可能适合癌症复发的早期检测,但距离临床应用还比较遥远。循环肿瘤细胞DNA是不完整的DNA碎片,需要大量基因测序,大量的生物计算拼接,误差不好控制。还有怎样确保减少假阳性,和肿瘤目前的TNM分期如何对应,这些技术问题都需要时间。一个现实问题是:如果ctDNA结果提示肿瘤,但病人去做了PET-CT也没有发现病灶,病人该怎么办。相对而言,寻找循环肿瘤细胞(CTC)辅助以基因测序验证可能是一个比较有希望的方案。CTC可以得到完整的肿瘤基因组,作为诊断指标在临床上也容易界定,不过如何保证CTC的捕获效率,目前没有最理想的方法。
总之,肿瘤的机理过于复杂,基因测序和实施临床干预还不能顺利对接,操作层面和政策层面还有很多困难,远非理想的应用状态。从远景来说,随着靶向药物的开发和肿瘤免疫的进展,基因检测的需求长期存在。但目前还受制于大数据如何积累,如何搜集标准标本,如何建立大分析平台,短期内无法解决。一部分临床需要的基因检测用更简单便宜的PCR或FISH即可解决问题,并不需要高通量测序。当下很多人热衷于用科研思路去解决临床问题,但医疗不同于科研,必须考虑很多的社会人文因素。而肿瘤这样一个热点市场,作为一个公司要长期生存的话单纯依赖这方面业务需要谨慎。等到这些瓶颈解决有希望盈利的时候可能又出现新的替代技术了,这是一个受到很多关注但技术路线变化可能性非常大的市场。
5.最大的瓶颈—全社会的认知和现行医疗体制
医学本身并不是面向大众的科学,基因科学更加小众。基因与疾病的关联的社会认识程度还不高。大部分患者、医生、政策部门、投资人,都不是很了解基因测序的知识。普通老百姓很难说清楚基因是怎么回事,有些人还以为遗传病就是精神病,大量临床医生对基因测序的理论基础也很难理解,何况这个技术还在不断更新。在这样一个现实环境下,基因测序在未被充分检验之前就投入了医疗这个高度监管行业的应用,某种程度上讲是危险的,对基因测序技术应用的误读误用,会影响其本身健康发展,损害它作为一种新的技术所需要成长的空间,会出现劣币驱逐良币的现象。全社会还需要更多参与到基因科技的普及中。
由于互联网的发展带来信息量的大增,今天患者越来越参与到对他们自身诊疗的决策过程中,知识程度的不对称和诊疗话语权的分配无法协调,也是今天医患矛盾的原因之一。这是一个传统医疗体制正在变化的时代,基因测序若得不到正确的理解和实施,会被拔苗助长,最终和体制不能结合而失去发展。基因测序用于临床干预来说很多结果还很模糊,又不能带来健康行为的根本改变,相关的法规也还缺失。临床诊疗过程需要的是基因测序的临床解读而非技术解读,但目前实施医疗的主体——医院和临床医生,对这一传统医学知识体系之外的技术还需要学习,而基因测序的检测提供者只提供技术,临床应用责任因为缺乏相应法律保护而没有承担主体,这一体制瓶颈约束了基因测序的发展,需要政策制定者的智慧。
为了解决基因测序结果到临床应用的连接问题,2015年成立了中国遗传学会遗传咨询分会,开始了遗传咨询师的定期培训班,迈出了开拓性的一步。但如何应用于医疗实践,还缺少合理的制度支持。如何对临床标本的基因检测结果进行标准化描述、评估和溯源,是当下医疗体制的瓶颈。生老病死是人类最重要的问题,在相应的瓶颈没有突破之前,基因测序只适合少部分地用于医疗实践,绝不适合在全社会推广应用。