1. 首页
  2. 生命科学

基因测序的昨天、今天与明天 | 万字长文

 编者按:自党的十八大以来,我基因产业高速发展,已成为我国经济发展新动能的重要力量!上世纪末,中国作为参与国共同完成了人类基因组计划,此后,中国在基因科技领域的发展逐步走向了世界的前列。人类基因组单体型图计划、国际千人基因组计划、癌症基因组图谱计划、人类细胞图谱计划等众多国际大型合作项目,中国在其中都扮演着举足轻重的角色。国产二代、三代测序仪的诞生,不仅打破了国外市场的长期垄断,实现了我国基因科技布局产业上游的突破,也从根本上保障了我国遗传资源的安全。此外,中国政府高度重视精准医学的发展,精准医学已纳入“十三五”国家科技创新规划中。除了“十三五”规划外,中国多个政府部门也在积极制定相关发展规划,如科技部将发布一个截止到2030年的十五年规划大纲。通过一系列国家举措,中国将大力推进基因科技、精准医学事业,解决生命科学、医学健康等重大问题,刺激相关产业的增长。中国在全球基因科技、医疗发展中所占据竞争优势,必将提升中国的自主创新能力、促进新兴产业的发展、创造改革的动力,跻身世界前列。为庆祝第十九次全国代表大会的召开,测序中国撰文对全球范围内的基因测序技术、大型计划,以及精准医学等方面的过去、现状与未来进行综述。以下为正文。

NGS掀起全新发展模式

454

自人类基因组计划(HGP)完成后,基因测序领域开始进入一种全新的发展模式。2005年底,454公司推出了革命性的基于焦磷酸测序法的高通量基因组测序系统,Genome Sequencer GS系列,当时被《Nature》杂志以里程碑事件报道,为第一个商业化的高通量测序平台,标志着新一代测序技术(NGS)时代的开启。基于该测序系统,完成了DNA双螺旋结构发现者之一Waston基因组的测定,当时花费200万美金,这也是最早公开个人基因组信息的人之一。然而,454在被罗氏公司收购后,面对Illumina公司的强势进攻,454在通量、准确性和运行成本等方面缺乏竞争力,2013年,罗氏公司关闭454测序业务,2016年底,454测序仪正式被淘汰。

SOLID

根据测序原理,二代测序仪可以被分为两大类:一类是使用合成法测序(SBS),另一类使用连接法测序(SBL)。SOLID是第一个基于连接测序法的高通量测序平台,最初是由美国哈佛大学一实验室发明,2007年,ABI公司开发完成了第一款基于SBL技术的SOLiD 1/2测序仪,2010年底的时候通量达到了300G。以准确度这一优势来打市场,当时与454、illumina形成了三足鼎立之势。但是,同样不幸的是,由于SOLiD测序系统相对复杂,读长短等不足,现也已经停产。

Ion Torrent

说起第一个不需要光学系统的桌面型测序仪,就是Ion Torrent,其所采用的技术为半导体测序,通过半导体芯片直接将化学信号转换为数字信号。比较火热扩增子测序主要是依赖Ion Torrent平台。由于测序时间短,仪器设备价格相对较低,且操作方便,在临床和研究中被广泛采用。值得一提的是,Ion Torrent开展了国产授权的策略,例如国内的博奥生物、达安基因等公司在早先开展NIPT的时候,当时都是基于该款测序仪相继获得了CFDA 的审批。

Illumina

目前为止任然占据大部分市场的当属Illumina测序平台。这家位于美国的Illumina公司在2006年的时候收购了Solexa公司,并于2007年推出了第一款测序平台GA1,读长只有30多碱基。Illumina公司目前已经推出了多种型号的测序仪,不同型号之间在读长(100-300bp)和单次数据产出(14M-10G reads数)等方面都存在差异,客户会根据实际需求选择最合适的测序仪。2014年,Illumina推出HiSeq X测序仪,利用该仪器进行覆盖度为30x的人类全基因组测序,费用不超过1000美元,这其中包括了试剂耗材、湿实验工作、仪器折旧和数据基础分析的成本。而2017年1月最新推出的NovaSeq系列,则宣称在2018年新型flow cell出产后会实现测序更快、费用更低,未来的个人全基因组测序价格有可能达到100美金。

BGISEQ

接下来,要隆重介绍的是拥有自主产权的国产测序仪,由华大基因研发的BGISEQ平台。由于测序仪在制造生产方面所面临的技术壁垒非常高,也正是如此,国外测序仪制造商长期占据着测序上游位置,对于仪器和试剂形成了垄断的态势。2013年,华大基因做出一个极具魄力和远见的举动,就是克服重重阻碍,收购了美国CG公司。CG作为一家测序仪的制造公司,在研发方面非常注重仪器的性能和技术参数,正是基于该核心技术,华大基因花了2年时间,在2015年的ICG会议上推出了首款桌面型的测序系统,BGISGQ500。这款测序通量的可扩展性范围更加灵活,可以实现从8G-200G的不同测序需求。价格方面,相比于国外测序仪来说要便宜三分之一。另外,在运行时间方面也具有一定的优势。基因测序仪的国产化,不仅打破了国外市场的长期垄断,实现了我国基因科技布局产业上游的突破,也从根本上保障了我国遗传资源的安全。

基因测序的昨天、今天与明天 | 万字长文基因测序的昨天、今天与明天 | 万字长文

图:BGISEQ测序仪

单分子测序

与上面的提到的第二代测序技术相比,第三代测序技术的显著特点是测序所用的模板DNA无需扩增以增强检测信号,而是直接对DNA分子进行测序,因此也称“单分子测序”。

HeliScope

HeliScope可以说是第一台真正意义上的单分子测序仪,2008年由斯坦福大学Stephen Quake团队开发。这款测序仪最重要的创新之处是采用了超敏感的荧光检测装置,从而不再依赖于像二代测序技术那样通过扩增得到的分子群体来增强信号强度。并且可以直接分析碱基的化学修饰,比如甲基化、乙酰化。但HeliScope的主要问题是读长较短,平均只有35nt,在2012年已申请破产保护。

PacBio

第一个实际应用单分子实时测序技术(SMRT)的平台,是PacBio测序仪,也可以说是目前三代测序仪的代表。单分子实时测序技术最初是由美国康乃尔大学一个研究团队发明,PacBio公司在2010年时采用,并在2011年初投入市场。该平台的特点是超长读长、无PCR扩增偏差、并可直接分析甲基化等碱基修饰,尤其在基因组de novo组装,大型结构变异、全长转录组测序,以及一些微生物研究来说,优势更为明显。但是当时的错误率比较高,并且造价和运行成本都很贵。2015年,PacBio推出了体积相对小、性能更好的Sequel系统,平均读长可达10几KB,单个SMRT cell通量可达5GB左右。PacBio公司最近宣布了一项计划,其中包括在2018年年底实现通量提升30倍,让人类基因组de novo测序的试剂费用降至1000美元。随着通量的不断提升,PacBio测序仪未来将具有非常大的潜力。

ONT

被认为是测序技术发展新方向的是纳米孔测序仪,该技术速度快、成本低,单链的DNA或RNA分子通过纳米孔时会产生信号变化,进而开展实时测序。具有代表性的是英国牛津纳米孔技术公司Oxford Nanopore Technologies(ONT),该公司在2012年推出微型纳米孔MinION测序仪可用于现场临床测序应用中,2014年已经投入使用,该测序仪体积只有U盘大小,通过USB接口与电脑相连,并可以随身携带,较为方便。2016年底,官方在一次发布会上公布:同时使用多个MinION测序仪完成了对人类全基因组的测序。前不久,ONT公司启动了一项针对PromethION平台的体验项目,该平台是基于相同的纳米孔技术的一台高产量测序仪,可以与Illumina的HiSeq X匹敌。此外,ONT还推出一款中等通量的测序仪GridION X5。

GenoCare

最后,需要重点介绍的是国产三代测序仪。据国家科技部网站介绍,贺建奎教授团队成功研发的第三代基因测序仪GenoCare,是当今世界上准确率最高(准确率达99.9985%)的第三代测序仪,并且率先在全世界取得政府医疗器械证备案、初步实现产业化并已应用于临床检测。该测序仪开发出基于全内反射先进光学的技术,可检测到单个DNA分子的微弱信号,读取DNA序列编码,为健康和疾病提供解读和诊断信息,其技术水平在亚洲乃至世界都居于领先地位。在前不久举办的AGBT 2017 精准健康会议上,中科院基因组研究所于军教授以全球著名的制药和诊断公司罗氏寄送的大肠杆菌的样本测试结果为例,对GenoCare的测序性能进行解读。据介绍,该次测试平均测序深度约30X,比对分析测序数据,其基因组覆盖度达100%,测序数据构建的一致性序列,其准确度也达100%。此外,GenoCare很快将进行双色荧光通道的升级,届时其测序读长和比对率将大幅提升。

基因测序的昨天、今天与明天 | 万字长文基因测序的昨天、今天与明天 | 万字长文

图:GenoCare测序仪

其他技术

除了上述介绍的几款测序仪之外,Qiagen公司在2015年推出Gene Reader测序仪,是一款针对临床相关扩增子测序的短读长测序平台。SeqLL公司在2016年启动了其单分子测序tSMS系统的beta测试期。此外,一些长读长技术利用化学试剂对短reads进行标签标记,然后通过barcode信息重新合成包含更多信息的长reads。在这一领域的公司包括有10xGenomics、iGenomeX等。作为与测序技术相辅相成的一项技术,BioNano公司推出的单分子长片段图谱技术能够提供基因组宏观的框架,依照这个框架使测序片段真实地回归到染色体上,保证拼接组装结果的准确性和真实性。在迅速发展的NGS领域,目前已经有多种处于不同发展阶段的技术已经准备在不久之后进入NGS市场,包括:Genapsys、Genia,Illumina Firefly、Nanostring、GnuBio和Electron Optica等。

基因大数据呼啸而至,问题来了!

面对基因大数据呼啸而至,数据管理已刻不容缓,在接下来的数据管理的整个周期中存在众多挑战,包括数据获取、存储、分配与分析。据估计,到2025年,仅仅在数据获取和存储方面,预计所需要计算资源分别约每年1 ZB和每年2~40 EB,测序数据总量约每7个月加倍。

对于数据的保护问题,同态加密系统(homomorphic encryption systems)可以在不公布原始数据的情况下,对某些受控制的查询进行操作和分析,这个系统或将成为未来研究的方向,但是目前这些系统在计算机资源方面要求过高。

数据安全

此外,测序技术产生的海量数据在公有云和私有云的存储过程中引发了关于隐私和安全的忧虑。最初,人类基因组计划都是基于公开的原则,要求将测序数据上传到公共数据库,前提假设是参与者或贡献者的身份不具有风险。但是当人们意识到利用统计信息可以在GWAS研究中区分来自每个人的数据时,这个假设被推翻了。在一些最新的大型项目中都在尝试去解决这个问题,对同意用于生物医学研究的数据进行访问管理。数据安全领域的最新研究表明,基因组隐私的保护是一个跨学科的领域,需要同时掌握计算机知识和基因组学专业知识,实现在云端管理和分析基因组数据的同时,保证患者隐私的足够安全和计算的拓展性。

基因测序的昨天、今天与明天 | 万字长文基因测序的昨天、今天与明天 | 万字长文

公共数据库

生物医学领域基因组学数据和表型数据的三个主要公共数据库包括:EBI的EGA,NCBI的SRA和DDBJ的JGA。这些公共数据库的主要目标是为NGS数据提供一个存储中心,并可进行数据资源之间的关联,通过数据结构均一化提高数据库效率,为NGS数据建立一个交互式的提交和检索系统。对于EGA数据库来说,并不是一个完全开放的数据库,需要医生提供一个特殊的许可证才能访问,但该数据库加速了遗传数据和表型数据的分配和共享。这些数据的授权访问由提供数据的研究小组和机构来授权和管理。数据经授权后可使用,同时还具有严格的信息管理、数据存储、数据安全和传播规则。SRA数据库是在国际核苷酸序列数据库联盟(INSDC)指导下建立,人类数据都经过严格的隐私控制和使用限制,这些要求都是由研究机构的机构审查委员会(IRB)、资助机构和美国或者提交者国家的法律决定。自2013年,DDBJ就将JGA作为一个存储和共享来自生物医学研究项目中的个人遗传数据和匿名表型数据的服务系统,与日本的NBDC达成合作。大多科学期刊都要求作者将其数据存放在这些相对安全的公共数据库中。

互联网巨头各显身手

NGS技术产生的海量数据,其管理和分析问题需要强大的数据存储和分析中心实现。近些年云计算能力的提升实现了远程管理和分析庞大数据的能力。基于这个目标,一些互联网巨头都已经在NGS领域占据位置,展开竞争。例如Google Genomics、Microsoft Genomics、Amazon Web Services (AWS) 以及阿里云等都允许研究人员存储、处理、搜索和共享大型复杂的数据集。其背后的想法就是为研究人员提供用户友好型工具,这些数据、工具和分析可以在研究小组内、合作者或者研究机构间共享。云计算大大降低了分析时间,能够同时运行多个项目并确保了扩展性。然而,这些服务商需要遵守健康保险携带和责任法案(HIPAA)的认证要求。总而言之,未来无论是数据存储还是数据分析,或都将在云端进行。

国际、国家层面大型基因组项目如火如荼

目前,全球有大量基因组相关计划开展得如火如荼,包括类似于Human Genome Project的国际计划,也有类似于100 K Genome Project的地区或国家项目,以及针对某种疾病的特殊计划,例如癌症基因组计划(TCGA)以及发育疾病项目(DDD)等。下表概括了全球范围内已完成和正在进行的相关项目(此表来源:Gene Therapy (2017) )。

基因测序的昨天、今天与明天 | 万字长文基因测序的昨天、今天与明天 | 万字长文

基因测序的昨天、今天与明天 | 万字长文

基因测序的昨天、今天与明天 | 万字长文

人类基因组计划(HGP)

HGP自1990年启动,最初项目周期计划为15年,但随着测序技术的发展加速了人类基因组计的完成。2001年,第一个人类基因组草图发布。在HGP项目开展之前,人们预测人类基因组含有约10万个基因,但是结果显示人类基因组中仅含有2~2.5万个蛋白编码基因。此外,人们仍然无法解释大多数遗传病的机制和生命的秘密。因此,从成就和期望角度而言,HGP结束时是让人有些沮丧的。2016年6月2日宣布了一项HGP的10年延续计划,目的是合成一个人类基因组,这项计划称为人类基因组编写计划(HGPW)。

基因测序的昨天、今天与明天 | 万字长文

千人基因组计划(1000 Genomes project )

由中国华大基因、美国NIH、英国桑格研究所等机构在2008年启动,历经8年。目的是得到一个更为详尽、具有医学应用价值的人类基因多态性图谱。可以说是HAPMAP计划的拓展。主要采用二代测序技术。最终目标是获得世界各地不同人群中2500人的基因数据,人群来自欧洲、美洲、亚洲、非洲的几十个国家和地区,覆盖非常广泛。千人基因组计划第一阶段的3个先导项目在2010年圆满完成。第一个先导项目采用三种高通量测序技术平台,完成了两个家庭共6个人的高覆盖度全基因组测序,每个基因组的测序深度在20~60倍。通过这个结果,可以评价多种主要测序方法的优缺点,为的后续项目扫清技术障碍。第二个先导项目完成了4个群体179人的低覆盖度全基因组测序,平均测序深度在3倍。这一项目结果表明,大样本、低覆盖度测序在降低成本的同时,仍然能有效识别人群中的基因多样性。第三个先导项目完成了对近700人的全外显子的测序。千人基因组计划在第一阶段一共得到了1500万个SNP位点,1百万个indel,以及2万个结构变异的信息。千人基因组计划完成之后,GWAS对欧洲裔的研究从96%缩减到了81%,一定程度上提高了全球人群范围的多样性。此外,千人基因组计划也大大延伸了基因组变异的广度层面,不仅得到了SNP,同时也得到了大量CNV和SV的群体变异信息,同时,通过测序手段也得到了大量的稀有的变异。

万人基因组计划(10K genomes project)

UK10K项目是2010至2013年展开的一项计划,多个研究机构参与其中,包括布里斯托尔大学、伦敦大学国王学院、英国医学研究委员会、英国卫生部和维尔康姆基金会桑格研究所。该计划的主要目标是鉴定出与低频和罕见遗传变异相关的新致病基因,项目从11个不同的疾病研究中选取了约5500人的DNA样本,每个样本进行72x的全外显子组测序。4000个对照样本来自于英国两个群体研究(TwinsUK计划和ALSPAC计划),每个样本仅6x的外显子组测序,同时收集了大量的表型数据。UK10K项目的结果并不公开,但是可以通过管理访问系统获取。此外 ,UK10K已经采取了一种机制,向参与者报告任何在项目期间可能出现的重要临床发现。

十万基因组计划(100K genomes project)

2012年底,英国Genomics England宣布了十万基因组计划(100KGP),期望到2017年时完成10万个样本的全基因组测序工作。由于癌症和罕见病都与基因组中变异具有强相关性,因此项目的参与者可以是国家卫生系统(NHS)中关注罕见病或癌症的患者,以及患者家庭成员。项目目标是完成5万个癌症样本的基因组序列(共2.5万名患者,每个患者选取癌症组织和正常组织进行测序),5万个罕见病患者的基因组序列(共1.7万名患者,每个患者选取3份样本,1份来自患者,另两份来自血缘亲戚)。目前英国还在进行样本收集工作,苏格兰、威尔士和北爱尔兰正在讨论参与其中的可能性。

亚洲10万人基因组计划(Genome Asia 100K)

亚洲10万人类基因组计划(GA 100K)是由Macrogen和MedGenome公司组成的私人联盟发起的项目。目前基因组数据库中亚洲人群的基因组数据较少,虽然亚洲人占据了全球人数的40%,数据库中基因组数据主要来自高加索人。因此,该项目的主要目标是完成10万个亚洲人的基因组测序和分析工作,进而驱动精准医疗。项目第一阶段将对1万名亚洲人进行基因组测序来研究族群分层,因为有研究证明不同民族中突变频率存在差异。项目第二阶段是对其余9万人进行测序,同时收集表型数据和临床数据。这些信息将帮助人们更深入的研究亚洲人群健康和疾病问题、罕见病和孟德尔遗传病的相关性,以及复杂疾病的研究,例如癌症、糖尿病和神经障碍。

中国十万基因组

前不久,华大基因表示将基于自主研发的BGISEQ-500测序仪、以及与阿里云合作产品BGI Online云平台的计算分析能力,在2018年,分析交付10万个中国人的全基因组数据。目前,在中国具有全基因组数据的人还不到1万。而在明年,10万人将有望拥有自己的全基因组数据。未来通过更多的中国人数据,构建起我国人群特有的数据库,这在未来中国人群的健康指导等方面都将具有重要的价值和意义。

美国精准医疗计划

2015年,美国前总统奥巴马在国情咨文中提出了精准医疗计划(PMI)。这项计划有两个主要组成:短期目标集中在癌症,长远目标集中在获取更多健康和疾病相关信息。PMI的最终目标是为癌症等疾病带来更多更好的治疗方法,创建一支包含一百万人的国家志愿研究团队,加强对隐私的保护,提升监控机制,建立公私合作伙伴关系。为了实现这些目标,NIH、FDA和美国国家卫生信息技术协调办公室(ONC)在2016年投资了2.15亿美元。

中国精准医学计划

2015年3月,中国成立“精准医疗战略专家组”。国家卫计委和科技部多次召开会议,论证、启动“精准医疗”计划,并于2030年前在精准医疗领域投入600亿元人民币。2016年1月,中国科学院重点部署项目“中国人群精准医学研究计划”正式启动,该计划将在未来4年内完成4000名志愿者DNA样本和多种表现型数据的采集,并对其中2000人进行深入的精准医学研究,包括全基因组序列分析,建立基因组健康档案和针对一些重要慢性病的遗传信号开展疾病风险和药物反应的预警和干预研究。2016年3月,科技部发布国家重点研发计划,精准医学研究为九大重点专项。中国的精准医学研究正式拉开帷幕。

癌症基因组图谱计划(TCGA)

2006年,美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)发起了癌症基因组图谱(TCGA)计划,国际上多个国家先后参与进来。TCGA是国际肿瘤基因组协作组(ICGC)研究计划最大的组成部分,主要是得到一个全面的、多维的,针对多种癌症基因组的图谱。目前完成了33种不同癌症类型的数据,总数据量达到2.5PB。不仅包括基因组测序,还包括转录组、甲基化等表观组学测序,以及最终的整合分析。历经十年,TCGA发表了27篇癌症大规模、多组学研究的文章,积累了大量癌症各类组学的测序数据。

基因测序的昨天、今天与明天 | 万字长文

罕见病项目

全世界范围内约有7000种罕见病,患病人数超过3.5亿,而且数量还在逐年增长。国际罕见病研究联盟(IRDiRC)成立于2011年,包含了公共机构和私人资助机构、研究者、临床医生、行业伙伴、监管者和患者与家庭组织。该联盟预计到2020年开发出适用于大部分罕见病(6000种)的诊断检测,以及200种新型治疗方法。到目前为止已经有3600种遗传检测,自2010年以来新药的数量超过了200种。此外,NHGRI与NIH联合成立孟德尔基因组学中心(CMG),研究罕见遗传病的相关机制。到目前为止,已经完成2万多的人类外显子组测序,鉴定出740多个与孟德尔疾病相关基因。其他值得一提的项目还有日本政府提出的罕见疾病和未确诊疾病项目,加拿大的Finding of Rare Disease Genes计划(FORGE Canada),印度的Genomics for Understanding Rare Diseases计划(GUaRDiAN)。同样,对于研究者、临床医生和患者而言,这些项目产生的数据的访问监管也非常重要。NIH的Clinical Genome Resource(ClinGen)正在建立一个基因组和表型信息数据库,帮助分析基因变异,用于精准医疗治疗方法。中国“十三五”国家重点研发计划,对罕见病的精准医学研究也给予了大力支持,包括罕见病临床队列研究以及罕见病精准诊疗技术和临床规范研究。

发育障碍疾病项目

全球每年约40万新生儿患有发育障碍疾病,在童年和成年期会引起不同的症状。这类疾病具有强遗传性,因此在2011年,作为英国和爱尔兰共和国的公共-私人合作项目,推出了解读发育障碍项目(DDD)。将芯片、外显子组测序和全基因组测序相结合,该项目可以对来自超过1.36万患者及其父母的样本进行分析,目的是为了理解疾病发生的原因,提供精准的诊断。该项目在2016年结束,项目相关结论共发表了60多篇文章,找到约30种与发育障碍疾病相关的新基因。据估计,约5%发育障碍疾病的诊断结果都与这些基因相关。然而,仅50%的参与者被诊断出了病因。幸运的是,随着测序费用的降低和相关资助的继续支持,是该项目后续持续到2021年,以便尽可能增加获得诊断的家庭数量。此外,该项目网站向各家庭和受众提供了一系列信息,包括解释基本原理(什么是基因组)、对获取和处理样本的方法进行描述,以及详细解释家庭可以获取的信息类型和从结果中能够获取的信息等,对于家庭、医生和研究者来说,是一种非常好的展现方法。

神经障碍性疾病项目

自闭症

自闭症是一种神经发育障碍疾病,全球有两千多万自闭症患者。2004年发起的自闭症基因组计划(AGP)最初将芯片技术作为其第一、二阶段的主要技术,第三阶段以外显子深度测序技术为主。该项目发现了一百多个基因与疾病直接相关或间接引起患病风险增加。到目前为止,第一阶段的结果已经找到了自闭症致病相关的4个新的风险基因和8个候选基因。此外,全球最大的自闭症科学与宣传机构——自闭症之声(Autism Speaks)和Google及研究团体合作推出了MSSNG计划,对来自自闭症家庭的1万个基因组进行测序。Google将搭建一个公开的数据库,科学团体能够免费访问项目产生的数据,而且项目期望能够鉴定出自闭症的多种亚型。MSSNG项目近期已经鉴定出18个自闭症相关基因。这些项目的所产生的研究结果将对自闭症患者进行更好的诊断和更加个性化的治疗。

癫痫

对于癫痫来说,全球各年龄的患病人数超过五千万。Epi4K国际联盟致力于对4000多个基因组进行分析,在与癫痫表型组/基因组计划(EPGP)的共同努力下,利用全外显子组测序发现了多个与癫痫相关的新突变。Epi4K和EPGP同样是Epi25项目的一部分,Epi25项目目前正在对2.5万个外显子组样本进行测序,这些样本来自于全球不同研究机构,具有较完整的表型数据。

阿兹海默症

全球每年患阿兹海默症(AD)或相关痴呆症的患者数超过460万,预计该数目每20年就会翻倍。AD测序计划(Alzheimer’s Disease Sequencing Project)于2012年启动,到目前为止已经对500多个基因组和1万个外显子组样本进行测序,包括来自于正常和对照个体。另一个重要的项目启动于2015年,称作Alzheimer’s Genome Project,该项目第三阶段将对来自437个阿兹海默症家庭的1500个样本进行全基因组测序,在2016年还采用了其他几种技术鉴定疾病相关的表观遗传组变异。该项目期望能够鉴定出与AD相关的基因变异以及位于基因间区的变异,这将促进后续的药物研发工作。

基因测序走向临床

人类基因组计划采用一代测序,耗时13年,花费30亿美元。此后,二代测序技术快速发展创新,完成一个人类基因组测序的时间和成本大大降低。这也促使人们将基因测序技术引入临床,进而也引出了一些新的概念,如精准医学。

“精准医疗”v.s. “个性化医疗”

“精准医疗”和“个性化医疗”两个词已被广泛并互相使用,然而对其各自含义的区分也非常简单。个性化医疗是指某种治疗和预防方法是特意为了每个人研发的,而精准医疗则关注的是基于患者共同的遗传、环境和生活习惯等因素选择有效的治疗方式。精准医疗并不意味着为某个患者创造出独特的药物和治疗设备,而是根据人们对某种疾病的易感程度、可能病发的生物学或预后情况或者对某种治疗的反应将其归类为不同亚群。这种方法与传统的“一刀切”方法不同,传统方法中的疾病治疗方法和预防策略都是针对普遍人群开发,没有考虑到群体间的差异。因此,“精准医疗”更适合于当前的治疗方法。

目前,在医学中的多个领域都可以找到精准医学的成功案例,此外,中国各地建立的精准医学中心、美国的精准医疗联盟(Personalized Medicine Coalition)或者英国精准医疗中心(Centre for Personalized Medicine)都将不断推动精准医学的发展。以下从几个方面简要描述精准医学在临床中的实践。

免疫缺陷疾病

原发性免疫缺陷(PIDs)是一类罕见疾病,受益于NGS技术,在过去几年中研究人员已经鉴定出大量致病基因。常见变异型免疫缺陷病(CVIDs)是PID的一类,是儿童和成年人体内抗体失效最常见的类型。虽然目前表明对于少数患者CVID是一种单基因疾病,但是全基因组关联分析和全基因组测序发现在大部分CVID患者其实是由多基因引发的。此外,RNA测序和表观基因组测序也正在进一步探索CVID病发过程中涉及到的更多的基因改变情况。

癫痫

英国十万基因组计划近期公布了一项罕见病治疗案例。一名四岁的女孩患有癫痫,肢体运动不协调而且智力发育缓慢。研究发现在她的基因组中存在SLC2A1基因突变,该突变导致大脑中有效代谢所需糖类不足。在之后的治疗中,通过对这个小女孩制定特定饮食计划,确保大脑葡萄糖产量最大化,一个月后小女孩在言语、能量水平和身体稳定性方面均有了明显提升。

肿瘤

目前,精准医学在肿瘤临床的应用最为广泛。然而,目前仍然存在的一个挑战是让患者参与到临床试验中或者接受靶向治疗。近期有研究表明,利用靶向panel分析可以在39—95%的测试患者中找到可行的治疗方法。然而仅仅5-16%的患者会继续使用获批或未被临床试验认可的药物进行后续的临床试验。

药物基因组学

药物基因组学是精准医疗的一部分,其研究的是基因是如何影响个人对于某种药物的应答情况。这个相对较新的领域将药物学和基因组学结合起来,研发出有效且安全的药物和剂量,将针对于每个人的基因变异量身定制。然而,药物基因组学的应用目前仍然十分有限。无论怎样,药物基因组学将帮助我们进行定制化药物的研发,治疗一系列健康问题,包括心血管疾病、阿兹海默症、癌症、HIV/AIDS和哮喘等。

P4医疗模式

P4医疗模式。对于心血管疾病、癌症、呼吸疾病和II型糖尿病等慢性疾病,是发达国家中引起死亡、残疾和生活质量降低的主要原因,同时,对多国家的经济也会产生很大的影响。

医学中的新型P4方法即预测、预防、个性化/精准化和参与性,将极大减轻慢性疾病的负担。预测:通过基因组技术和其他诊断方法,我们可以在疾病症状出现前就预测疾病风险,在这方面,利用NGS可以基于每个人的遗传变异信息得出一份个性化的风险报告;预防:对于疾病的早期检测,可以提前制定新的治疗方案并为患者提供有效的生活方式等建议。例如,基于血液游离DNA(cfDNA)分析可以帮助人们在更早期阶段诊断出不同类型的癌症;个性化/精准化:基于患者的分子变异信息、病理信息、环境方面的信息,会使我们更加全面的理解疾病的发生,进而进行靶向治疗。例如,cfDNA分析对于癌症的用药指导、实时监控非常有用,医生可以根据疾病发展过程制定最合适的治疗方案。参与性:医生应该和患者一起讨论疾病的基因变异情况、生活方式和数据解读等,以便进行有效的医疗决策。通过P4医疗模式,患者将和医生一同在信息获取、决策方面发挥积极作用,更好地预防和治疗疾病。

面向未来

未来,持续性的个人多维度数据的获取是精准健康和精准医学的基础。在一个人生活的最初阶段,收集的主要数据是遗传信息和相关的环境因子。个人的年龄和差异化的环境因素(教育、工作、药物治疗、健康和运动习惯等)在疾病的发生中起到了重要作用。这些信息结合病历、可穿戴设备数据等将为每个患者产生数十亿的数据点。这些海量的数据将被用于评估个人的健康和疾病,这是未来计算医学所面临的巨大挑战。鉴于此,健康医疗行业中的各类机构都需要在接下来几年中从根本上改变原有的思维和方式,布局和迎接这个时代的到来。

未来,拥有自身基因组数据的人群将越来越多,基因测序数据的数量和种类每天都在增加,从不同种族、民族的健康基因组到各种疾病患者的特殊基因组,同一个人不同组织、细胞类型的基因组… …所有信息都需要进行高效、安全的存储和处理,重要的是要对人类真正有用!精准医学是基因测序时代下衍生的新概念,其必将被快速地整合应用到我们的医疗系统中,为人类幸福健康带来巨大的益处。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.