1. 首页
  2. 生命科学

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

一个是成熟稳重的 PacBio 大叔,一个是青春活力的 Nanopore 小鲜肉,原理的不同,造就了各自独特的性格,光学与电学测序原理的碰撞中,究竟谁才会脱颖而出,我们拭目以待。

 

样本准备与数据统计


为了保证不同测序方法样本的一致性
,选取少花龙葵样本,捕获一段2.9Kb的DNA片段,分别构建 PacBio RSII 和 Nanopore MinION 2D 文库,每个文库2个cell。从数据产出来看,PacBio RSII 产出383,981条PacBio Subreads (PacBio SR) 和101,331条 Reads of Insert (RoI),Nanopore MinION 产出193,850条 2D reads,PacBio RSII 要高于 Nanopore MinION。从 reads 长短来看,这两种方法的N50 reads 长度分别为3540bp和2262bp,平均 reads 长度为3818bp和2813bp, PacBio 的读长更长,更有利于后续数据组装分析。目前 PacBio Sequel 平台能够构建40Kb文库,平均读长将会有更大幅度的提升。

 

表1 PacBio与Nanopore MinION数据产出的统计

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

 

数据准确度比较

 

插入序列长度来看,PacBio 插入序列为3.5Kb, Nanopore MinION 插入序列仅为2.8Kb。从准确度来看,PacBio SR 的准确度 (理论准确度:90.00%,平均准确度:89.89%) 与 Nanopore MinION 2D pass reads (理论准确度92.06%,平均准确度91.36%) 较为接近,但远达不到 PacBio RoI 的准确程度 (理论准确度99.99%,平均准确率99.57%)。

 

由于三代测序的错误率是制约其发展的一个重要原因,PacBio 测序所产生的错误是随机分布的,可单纯的通过提高测序深度来矫正这些测序错误,因此当50X时即可达到99.999%的高准确度,Nanopore 测序会在基因某些区域存在错误偏好性,无法通过提高测序深度来进行矫正。

 

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

图1 PacBio和Nanopore MinION的数据准确度的统计

数据校正的比较


数据校正来看,PacBio RSII 测序产出 SR 后,自校正直接获得精确度较高的 RoI,而 Nanopore MinION 测序后使用 Canu 软件对 pass reads 进行校正以提高准确度 。

 

为了比较校正前后 PacBio RSII 和 Nanopore MinION 产出的数据质量,将 reads 比对到649个注释完整的 Nucleotide-binding Leucine-rich Repeat (NLR) 编码基因上,结果显示校正后 PacBio RoI 和 Nanopore MinION 2D pass reads  比对率均达到95%以上,平均深度均达到50X以上,平均覆盖率分别为55.48%和55.94%。 另外,未校正的 Nanopore MinION 和 PacBio SR 的错误率分别为12.96%和13.45%。校正后 MinION 的错误率降低到3.73%,与 PacBio RoI 的3.93%非常接近。

 

数据质量看 PacBio SR 和 RoI reads Q60 所占比较明显要高于 Nanopore MinION pass reads,且 PacBio 低质量 reads 比例更少,覆盖到基因组的深度更大,能够更好的还原基因组真实信息。

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

图2 PacBio和Nanopore MinION校正前后比对到NLR基因的覆盖率(蓝色)和数据质量(红色)

 

靶向捕获检测

为了确定靶向捕获率,设计了一段96bp的诱饵序列,使用 BLAST 方法评估了序列相似性,发现81.98%的校正后 Nanopore MinION 2D reads 和73.73%的 PacBio RoI 包含诱饵序列。对于未校正的 Nanopore MinION 2D reads 和 PacBio SR 比对到诱饵序列仅为62.50%和57.82%,这可能是由于测序错误率较高造成的。

表2 数据过滤前后数据统计的比较

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

 

NLR编码基因的组装评价

 

利用Canu MinION (Nanopolish) 组装得到 identity 值99.42%±0.50%、覆盖度91.52%的一段6989bp±1700bp序列。Canu PacBio 组装得到 identity 值99.62%±1.21%、覆盖度88.90%的一段6501 bp±2000 bp 序列。

表3 BLAST比较NLR基因的组装结果

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

 

使用 AUGUSTUS 分析编码 NLR 蛋白的组装,重新预测蛋白质序列,然后使用 NLR-Parser 来鉴定 NLR 蛋白,发现 Canu MinION (Nanopolish) 得到174个完整 NLR 蛋白,而 Canu PacBio 利用其长读长和高准确度的优势可以得到251个完整 NLR 蛋白。

表4 AUGUSTUS 软件预测蛋白结果

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

 

总结


PacBio 与 Nanopore 同属于第三代测序技术,拥有超长读长的优势,二者经常会同台竞技:PacBio测序平台打破了二代读长短、GC偏好性的壁垒,其平均读长更长、数据准确度更高、分析结果更准确;Nanopore 最大读长更长,基因组装和结构变异检测优势明显,测序更加便捷、高效,但究竟谁更胜一筹,相信大家能从上文的对比介绍中得到自己的理解。

PacBio 通过升级优化最新推出的Sequel平台平均读长12-15Kb,最长可达70Kb,轻松覆盖高重复和低复杂区域;一个 SMRT cell 上由原来的15万个 零模波导孔增加到100万个,极大的提高了测序通量;对于 DNA 样本无需 PCR 扩增,避免了覆盖度不均一和 PCR 冗余的弊端。诺禾致源最新引进20台 PacBio Sequel 平台,成为全球最大测序服务中心,为您提供领先的基因测序解决方案。

参考文献
[1] Giolai M, Paajanen P, Verweij W, et al. Comparative analysis of targeted long read sequencing approaches for characterization of a plant’s immune receptor repertoire[J]. BMC Genomics, 2017, 18(1):564.

 

(注:本文数据结果来自文献报道)

三代测序业务线   史   旺丨文案

王婷婷丨编辑


 

为你读文献

为你分享资源

为你分析研究思路

为你提供最前沿的科研动态

学霸,逗逼,科学家,文艺青年同在!

PacBio or Nanopore,谁能赢得三代测序的王者荣耀?

诺禾致源丨提供领先的基因组学解决方案

长按识别二维码,关注诺禾致源

 

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.