当前位置: > 生命科学 > Pacbio三代测序准确率达到99.999%怎么来的

Pacbio三代测序准确率达到99.999%怎么来的

PacBio第三代测序技术具有超长读长、无PCR扩增、极小GC偏向等优势,使测序结果准确率达到99.999%(即QV 50),那么这些优势是如何提高数据准确率的呢?PacBio单分子测序错误率在12%-15%,这么高的错误率怎么能保证结果的准确性呢?下面,小编将从专业的角度为您一一道来。

一致性纠正随机误差

首先,小编先给大家说说12%-15%错误率的问题。对于任何测序平台来说,有意义的数据都是经过consensus的结果,而非单次读取的结果。第二代测序技术的高准确率是将成百上千的分子信号取平均值,然后同reference sequence进行比对后获得的结果。同样,由于PacBio测序产生的是随机误差,所以一旦增加测序深度,reads经过相互矫正后consensus序列准确率就可以快速提升。通常情况下,当有效测序深度达到30x时,PacBio的一致性准确度可以达到99.999%。

Pacbio三代测序准确率达到99.999%怎么来的

PacBio测序准确度与测序深度(Coverage)之间的关系

 

超长读长避免reads错误匹配

大多数物种基因组中存在重复序列,如果reads不够长,无法跨越全部或部分的重复序列区域,就会很难确定reads的位置和方向,从而直接影响基因组组装和结构变异检测。所以使用PacBio超长读长就可以避免这种问题,从而进行更精准的基因组研究。由于PacBio的这种特性,很多学者开始结合PacBio对已发表物种进行更完整、精准的基因组组装研究,比如人、苏茜、复活草、玉米等。

Pacbio三代测序准确率达到99.999%怎么来的

PacBio测序跨越复活草复杂区域

极小GC偏向协助鉴定DNA序列

第二代测序技术由于技术自身的限制,对于极端AT-rich或GC-rich的DNA序列,测序质量非常差,难以用来进行基因组研究。而PacBio测序并不会表现出这种序列偏好性,对整个基因组的测序过程都非常稳定,即便是那些被认为非常难测的区域,这一优势保证了极端区域序列的准确性。

Pacbio三代测序准确率达到99.999%怎么来的

PacBio读取100%GC含量序列

PCR扩增准确鉴定回文序列

回文结构广泛存在于各种生物体基因组中。它可以在真核染色体、细胞器及质粒、病毒和细菌基因组DNA中找到,并且广泛分布于人类癌细胞中。其特点是顺读和反读都是一样的序列。由于PCR扩增,传统的测序技术在文库制备阶段已经丢失了回文序列。而PacBio第三代测序技术在样本制备时无需扩增,所以不会影响回文序列的准确鉴定。

Pacbio三代测序准确率达到99.999%怎么来的

回文序列图示

读到这里小编相信,各位看官已经看出正是由于PacBio具有超长读长、无PCR扩增、极小的GC偏向、随机误差的优势,所以才能保证99.999%的准确率。

支付宝赞助
微信赞助

Pacbio三代测序准确率达到99.999%怎么来的:等您坐沙发呢!

发表评论

表情
还能输入210个字