全基因组重测序文章要求测序深度,是越多越好吗?

以下文字资料是由(历史新知网)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!

问题一:全基因组测序的技术路线

提取基因组DNA,然后随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行基因簇cluster制备或电子扩增E-PCR,最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对插入片段进行测序。然后对测得的序列组装成Contig,通过Paired-End的距离可进一步组装成Scaffold,进而可组装成染色体等。组装效果与测序深度与覆盖度、测序质量等有关。常用的组装有:SOAPdenovo、Trimity、Abyss等。

问题二:全基因组重测序的技术路线

Depth):测序得到的碱基总量(bp)与基因组大小(Genome)的比值,它是评价测序量的指标之一。测序深度与基因组覆盖度之间是一个正相关的关系,测序带来的错误率或假阳性结果会随着测序深度的提升而下降。重测序的个体,如果采用的是Paired-End或Mate-Pair方案,当测序深度在10~15X以上时,基因组覆盖度和测序错误率控制均得以保证。测序深度对基因组覆盖度和测序错误率的影响(HOM:纯合体

问题三:什么是基因组测序技术

自1998年美国塞莱拉遗传公司组建以来,人类基因组研究开始由两部分科学家同时展开,分别是由公共经费支持的人类基因组工程和美国塞莱拉遗传公司。在研究过程中,他们也分别采用了两种不同的测序和分析的方法。塞莱拉公司的核心分析方法被称为霰弹法,人类基因组工程则采用了克隆法。
所谓霰弹法,其实是一种高度计算机化的方法,它先把基因组随机分成已知长度(2000个碱基对、1万个碱基对、5万个碱基对)的片段,然后用数学算法将这些片段组装成毗邻的大段并确定它们在基因组上的正确位置。
塞莱拉公司的科学家先用霰弹法测序DNA,并将整个基因组覆盖8次,然后用两个数学公式将人类基因组序列多次组装起来,确定出基因中的转录单元,预测出60%的已识别基因的分子功能。最后研究人员将人类基因组信息与此前已完成的果蝇和线虫的基因组序列进行比较,从而找出了三者共有的核心功能。
而人类基因组工程采用的克隆法则通过先复制更大段的人类基因序列,然后将它们绘制到基因组的适当区域进行研究。这种方法需要研究人员在早期把较多的时间和精力放到克隆和绘制草图上。
两个研究组将所得数据进行对比,经人类基因组工程的科学家、《科学》和《自然》杂志高级指导编辑评估,表明塞莱拉公司的基因组分析与人类基因组工程的分析结果虽然存在一些差异,但大部分地方都有极高的吻合度。
塞莱拉公司测定的序列覆盖了95%以上的人类基因组,其中约85%的人类基因组存在于按照正确顺序排列、至少包含50万个碱基对的片段中。这一序列为人类至少拥有2.6383万个控制合成蛋白质的基因提供了有力的证据,也为另外1.2731万个假设基因的存在提供了较弱的证据

问题四:全基因组和全外显子组测序的区别

基于第二代高通量测序技术,对于有参考序列的物种,针对不同的真菌菌株,可通过全基因组重测序的方法获得全基因组范围内完整的变异信息,讨论群体的遗传结构、影响群体遗传平衡的因素以及物种形成的机制,定位重要性状位点,为后续分子育种打下坚实基础。同时,通过全基因组大样本重测序对真菌重要菌株进行全基因组的基因型鉴定,并与关注的表型数据进行全基因组关联分析(GWAS),找出与关注表型相关的SNP位点,定位性状相关基因。随着测序成本降低和拥有参考基因组序列的物种增多,基因组重测序也成为育种研究中迅速有效的方法之一,在全基因组水平扫描并检测出与重要性状相关的变异位点,具有重大的科研价值和产业价值。
近日,Nature Genetics发表的一篇文章就充分利用了微生物基因组测序与以全基因组重测序为基础的全基因组关联分析结合的方法,揭示了裂殖酵母遗传与表型多样性之间的联系。研究者选取裂殖酵母Schizosaccharomyces pombe作为研究对象,在全球20个国家范围内收集了时间跨度为100年的161个野生株系的S.Pombe,进行了全基因组测序,推测裂殖酵母在公元前340年开始广泛大量出现,祖先种到达美洲的时间为公园1623年。后续研究者又选取223个菌种进行全基因组关联分析,发现至少89个性状表现出一个关联。每个性状最显著的检测到的变异可以解释平均22%的表型差异,且indel的影响比SNP更大。

问题五:全基因组测序的研究结果

①NCI-H209细胞系基因组中,共检测到22,910个碱基替换、65个插入缺失(Indels)、58个结构变异;在基因组的编码区,除了发现RB1 和TP53基因发生点突变和MLL2基因由于发生了G>T的颠换,从而产生了pre-stop codon外,有94个点突变直接改变了氨基酸序列,有36个属同义突变。②特定的碱基及其周围序列易被烟气中的多环芳烃和丙烯醛诱变。在NCI-H209细胞系基因组中,G>T/C>A是最为普遍的颠换现象,发生频率为34%;其次是G>A/C>T(21%)和A>G/T>C(19%);CpG岛外的CpG二核苷酸多发生G>T颠换,而CpG岛内的CpG二核苷酸多发生G>C颠换,说明烟气中的致癌物偏好引起甲基化的CpG二核苷酸发生颠换。③检测到转录偶联修复(Transcription-coupled repair)在起作用。转录偶联修复作用机制:鸟嘌呤和腺嘌呤上大的加合物是吸烟过程中所释放的致癌化学物质引起DNA损伤的主要形式,这些大的加合物阻止了转录链上RNA聚合酶的转录过程,而转录受阻的RNA聚合酶招募核苷酸剪切修复相关因子对受损的核苷酸进行修复以避免突变发生。在TP53基因突变的肺癌细胞中,G>T颠换常出现在非转录链,表明在转录链上相同的损伤已被识别和修复。在本研究中,转录链上G和A碱基替换频率比非转录链上少,由此看来嘌呤是烟气致癌物质主要诱变靶标。另外,在NCI-H209细胞系中,转录链和非转录链上发生不同类型的突变(G>T、A>G、A>T)两条链基因表达水平也有差异,这就意味着转录偶联修复机制识别、修复不同加合物损伤的能力不同。表达相关的修复(Expression-linked repair)作用机制:这是一种新的、更为普遍的修复机制,即,高表达的基因中,转录链及非转录链的突变频率都较低。在NCI-H209细胞系中,转录链和非转录链上发生G>A的突变,两条链上基因表达水平都很高,这就说明表达相关的修复作用比转录偶联修复作用更为重要。④在SCLC细胞系中,CHD7基因发生了重排。在NCI-H209细胞系中,CHD7基因3~8外显子发生连续重复,而另外2个LU-135、NCI-H2171细胞系则携带PVT1-CHD7融合基因,说明在肺癌中CHD7基因发生了周期性重排。以上结果表明,第二代测序技术已成为研究与癌症相关的基因突变过程、细胞损伤修复路径、基因调控网络的强有力工具。

问题六:第二代测序技术能测基因组全长吗

第二代测序技术能测基因组全长
首先准备基因组(虽然测序公司要求样品量要达到200ng,但是Gnome Analyzer系统所需的样品量可低至100ng,能应用在很多样品有限的实验中),然后将DNA随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组测序,则文库的构建要相对麻烦些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片段化并加上接头。片段的大小(Insert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的insert size,以便在组装(Assembly)的时候获得更多的信息。

我要回帖

更多关于 全基因组重测序文章 的文章

 

随机推荐