首页> 高通量测序 >动植物基因组测序

动植物基因组测序

动植物基因组从头测序

产品介绍

简介:

    基因组从头测序也叫de novo测序,主要针对基因组序列未知的物种,构建不同类型的基因组DNA文库,并进行序列测定。然后使用生物信息学方法对测序得到的序列进行拼接、组装和注释,从而获得该物种完整的基因组序列信息。

 一、技术路线

    动植物基因组从头测序的主要策略:1、对短片段Shotgun文库(300-1000 bp)进行深度测序,确保序列覆盖度和测序准确性,获得基因组基本序列信息;2、构建较长插入片度的Mate pair文库(2 kb、5 kb、8 kb、10 kb、20 kb)并测序,确定短片段序列间的相对位置,通过拼接组装获得基因组序列框架,在此基础上通过生物信息学方法进行基因注释和分析。

Illumina MiSeq数据为主,结合Illumina HiSeq2000数据

二、生物信息分析

1.原始数据整理、过滤及质量评估

 2. 基因组序列拼装与分析:

     ♦基因组序列拼装

     ♦基因组拼装效果评估 (Contig N50、Scaffold N50、基因组大小和GC含量 )

 3. 功能元件分析:

     ♦蛋白编码基因预测

     ♦非编码RNA预测

     ♦蛋白编码基因的功能注释

     ♦蛋白编码基因的KOG和GO注释

     ♦蛋白编码基因的代谢途径注释(KEGG pathway)          

4.根据客户要求进行个性化分析    

三、结果展示

四、样品要求

1、DNA样品:Miseq DNA PE文库浓度≥20ng/μl,总量≥6μg(荧光定量);Miseq DNA MP文库浓度≥40 ng/μl,总量≥12 μg(荧光定量);454 DNA库浓度≥20 ng/μl,总量≥3 μg(荧光定量),电泳检测无明显RNA条带,基因组条带清晰、完整,主带应在100 kb以上。若样品中有多糖、糖蛋白的残留,对打断DNA样品带来非常大的困难,且很难去除,因此特别要求所提供的样品不要有多糖或糖蛋白污染。

 2、动物样品:对于一般物种应挑选肝脏、肾脏、血液等组织取样,对于珍贵物种请提供耳样、毛发(带毛根)等脂肪含量较少的组织进行取样。为了减少个体差异对后续拼接产生的影响,尽量从同一个个体中取样。若物种体积较小,从一个个体中提取的DNA量不能满足测序实验所需,在保证量的前提下,应尽量减少采样个体的数量。提供组织样品应>500 mg,尽量提供较多量,不同的物种DNA提取产量有差异。

 3、植物样品:植物材料应尽量选取植物组织幼嫩部位。提供组织样品应>500 mg,尽量提供较多量,不同的物种DNA提取产量有差异。

五、kk娱乐优势

1. 利用Illumina MeSeq平台的长读长优势和Illumina HiSeq2000的高通量优势,能获得高质量的基因组图谱。

2. 已完成多项大型动植物基因组测序项目,有丰富的基因组测序及分析经验。

3. 可根据实际需求个性化定制基因组测序方案。

经典案例一

蒙古马和普氏野马全基因组测序

背景:普氏野马(蒙古野马)(Equus ferus przewalskii)属于马科,原产于蒙古国西部科布多盆地和中国新疆准噶尔盆地东部一带,因此也被称作蒙古野马或准噶尔野马,是世界上仅存的野马,具有6000万年的进化史,被世人誉为“活化石”,是研究家马起源和品系人工选育不可或缺的材料,也是保存马类动物遗传多样性及用于家马性状改良和育种的珍贵物种。蒙古马是中国乃至全世界较为古老的马种之一,主要产于内蒙古草原,是典型的草原马种,被农业部确定为138个国家级畜禽遗传资源保护品种之一。
目的:运用Illumina HiSeq2000平台对一匹雄性蒙古马和一匹雄性普氏野马全基因组进行测序,同时通过Roche 454 FLX+平台对另外一匹雌性蒙古马的8个组织进行深度转录组测序,以便得到普氏野马和蒙古马的基因组序列和基因注释信息。通过对马属动物核型进化的研究,进而揭示哺乳动物核型进化机制。

 结果:雄性蒙古马和雄性普氏野马在拼接组装中分别组装了2 Mb和3 Mb的Y染色体序列,获得了迄今为止最完整的马的Y染色体的序列图谱;通过蒙古马5号染色体与普氏野马23、24号染色体间的序列相似性分析,确认了蒙古马和普氏野马间的一次染色体罗伯逊易位事件,并且发现罗伯逊易位并没有导致染色体更多的局部重排,说明罗伯逊易位和染色体局部重排可能是由不同的机制引起的。研究还发现两种重复序列对基因组的不稳定性有着强烈的影响。

原文索引:[Huang J L, et al. Analysis of horse genomes provides insight into the diversification and adaptive evolution of karyotype. Sci. Rep, 2014, 4: 4958.]

 经典案例二

骆驼全基因组测序                 

背景:骆驼是骆驼科,骆驼属的动物,分单峰驼、双峰驼两种。野骆驼生活在中国西北和蒙古西南部,能够忍受酷热和酷寒,并且适应贫瘠和稀缺的植被。骆驼有诸多特性:一天之内,骆驼的体温可能经历从34到41摄氏度的巨大变化;骆驼进食八倍于牛和羊的盐,血糖水平是其他反刍动物的两倍,但并未罹患糖尿病和高血压;骆驼还能制造一种名为重链抗体的抗病蛋白。

 目的:运用Roche 454 FLX+、Illumina和SOLiD平台对骆驼全基因组进行测序,通过与已测序完成的其它物种的比较基因组学分析,研究骆驼的进化历史,从而了解骆驼特殊生活习性和生理特性,解释骆驼在极端环境下生存能力的分子机制,为野生骆驼保护和家养骆驼品种改良提供指导。

结果:双峰驼全基因组大小为2.38 Gb,发现20,821个蛋白编码基因。在其它已完成基因组测序的物种中,双峰驼与牛的遗传关系最近,预计的分化时间大约在5500万—6000万年前。快速进化分析发现,调节胰岛素信号途径的基因在双峰驼中存在快速进化。研究还发现骆驼具有多个CYP2J基因拷贝,CYP2J基因与高压升高相关。研究同时解析了骆驼嗅觉基因、解毒基因和免疫球蛋白的遗传分子特征。 

原文索引:[ Meng H, et al. Genome sequences of wild and domestic bactrian camels. Nat Commun, 2012, 3: 1202-1209.]

常见问题

1、Q:基因组框架图和精细图有什么不同? 

    A:框架图能覆盖基因组常染色体区域90%,覆盖基因区域95%,Contig N5到5 kb,Scaffold N50达到20 kb,单碱基错误率在十万分之一以下。精细图能覆盖基因组常染色体区域95%,覆盖基因区域98%,Contig N5到20 kb,Scaffold N50达到300 kb,单碱基错误率在十万分之一以下。   

2、Q:动植物基因组从头测序时为什么需要构建不同类型的文库?

  A:因为动植物基因组大、复杂度高,且存在大量的重复区域,因此需要制备不同梯度的测序文库,进行双末端测序,使得在拼接中能够跳过大范围的重复区,从而避免了基因组中重复序列造成 的错拼,提高了拼接的质量;同时结合BAC或Fosmid文库以及多种测序平台的综合运用,保证了测序的准确性和基因组的完整性,高效经济的完成高等动植物的基因组图谱绘制。

3、Q:在动植物基因组从头测序中,不同测序平台分别有什么优势?

  A:Roche 454 FLX+具有长读长能力,单条序列最长能达到1000 bp,可以为基因组的组装提供高质量的框架。Illumina HiSeq2000平台优势测序数据量大,成本低,可以为基因组测序提供高覆盖率的数据。Illumina MiSeq平台同时具有长读长和高覆盖率的优势,是基因组测序的较好选择。根据物种基因组的特点及复杂程度,kk娱乐生物会科学地设计测序实验方案,合理地将多个平台搭配在一起使用,既能解决复杂基因组的测序难题,保证基因组测序的质量,同时也能兼顾实验项目的经济性。


动植物基因组重测序

产品介绍

简介:

    基因组重测序是对已知基因组序列物种的个体进行基因组测序,并在此基础上对个体或群体进行比较基因组学分析。通过全基因组重测序可以找到大量的单核苷酸多态性位点(SNPs)、插入缺失(InDel)、结构变异(Structure Variation,SV)等变异信息,广泛应用于群体遗传学、临床医药、动植物分子育种等众多领域。

 一、技术路线

 

Illumina Miseq、Illumina HiSeq2000 

二、生物信息分析

1. 原始数据整理、过滤及质量评估

2. 基因组重测序分析:

    ♦与参考基因组比对
    ♦SNPs和InDel的检测
    ♦SNPs和InDel的注释

3. 根据客户需求进行个性化分析

三、结果展示

                             

四、样品要求

1、DNA样品:Miseq DNA PE文库浓度≥20 ng/μl,总量≥6 μg(荧光定量);Miseq DNA MP文库浓度≥40 ng/μl ,总量≥12 μg(荧光定量);454 DNA库浓度≥20 ng/μl,总量≥3 μg(荧光定量),电泳检测无明显RNA条带,基因组条带清晰、完整,主带应在100 kb以上。若样品中有多糖、糖蛋白的残留,对打断DNA样品带来非常大的困难,且很难去除,因此特别要求所提供的样品不要有多糖或糖蛋白污染。

2、动物样品:对于一般物种应挑选肝脏、肾脏、血液等组织取样,对于珍贵物种请提供耳样、毛发(带毛根)等脂肪含量较少的组织进行取样。为了减少个体差异对后续拼接产生的影响,尽量从同一个个体中取样。若物种体积较小,从一个个体中提取的DNA量不能满足测序实验所需,在保证量的前提下,应尽量减少采样个体的数量。提供组织样品应>500 mg,尽量提供较多量,不同的物种DNA提取产量有差异。

3、植物样品:植物材料应尽量选取植物组织幼嫩部位。提供组织样品应>500 mg,尽量提供较多量,不同的物种DNA提取产量有差异。

 四、kk娱乐优势

1、丰富的基因组重测序及分析经验。

2、可根据实际需求个性化定制测序及分析方案。

经典案例一
水稻基因组重测序
背景:水稻是一年生禾本科植物,基因组大小约为400 Mb,12对染色体,既是重要的经济作物,也是经典的模式生物。
目的:很多重要的农艺性状都是由多基因控制,并且单个基因仅仅起了微小的效应,因此进行鉴定和克隆往往非常困难。利用水稻突变体与原野生亲本杂交构建F2群体,通过重测序(MutMap)进行基因定位。

 

结果:选取一个日本骨干水稻栽品种的7个突变体,鉴定出来与突变表型相关的基因组区域,并对其中的一个突变体进行了验证。表明通过重测序可以快速获得突变基因,加速水稻和其它作物的遗传改良。
[ Abe, A., S. Kosugi, et al. "Genome sequencing reveals agronomically important loci in rice using MutMap." N a t B i o t e c h 30(2): 174-178. ]
经典案例二


鸡基因组重测序

背景:鸡是第一个完成基因组序列测定的农业动物(2004年),是研究脊椎动物遗传、进化和发育重要的模式生物。

目的:利用高通量测序技术对家鸡及其野生祖先红原鸡进行全基因组重测序,研究鸡在几千年驯化过程中的遗传变异。
                               
结果:研究发现了超过7,000,000个SNPs、1,300个缺失(deletions)和若干选择性清除(selective sweeps)。家鸡中促甲状腺激素受体(TSHR)基因存在显著变异,这也许与被驯化动物的一个典型特征相关。另外,家鸡它没有野生种群中所见的季节性生殖的严格调控。同时,研究发现在肉鸡群体中检测到的几个选择性清除片段,与生长、食欲和代谢调控相关的基因重叠在一起。
原文索引:[ Rubin CJ, Zody MC, Eriksson J, et al. Whole-genome resequencing reveals loci under selection during chicken domestication. Nature, 2010, 464: 587-593 ]


常见问题
1、Q:为什么要进行动植物全基因组重测序?
 A:利用二代测序进行动植物全基因组重测序,可以获得大量的单核苷酸多态性(SNPs)信息、序列的插入缺失位点信息。通过对获得的海量信息进行分析比对,能够获得个体或群体间基因   组水平的差异,发现或检测与疾病发生相关序列位点信息,开发高密度SNP分子标记,实现遗传进化分析及重要性状候选基因预测。  
2、Q:动植物全基因组重测序需要多少覆盖深度?
 A:重测序的覆盖深度是由所测物种的类型及项目的具体需求决定的。例如,采用Illumina进行人类基因组重测序,如要获得绝大多数的变异信息,一般建议覆盖深度需达30×以上。