样品基因组DNA检测合格后,利用超声波将DNA序列片段化形成随机片段,对片段化的DNA依次进行末端修复、3′端加A、连接测序接头后,再利用磁珠吸附富集长度为400bp左右的片段,经PCR扩增形成测序文库。建好的文库先进行质检,质检合格的文库用Illumina HiSeqTM平台进行测序,测序策略为Illumina PE150,总测序读长为300bp。
在Illumina HiseqTM测序数据(Raw Data)下机之后,对下机数据进行质量控制,过滤其中低质量的数据,获得高质量的数据(Clean Data)。利用BWA软件(Li et al。, 2009)将Clean Data比对到参考基因组序列上,获得序列的位置归属(即BAM文件)。利用GATK的Best Practices流程(McKenna et al., 2010)对BAM文件进行校正,并进行SNP和Small InDel标记的检测;利用Delly(Rausch et al。, 2012)和CNVnator(Abyzov et al., 2011)软件进行SV和CNV的结构变异检测。利用SnpEff软件(Cingolani P,2012)和参考基因组的基因预测信息进行变异功能注释,得到SNP、InDel、SV、CNV的功能注释信息,利用Circos软件(Krzywinski et al., 2009)绘制变异信息基因组圈图。
步骤
软件列表
版本
下载链接
原始数据质控
Fastp
0.20.0
参考基因组比对
BWA
0。7。17
变异检测
GATK
4。1。2。0
变异功能注释
SnpEff
4.3
基因功能注释
Blast
2.9.0
变异可视化
Circos
V0.69-6