变异识别的基本流程及工具
1. 基本流程
主要包括三个部分:
- 原始数据质控
- 数据预处理
- 变异识别
2. 实践流程及软件
- 分析环境的配置——conda
- 数据的准备——原始测序数据 + 参考基因组数据 + 注释数据库
- 数据质量的评估——fastqc + multiqc
- 序列比对、排序、标记PCR重复——bwa + samtools + picard
- Indel 区域局部重比对——gatk
- 碱基质量值重校正——gatk
- 变异识别——bcftools + gatk + freebayes + varscan
- 变异过滤——bcftools + gatk + vcftools
- 变异注释——annovar