变异识别的基本流程及工具

1. 基本流程

主要包括三个部分:

    1. 原始数据质控
    2. 数据预处理
    3. 变异识别



2. 实践流程及软件

  1. 分析环境的配置——conda
  2. 数据的准备——原始测序数据 + 参考基因组数据 + 注释数据库
  3. 数据质量的评估——fastqc + multiqc
  4. 序列比对、排序、标记PCR重复——bwa + samtools + picard
  5. Indel 区域局部重比对——gatk
  6. 碱基质量值重校正——gatk
  7. 变异识别——bcftools + gatk + freebayes + varscan
  8. 变异过滤——bcftools + gatk + vcftools
  9. 变异注释——annovar