全基因组重测序


全基因组重测序是对人类不同个体或群体进行全基因组测序,并在此基础上对个体或群体进行差异 性分析。通过这种方法,可以在个体或群体水平找到大量的单核苷酸多态性位点(SNP),插入缺 失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)位 点,拷贝数变异(CNV,Copy Number Variation)。该方法为筛选疾病致病基因和易感基因提 供了重要信息,从而推动医疗技术的发展。

技术流程


信息分析


基本信息分析
1. 数据质控:去除接头污染和低质量数据
2. 与参考序列进行比对、统计测序深度及覆盖度
3. SNP/InDel/CNV/SV检测、注释及统计
高级信息分析
肿瘤 单基因病 复杂疾病
1. 已知的癌症基因的突变筛选
2. 高频突变基因总结
3. 突变位点分布情况分析
4. 基因组变异Circos 图展示
5. MRT 高频突变基因相关性分析
6. 高频CNV 分析
7. 肿瘤纯度及倍性分析
8. LOH 在基因组中的分布
9. 瘤内异质性及克隆结构分析
10. 融合基因及高频融合基因
11. 非编码区高频突变分析
12. 病毒整合分析
13. 其他个性化内容分析
1. 突变位点筛选
2. 显/隐性遗传模式筛选(纯合子或杂合子的筛选)
3. 候选基因功能注释
4. 候选基因功能富集分析 (GO,KEGG等)
5. 纯合子区域分析(连续纯合子变异区段)
1. 综合各种资源列举已知候选基因
2. 候选基因中突变的筛选和功能预测
3. 候选基因功能注释
4. 新生突变筛选和分析
5. 候选基因功能富集分析 (GO,KEGG等)
6. 蛋白互作网络分析(PPI)
7. 结合实验设计(家系或自然群体)进行遗传学分析(连锁关联分析)
8. 变异在全基因组范围内的共发生/互斥现象分析
9. 其他个性化分析

应用实例


全基因组测序描绘乳腺癌突变谱

Nik-Zainal, S., et al., Landscape of somatic mutations in 560 breast cancer whole-genome sequences. Nature, 2016. 534(7605): p. 47-54.

研究人员测了560位乳腺癌患者(556位女性和4位男性)的肿瘤和正常组织的全基因组, 共鉴定出93个驱动基因,以及与缺陷DNA修复和BRCA1及BRCA2功能相关的突变标签 (mutational signatures),揭示了乳腺癌的基因起源和驱动机制。研究人员共在93个基因 中鉴定出1628个可能的驱动突变。其中95%的基因组至少有一个驱动基因。研究人员还分析了基因组的 非编码区,分布在PLEKHS1、TBC1D12和WDR74的启动子中,以及长非编码RNA MALAT1和NEAT1中发 现了复发性突变(recurrent mutations)。本研究也鉴定出了6个重组标签,标签1~3表现为串联 重复,重组标签2和5表现为缺失。其中3种标签与基因同源重组的DNA修复缺陷相关:一种和BRCA1功 能缺陷相关,另一种和BRCA1或BRCA2功能缺陷相关,第三种未知。研究人员表示,鉴定这 些突变标签是未来做诊断的基础。

单碱基变异和重排的进一步特征分析