基因组领域研究

ChIP-Seq

来源:小博发布时间:2017-05-16

 
ChIP-Seq简介
     用于在全基因组范围中研究DNA结合蛋白(相互反应)、组蛋白修饰(表观遗传标记)和核小体的技术,可有助于了解基因之间的相互调控以及染色体的功能结构。

ChIP-Seq实验原理

    在生理状态下,把细胞内的DNA与蛋白质交联(Crosslink)后裂解细胞,分离染色体,通过超声或酶处理将染色质随机切割,利用抗原抗体的特异性识别反应,将与目的蛋白相结合的DNA片段沉淀下来,再通过反交联(Reverse crosslink)释放结合蛋白的DNA片段,最后测序获得DNA片段的序列(如Fig.1和Fig.2)。
    
Figure 1


Figure 2

CHIP seq DNA样品要求

      基因组DNA打断至200-1000 bp片段;用TE/水溶解;总量≥50ng;纯度OD260/280在1.8-2.0之间;浓度≥50 ng/μL。若单次ChIP后DNA量不够,建议将2~3次ChIP的DNA合并在一起。CHIPseq需要测的是Input和IP两组(IgG不用测)。


ChIP Seq结果展示


1. 与参考基因组比对
    严格的比对率、比对质量、SCC分析;
    利用软件,将读段与参考序列进行比对,进行链相关性分析可用于检查IP的效果。

2. peak检出
    反应peak的分布及序列偏好;
    利用软件完成峰检分析(peak calling),并对峰的个数、宽度、分布等进行统计;
    反应peak峰的整体分布情况,统计峰顶分布情况,模体分析(Motif search ) 。


3. 转录因子调节基因功能通路富集及网络分析
   
    3.1 下游基因显著靶向性功能分析——GO Enrichment Analysis
     Gene Ontology数据库通称基因本体学数据库,简称GO数据库,是基因本体联合会(Gene Ontology Consortium)所建立的数据库,它是一个跨物种、综合性、描述性的数据库。其目的在于建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO数据库用树状分层的方式对基因及蛋白功能进行详细的描述,阐明了基因功能之间的层次关系。功能层级越高,其定义的功能描述越笼统,范围越广;功能层级越低,其定义的功能描述越详细,范围越窄。GO数据库能帮助我们更好地理解基因功能之间的关系。基于GO数据库筛选出代表目标基因群显著的、准确的、靶向的基因功能的方法就称为GO Enrichment Analysis。其价值在于发现目标基因所带性状的最重要功能,发现同一基因在这种性状里发挥的主要功能或者非主要功能及判断研究目标在更大量的样本下准确与否。GO Enrichment Analysis 方法将CHIP下游基因基于GO数据库进行基因功能注释,得到基因参与的所有功能,而后利用Fisher 精确检验和多重比较检验计算每个功能的显著性水平(P-value)和误判率(FDR)。

 

   3.2 下游基因参与的信号转导通路分析——Pathway Enrichment Analysis
     KEGG(Kyoto Encyclopedia of Genes and Genomes)全称是京都基因与基因组大百科全书,是系统分析基因(及其编码产物)间关系、基因功能、基因组信息的数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。基因组信息存储在Genes数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在Pathway 数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息。KEGG 提供的整合代谢途径(pathway)查询十分出色,包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解。KEGG 是进行生物体内代谢分析、代谢网络研究的强有力工具。

 

   3.3  Pathway归类
     针对目前KEGG Pathway的8个大类,调节网络、代谢过程、遗传信息传递、环境信息传递、胞内生物过程、生物体系统、人类疾病及药物研发等,将显著性Pathway进行归类,并进行二级分类,宏观的掌握显著性Pathway信息,并有利于更好的筛选关注的Pathway信息。



 

   3.4 下游基因全局信号转导网络——Global Signal Transduction Network
     利用数据库中KEGG等信号传递通路,以及基因、蛋白质、化合物之间的作用关系,构建目标基因群中,基因与基因产物间的信号传递网络,通过信号转导网络得到基因间的相互作用关系,信号转导网络通过图论分析方法可以得到网络的核心调节基因,反映样本在全局层面的基因调节机制。网络图如下:
ChIP-Seq案例

   1. 心脏成纤维细胞中激活后转录因子ATF3通过抑制MAP2K3-p38信号保护免受心力衰竭。 circulation. IF=17.049
     研究者确定了一种新型转录因子(Activating Transcription Factor 3)并发现它通过抑制Map2K3表达和p38 MAPK信号传导来保护免受心脏高血压重塑,心力衰竭和纤维化。首先通过高通量技术检测高血压动物和心力衰竭患者的心脏组织的表达谱情况,发现了核心转录因子ATF3
     然后通过一系列功能表型实验发现ATF3上调是高血压心室重塑和心力衰竭过程中发挥自我保护。最后再通过ATF3敲除技术,表达谱检测和CHIP-seq实验,发现并验证了ATF3抑制靶基因Map2K3介导的心脏保护作用。