科研动态

分析专题 | 生物信息学服务——通路富集分析

来源:小博发布时间:2019-05-08


目前,KEGG是有关Pathway的主要公共数据库。根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集,并计算误判率。通路富集分析(Pathway Enrichment Analysis)对实验结果有提示的作用,通过差异基因的Pathway 分析,可以得到与主流表达趋势相关的所有基因参与的显著、靶向的Pathway,寻找不同样品的差异基因可能和哪些细胞通路的改变有关,同时将上下调的差异基因映射到每一个pathway map上,定位关键通路的关键基因。

1. 对差异基因进行显著性Pathway分析,得到具有显著性、靶向性的Pathway以及显著性Pathway对应的靶基因。通常情况下,会将上调基因和下调基因分开富集。结果共计四张sheet表格数据,分别是:上调基因通路富集结果;相应通路对应的上调基因;下调基因通路富集结果;相应通路对应的下调基因。(信号通路富集)

表头说明

pathway_id:pathway索引号,与KEGG数据库的pathway索引号一致

pathway_name:pathway名称,与KEGG数据库中pathway的命名方式一致

population_mapped_to_id:基因计数,数据库中参与某一pathway的基因数量

study_mapped_to_id:基因计数,表示数据库中属于某一pathway的基因数量

enrichment:富集度,若p值相同,富集度越大的pathway,表示该pathway受到实验的影响越大

p-value:p值,评估pathway的显著性水平,(p<0.05表示pathway具有显著性差异,用不同颜色标注)

adjusted_p-value:误判率,对p值准确率的判断,对pathway显著性水平的再判断

study_mapped_link:映射差异基因在KEGG Pathway的链接,图中红色表示上调基因,紫色表示下调基因,绿色表示该物种存在这个基因,白色表示该物种不存在这个基因

贴心的是,对富集在各个通路内的基因都做了整理汇总。比如,参与B cell recepter signaling pathway(第一条)的差异基因有23个,那具体是哪些基因呢?在咱们的结果中就可以直接查看。


2. 对富集得到的显著性信号通路以柱状图的形式展示。(信号通路柱状图)


横坐标为-Lg(P value),纵坐标为Pathway名称,横坐标值越大,说明该差异基因在该Pathway中越富集

 

3.  对所有信号通路中的差异基因都进行Pathway Mapping注释,在KEGG的信号通路界面对差异基因进行投影,上调标记为红色,下调标记为紫色。(Pathway Mapping注释)


 

4. 针对目前KEGG Pathway的8个大类,调节网络、代谢过程、遗传信息传递、环境信息传递、胞内生物过程、生物体系统、人类疾病及药物研发等,每个分类下还有二级分类。将显著性Pathway进行归类,并进行二级分类,宏观的掌握显著性Pathway信息,并有利于更好的筛选关注的Pathway信息。(Pathway归类)
 

 

5. 对富集得到的显著性功能以点图的形式展示。(Pathway点图)



 

横坐标表示富集度,纵坐标为Pathway名称。颜色代表P Value,颜色越浅越显著。圈的大小代表富集结果中的差异基因数量,数量越大越大,圈越大。



PS:如果您觉得不够美观,那现成的数据可以适应客户不同的可视化需求。如果您想公司为您修改,OK完全没问题。只要在中康博生物完成的分析项目,后期改图都是免费哒。



北京中康博生物科技有限公司(beijing Cnkingbio Biotechnology Co.LTD)通过引进资金、人才,以及平台升级后快速发展起来的专业技术服务公司。公司立足生命科学,为临床与基础研究领域科学工作者提供分子生物学高端技术服务。
 

有需要的小伙伴们,可以拨打电话进一步咨询:

全国免费服务热线:400-9199-545
北京区电话:(010)56381368