科研动态

LncRNA保守性分析 | 如何从鼠源Lnc到人源Lnc?

来源:小博发布时间:2018-07-31

引言
客户在做基础研究时,经常会采用动物模型来进行实验。通过高通量筛选获得了差异的LncRNA,并对其中某个LncRNA进行研究,后期为表明该LncRNA在人疾病上的适用性,往往就需要在人上比对到同源性的LncRNA,但LncRNA保守性比较低,只有部分序列是多物种保守的,这种保守序列与其功能密切相关。

近期有篇文章(Transcriptional regulation of macrophage cholesterol efflux and atherogenesis by a long noncoding RNA),研究小鼠LncRNA——Mexis,又称AI427809、NONMMUG029262、NR_033140,功能实验表明了Mexis的重要性。此外,对Mexis进行保守性分析,定位到人的同源性lncRNA(TCONS00016111)。今天小编就给大家简单介绍一下文中涉及的LncRNA保守性分析方法,以Mexis(AI427809)为例,看别人是如何查找不同物种的同源性LncRNA。

文中方法:UCSC数据库
小鼠LncRNA——AI427809,又称Mexis(文章作者自行命名),通过研究发现靶标为Abca1,后期通过保守性分析发现人的同源性LncRNA——TCONS00016111,文章通过两张图来体现物种间的保守性。

图1:


图2:


具体方法:
1. 打开UCSC, 选择mm10,输入AI427809,提前选择conservation,点击GO,



2. 得到如下界面:


3. 放大AI427809(选中区域,然后点击Zoom in)


4. 为了进一步了解展示保守性的物种及相应序列,点击Multiz alignments,


5. 点击绿色区域可得到小鼠与不同物种间的同源性序列,着重查看人的同源性序列,发现主要集中在9号染色体在105100000区域左右(版本Hg38),该区域正好有个LncRNA——TCONS00016111, 同时上游104800000区域附近正好也是Abca1靶标基因区域。(结果中提供基因组位置属于Hg19版本,需自行转换一下)




6. 以上步骤定位到人的同源性LncRNA(TCONS00016111),文章作者又从物种人出发,进一步确认TCONS00016111的保守性。首先打开UCSC,输入Abca1,选择显示lncRNA,缩小基因浏览器,展示出TCON00016111区域。通过100 vertebrates Basewise Conservation by PhyloP和100 vertebrates Basewise Conservation by PhastCons两个保守性评判值俩看,TCON00016111区域具有一定的物种保守性。




PS:通过这篇文章,大致归纳一下,就是鼠源AI427809通过顺式调控靶标基因Abca1,通过保守性分析,定位到人的同源性LncRNA——TCONS00016111,也是通过顺式调控靶标基因Abca1。这也体现出LncRNA的功能保守性。在此基础上假设一下,如果研究确定了鼠源LncRNA及其顺式靶标,可以从靶基因出发(因为常见物种的编码基因信息是非常全面的),先从人源上定位到靶基因,再在靶基因附近查找lncRNA信息,这也不失为一种方法。


常见方法:NONCODE数据库

1. 打开NONCODE网站(http://www.noncode.org/),在搜索框内输入AI427809,点击Search,然后点红框的任意一条记录。


2. 出现如下页面,点击红框内基因ID:


3. 点击这个基因ID,会出现如下页面,结果发现并没有保守性相关信息。这种情况不一定就说明在其它物种上没有保守性序列,这是NONCODE本身数据库信息就不全面的缘故。这时没有发现保守性序列,可以考虑换另一种的方法。



4. 按照上述方法没有得到AI427809的物种保守性信息,因此咱们换一种,直接通过该LncRNA的核酸序列进行保守性分析。首先获取AI427809这个LncRNA的序列,序列如下:


5. 点击Blast


6. 得到如下界面,并将AI427809的序列复制进框内,


7. 然后点击Search,得到如下界面:

在所得结果中有小鼠和大鼠的同源性序列,但没有发现人的同源性序列。类似的方法还有NCBI的BLAST。但这类方法对数据库的依赖比较大,特别是目前NONCODE,NCBI数据库收录各类物种LncRNA信息不是很全面的情况下,定位不到同源性的LncRNA不足为奇。

因此,对于LncRNA的保守性分析往往需要尝试不同的方法。比如文章中涉及的AI427809,UCSC法可以定位到同源性的LncRNA,但Noncode则不能。

PS:LncRNA保守性比较低,想从模式动物的LncRNA定位到人的同源性LncRNA,相对而言比较困难,希望以上两种方法对有此需求的客户有所帮助!
参考文献: Transcriptional regulation of macrophage cholesterol efflux and atherogenesis by a long noncoding RNA. Nature medicine. 2018.