當前位置:首頁 > 科技 > 正文

豪哥出品| lncRNA序列信息如何查找?

經常有客戶問小編,在拿到lncRNA芯片結果後,如何獲取想要的lncRNA的序列信息進行後續研究呢?今天小編就來給大家細細地聊聊如何查找lncRNA芯片結果裡面的lncRNA序列信息。

通常我們在拿到lncRNA結果數據後,需要對芯片結果進行qPCR定量驗證,這個時候就需要獲取lncRNA的序列信息用于引物設計,與此同時,後續在對感興趣的lncRNA進行深入的研究時,同樣需要先獲取lncRNA的序列信息。我們發現部分客戶對于lncRNA序列信息的獲取存在一定的疑慮,大家可能沒有注意到其實我們在芯片結果裡面已經為大家清晰的标出了各lncRNA的數據庫來源以及相應的索引号(下圖藍色框标注的信息:Source,Accession),下面我們以人的lncRNA芯片結果裡面的lncRNA序列信息的查找為例:

首先我們可以看到,在芯片結果裡除了會列出各實驗樣本的表達信号值外,還詳細地列出每個探針對應的lncRNA信息,如下圖所示是芯片結果裡對每個探針所檢測的lncRNA的詳細描述:

各表頭對應的信息:

ProbeName:lncRNA探針名

ControlType:探針屬性

ProbeSeq:探針序列

GeneSymbol:基因名稱

Description:對lncRNA的描述

Accession:lncRNA在相應數據庫的索引号

Source:lncRNA的數據庫來源

Chromosome:lncRNA的染色體來源

Start:lncRNA在染色體上的起始位置

End:lncRNA在染色體上的終止位置

那麼獲取了這些信息後,我們如何在實際中進行lncRNA序列信息的查找呢,不急,且容小編細細講來:

ENSEMBLE_GENCODE來源的lncRNA:

打開Ensemble數據庫 http://asia.ensembl.org/index.html:

如上圖所示,可以有兩種方式進行lncRNA序列查找:

a. 在1的位置選擇物種後,輸入該lncRNA的Accession号:ENST00000421648,點擊Go

b.在2的位置直接輸入該lncRNA的Accession号,點擊搜索圖标

跳轉到搜索結果頁面:


如上圖所示,檢索結果的第一個即為我們要找的lncRNA:ENST00000421648,點擊“cDNA seq”,即可進入到該lncRNA詳細的序列信息界面:

這個界面即是lncRNA:ENST00000421648在Ensemble裡面的序列信息,點擊“Download sequence”:

選擇“cDNA(transcripts)”,點擊“Download”即可獲得包含該lncRNA的轉錄本序列信息文檔。

RefSeq來源的lncRNA

打開NCBI數據庫https://www.ncbi.nlm.nih.gov/:

選擇“Nucleotide”,輸入lncRNA的Accession号:NR_110454,點擊“Search”:

獲得該lncRNA的信息,點擊“FASTA”獲取該lncRNA fasta格式的序列信息:

NONCODE來源的lncRNA:

打開NONCODE數據庫http://www.noncode.org/:

輸入lncRNA的Accession号:NONHSAT016087,點擊“Search”,即可獲得該lncRNA的序列信息:

LNCipedia來源的lncRNA:

打開LNCipedia數據庫 https://lncipedia.org/:

輸入lncRNA的Accession号:lnc-SSX2-2:1,點擊搜索圖表,即跳轉到結果頁面,下拉獲得結果信息:

點擊上圖中的lncRNA Accession号即可獲得更詳細的lncRNA信息:

看了上面的介紹,是不是發現lncRNA的序列查找其實很簡單,隻要根據lncRNA的Accession号在相應的數據庫裡面進行查找就可以了。當然這種簡單是建立在我們升級版後的lncRNA芯片基礎上的,那麼對于升級前的lncRNA芯片,部分lncRNA序列信息的查找仍然是有一定難度的,這主要歸因于目前對lncRNA研究尚不完善,各lncRNA數據庫的更新速度非常之快(LNCipedia在17年和18年兩年間就更新了四次),很多之前被認為是lncRNA的序列在後續的研究中發現其實根本不是lncRNA或者之前對其的信息描述存在一定的錯誤,因此這些lncRNA在數據庫更新過程中就會被剔除或者更正,而芯片作為商業化的産品,其更新換代的速度勢必趕不上lncRNA信息的更新速度,那麼就會存在部分芯片中的lncRNA信息在相應的數據庫中無法查詢到的情況。

對于這種情況,那麼可以先看看是不是該lncRNA的名字已經更新了,如LNCipedia來源的lncRNA在目前的版本LNCipedia V5.2中查找不到相關的信息,可以看看該lncRNA是否換名字了,首頁裡面的“ID history converter”可以根據舊版本lncRNA索引号進行相關序列信息的查找,此外 LNCipedia數據庫提供了各版本間Accession号的對應表供查詢,從對應表裡找到新的Accession号,然後在LNCipedia V5.2進行序列信息查找。如果在對應表裡也沒有查找到該lncRNA,那麼可以通過染色體的位置信息在UCSC上進行查找。如果這些方法都試了,還是找不到該lncRNA的信息,那麼可以考慮這個lncRNA已經被證實并非真的為lncRNA,已經被數據庫剔除掉了,對于這種情況,我們建議重新選擇lncRNA進行研究。

好了,芯片結果裡lncRNA的序列信息查找就介紹到這了,不知道您是否對于lncRNA序列信息的查找闊然開朗,持續關注豪哥出品專欄,更多技能與您分享。

你可能想看:

有話要說...

取消
掃碼支持 支付碼