巧用小工具,深挖TCGA數據庫。
TCGA對于研究腫瘤的同學來說是個大寶藏,基于TCGA數據産生的生物信息學文章也是不計其數,上可發表在CNS這類頂級期刊上,下可灌水發表在一兩分的SCI期刊。
相關數據的分析工具在酸談的公衆号裡介紹過GEPIA、TCIA、StarBase、TIMER。今天再來給大家介紹一個研究TCGA的DNA甲基化與表達數據的工具——MEXPRESS,網址:https://mexpress.be/
DNA甲基化一般發生在CpG位點,經DNA甲基轉移酶催化胞嘧啶轉化為5-甲基胞嘧啶,在人類基因中, 大約80%-90%的CpG位點已被甲基化;而DNA的甲基化與轉錄活性成反比,也會影響基因組的穩定性。癌基因的DNA甲基化水平降低或者抑癌基因的DNA甲基化水平增高都可能會導緻腫瘤的發生。
工具的使用隻需輸入基因名+選擇要研究的腫瘤即可,就這麼簡單粗暴!
以TP53在乳腺癌中的情況為例進行分析,先看各因素(包括組織類型、腫瘤亞型、分子分型、甲基化)與表達的關系:可以看到有3個位置的甲基化與表達呈顯著負相關(用的是Pearson檢驗),而其他如her2 status等等臨床因素與基因表達之間沒有顯著的關系。
然後我們看看其他因素(不同的腫瘤統計分析了不同的因素)。以“her2 status”為例,her2陽性的患者容易轉移複發,預後生存較差,點擊“her2 status”(三角箭頭指着誰,就分析包括表達、甲基化在内的其他所有因素與該因素之間的關系)。
可以發現結果展示發生了變化:數據根據her2 status進行了重排,然後根據不同的her2 status進行了統計檢驗,發現有一些其他臨床因素與her2 status存在相關性,也有一些甲基化位點的甲基化水平在不同的her2 status中存在差異。
因為相比于基因編碼區的甲基化,啟動子區的甲基化對基因表達活性的影響更大。點擊highlight promoter probes會高亮啟動子區的探針結果,大家可以自行點擊看一下顔色變化。
然後點擊探針号時,會顯示該探針對應的位置和性質,當我們在工具上發現一個位置的甲基化與某個因素顯著相關時,通過了解該位置的特征和信息可以幫助我們設計下一步的研究。
關于網站的使用,就介紹到這裡了,總結一下,這個在線工具可以用來探索、挖掘樣本因素(分子分型、樣本類型等等)、基因甲基化、基因表達之間的關系,大家可以根據自己的研究目的來在線工具上尋找一些潛在的機制。祝大家文章順利發表。
有話要說...