deepBase v3.0: ncRNA表達(dá)圖譜和的交互式分析數(shù)據(jù)庫

欄目:最新研究動(dòng)態(tài) 發(fā)布時(shí)間:2023-08-31
中山大學(xué)團(tuán)隊(duì)發(fā)布了深度測序數(shù)據(jù)的表達(dá)圖譜和ncRNA的交互式分析數(shù)據(jù)庫——deepBase v3.0......

       人類基因組和其他哺乳動(dòng)物基因組被轉(zhuǎn)錄為編碼數(shù)千個(gè)短(sRNA)和長非編碼RNA(lncRNA),它們與各種生理和病理過程有關(guān),例如腫瘤發(fā)生,發(fā)育,印記,細(xì)胞凋亡和細(xì)胞分化。盡管近年來已經(jīng)發(fā)表了數(shù)以千計(jì)的ncRNA研究,但只有一小部分ncRNA得到了很好的功能研究。鑒于在各種物種中發(fā)現(xiàn)了數(shù)千種ncRNA,近年來已經(jīng)開發(fā)了許多數(shù)據(jù)庫來幫助研究人員了解它們的多樣性和功能。包括miRBase,一個(gè)已發(fā)表的miRNA序列的參考數(shù)據(jù)庫和GENCODE,一個(gè)lncRNA的參考數(shù)據(jù)庫。此外,已經(jīng)開發(fā)了一系列數(shù)據(jù)庫來探索ncRNA表達(dá)模式,調(diào)控網(wǎng)絡(luò)和生物學(xué)功能,例如RNAcentral,LNCipedia,LncRNAdb,ChIPBase,NONCODE,LncRNADisease,starBase和circBase。然而,這些數(shù)據(jù)庫側(cè)重于特定的ncRNA家族或ncRNA的特定特征。非常需要整合項(xiàng)目產(chǎn)生的深度測序數(shù)據(jù),以探索各種ncRNA在生理和病理過程中的動(dòng)態(tài)表達(dá),臨床意義和功能。
       中山大學(xué)團(tuán)隊(duì)發(fā)布了深度測序數(shù)據(jù)的表達(dá)圖譜和ncRNA的交互式分析數(shù)據(jù)庫——deepBase v3.0 (http://rna.sysu.edu.cn/deepbase3/index.htmlSPASCER),該數(shù)據(jù)相關(guān)文章發(fā)表在Nucleic Acids Res期刊(IF:19.160)。


        deepBase v3.0首次通過挖掘TCGA的小RNA深度測序數(shù)據(jù)構(gòu)建了tRFs和snoRNA的表達(dá)譜。deepBase v3.0還通過整合來自大型數(shù)據(jù)庫(包括ENCODE、TCGA、ICGC和GTEx項(xiàng)目)的測序數(shù)據(jù),為正常組織和癌癥組織中的lncRNA和其他ncRNA提供了最全面的表達(dá)譜。通過分析來自ERCC的測序數(shù)據(jù),我們解碼了miRNA,lncRNA和circRNA的細(xì)胞外模式。此外,deepBase v3.0 提供了多種新的 Web 模塊和圖形可視化,以促進(jìn)對各種類型ncRNA的復(fù)雜表達(dá)、功能和進(jìn)化的分析和探索。deepBase v3.0整合來自67個(gè)正常組織和約620個(gè)癌癥組織的約80 50個(gè)數(shù)據(jù),提供了最全面的小RNA和lncRNA表達(dá)圖譜。對各種ncRNA的細(xì)胞外模式進(jìn)行了分析,以探索其在發(fā)現(xiàn)無創(chuàng)生物標(biāo)志物中的應(yīng)用。此外,我們通過分析>45 000份癌癥樣本數(shù)據(jù)和相應(yīng)的臨床信息,構(gòu)建了tRNA衍生RNA片段(tRFs)、miRNA、snoRNA和lncRNA的生存圖譜。


基于網(wǎng)絡(luò)的sRNA、lncRNA、circRNA和tRF的探索
       deepBase提供多種類型RNA的全基因組鑒定,從lncRNA到不同類型的小RNA。在瀏覽部分,有四個(gè)網(wǎng)頁供用戶瀏覽帶有注釋和表達(dá)譜的不同種類的RNA。lncRNA、小 RNA 和 circRNA 的瀏覽頁面顯示來自不同實(shí)驗(yàn)的已識別和重新注釋的 RNA,以及它們的詳細(xì)信息,包括基因組位點(diǎn)、長度、類型、總表達(dá)和表達(dá)的樣品數(shù)。用戶可以按“樣品”列對數(shù)據(jù)表進(jìn)行排序,以確定RNA表達(dá)的通用性。一些RNA在所有樣品中廣泛表達(dá),而有些僅在少數(shù)樣品中表達(dá)。通過按“表達(dá)”列對數(shù)據(jù)表進(jìn)行排序,用戶可以獲得RNA的表達(dá)條件。在lncRNA和smallRNA頁面上,我們提供了一個(gè)指向新頁面的出站鏈接,該頁面顯示了不同樣品或組織中的詳細(xì)表達(dá)。用戶只需單擊基因名稱即可獲得詳細(xì)信息。


各種ncRNA的表達(dá)譜
       ncRNA表達(dá)的定量是RNA研究的最重要特征之一,在某些階段,組織或細(xì)胞中的特異性表達(dá)可能意味著ncRNA在生物過程中的功能。表達(dá)部分分為兩部分:正常組織和癌癥。在正常組織部分,deepBase提供了所有mRNA,lncRNA,miRNA,circRNA和小ncRNA的表達(dá)譜。deepBase v3.0 以熱圖的形式顯示 RNA 的標(biāo)準(zhǔn)化表達(dá)值(通過 z 分?jǐn)?shù)或平均值歸一化),讓用戶清楚地了解不同組織或樣品中的相對表達(dá)。用戶可以點(diǎn)擊基因名稱,跳轉(zhuǎn)到詳細(xì)表達(dá)頁面。在癌癥部分,對來自不同癌癥類型的樣本應(yīng)用相同的歸一化,以顯示癌癥之間的表達(dá)差異。TCGA和ICGC數(shù)據(jù)分別顯示。癌癥小RNA頁面數(shù)據(jù)是RNA-seq數(shù)據(jù),而miRNA頁面數(shù)據(jù)是sRNA-seq數(shù)據(jù),兩類數(shù)據(jù)并行變化。在對TCGAsRNA-seq數(shù)據(jù)進(jìn)行重新分析的基礎(chǔ)上,deepBase v3.0還顯示了snoRNA在各種癌癥類型中的表達(dá)譜。
外泌體的表達(dá)譜
       細(xì)胞外RNA(exRNA)是一種存在于各種生物體液中的RNA分子。來自異質(zhì)群體的ExRNA,包括小RNA,circRNA,lncRNA和mRNA。它們以游離形式存在或與蛋白質(zhì)結(jié)合形成復(fù)合物,參與各種細(xì)胞間通訊,并在癌癥和其他疾病中發(fā)揮重要作用。分析了從ERCC數(shù)據(jù)庫下載的2500多個(gè)樣本數(shù)據(jù),以構(gòu)建不同外泌體的表達(dá)圖譜,并提供人外泌體RNA表達(dá)的概述。用戶可以直接了解不同生物流體中的 exRNA 表達(dá)以及 exRNA 的表達(dá)特異性。
預(yù)后分析
       通過RNA-seq和sRNA-seq測序數(shù)據(jù),我們還收集了TCGA和ICGC的deepBase v3.0臨床數(shù)據(jù)。結(jié)合表達(dá)數(shù)據(jù)和臨床數(shù)據(jù),我們將單變量Cox回歸應(yīng)用于所有差異表達(dá)基因(|log FC| ≥ 1,P值<0.05)。deepBase 在數(shù)據(jù)表中顯示所有生存對數(shù)排名 P 值。不顯示未在特定癌癥類型中表達(dá)或與生存無關(guān)的基因。為通過對數(shù)秩P值閾值0.05的生存相關(guān)RNA提供了KM生存曲線圖。
不同種類的ncRNA的交互式分析
       deepBase提供了多種分析界面,供用戶深入了解不同特征中不同種類的RNA?;蛩阉黜撁骘@示了單個(gè)RNA在不同類型癌癥中的詳細(xì)表達(dá)。本頁由四個(gè)部分組成。左側(cè)搜索欄包括輸入框和參考線。在右側(cè)部分中,數(shù)據(jù)表顯示表達(dá)式和相關(guān)信息,箱線圖顯示一種癌癥類型的特定表達(dá)。用戶可以單擊數(shù)據(jù)表中的癌癥名稱進(jìn)行更改。條形圖顯示了癌癥范圍的表達(dá)。該頁面旨在讓用戶直接快速地訪問特定的RNA信息。表達(dá)頁面顯示單一癌癥類型中不同類型RNA的表達(dá)矩陣,用戶可以設(shè)置P值和FDR截止值,獲得自定義數(shù)據(jù)表以供進(jìn)一步檢查。搜索和表達(dá)頁面為用戶提供了從癌癥相關(guān)RNA研究中獲取主要信息的快速簡便方法。