microRNA (miRNA) 是長度為23nt左右的單鏈非編碼RNA,亦是豐富的調(diào)節(jié)性RNA,可作為基因轉(zhuǎn)錄后表達(dá)調(diào)節(jié)劑,主要指導(dǎo)其靶基因轉(zhuǎn)錄物的切割、降解和/或翻譯抑制。為此,對它們在組織和細(xì)胞類型中的豐度進(jìn)行準(zhǔn)確分類是了解生理和病理?xiàng)l件下基因調(diào)控和失調(diào)的重要工具。同樣重要的是,在疾病和健康狀態(tài)之間或在疾病過程中,組織和生物體液中改變的 miRNA 水平可以區(qū)分疾病或與臨床表型和結(jié)果相關(guān)聯(lián),突出特定 miRNA 可能攜帶的診斷、預(yù)后或預(yù)測生物標(biāo)志物能力。有關(guān)miRNA在細(xì)胞類型和組織中的表達(dá)和分布的信息對于理解它們的功能以及它們作為生物標(biāo)志物或治療靶點(diǎn)的轉(zhuǎn)化用途至關(guān)重要。
近日,希臘研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的microRNA組織表達(dá)數(shù)據(jù)庫——DIANA-mitED,該數(shù)據(jù)庫相關(guān)文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為DIANA-miTED: a microRNA tissue expression database。網(wǎng)址為http://www.microrna.gr/mited。
大多數(shù)可用數(shù)據(jù)庫要么包含少量數(shù)據(jù)集,要么僅或幾乎僅關(guān)注 TCGA,這主要是由于實(shí)際原因。TCGA 是一個(gè)相當(dāng)統(tǒng)一的資源,而 GEO/SRA 研究在文庫制備、使用的適配器和樣品質(zhì)量方面極為多樣化。DIANA-mitED 彌補(bǔ)了這一差距,使研究人員能夠研究迄今為止最廣泛的文庫中的 miRNA 表達(dá),以及從單一資源執(zhí)行簡單或復(fù)雜的分析。DIANA-mitED包含SRA和TCGA中的15183個(gè)原始人類小RNA-Seq(sRNA-Seq)數(shù)據(jù)集的分析,涵蓋了總共包含199個(gè)組織、82個(gè)解剖亞位、267個(gè)細(xì)胞系和261種疾病。
為了生成 miTED,我們利用 DIANA-mAP 分析工作流程對從TCGA和 SRA檢索到的>15000個(gè)sRNA-Seq數(shù)據(jù)集進(jìn)行了預(yù)處理和分析。在 miTED 中,用戶可以檢索一個(gè)或多個(gè)miRNA和/或組織/細(xì)胞系的表達(dá)值,識(shí)別最高表達(dá)的 miRNA,或感興趣的miRNA表達(dá)最多的最高組織/細(xì)胞系.
miTED實(shí)現(xiàn)了一個(gè)友好的在線圖形用戶界面,使用戶能夠搜索、瀏覽和元分析這個(gè)廣泛的集合,而無需生物信息學(xué)支持或?qū)I(yè)知識(shí)。DIANA-miTED通過Querying DB頂部菜單提供三個(gè)主要查詢頁面,即Multi-query、Top-miRNAs 和Top-sites。
在Multi-query頁面中,用戶可以查詢、檢索和比較組織或細(xì)胞系中一種或多種miRNA 的表達(dá)。搜索框允許自由文本搜索和選擇特定組織或細(xì)胞系和 miRNA。多查詢表單提供了將搜索限制為特定疾病的機(jī)會(huì),僅包括來自 SRA 或 TCGA 數(shù)據(jù)收集的結(jié)果,根據(jù)健康狀況(即“健康”或“疾病”)檢索數(shù)據(jù)。結(jié)果分為三個(gè)不同的部分。(A) 第一部分專門用于可視化檢索到的結(jié)果。分組箱線圖可以比較特定組織/疾病中的 miRNA 豐度。此外,通過描繪組織-疾病關(guān)系的?;鶊D和性別、采集和健康狀況的餅圖探索樣本分布。(B) 第二部分滿足 miTED 結(jié)果與每個(gè) miRNA 的相關(guān) DIANA 資源(工具和數(shù)據(jù)庫)的互連。(C)在第三部分中,提供了一個(gè)數(shù)據(jù)表,其中包含樣本元數(shù)據(jù)以及用戶請求的miRNA 的表達(dá)。
Top-miRNAs頁面是 miTED 資源中的第二個(gè)查詢頁面。通過此頁面,用戶可以搜索特定組織或細(xì)胞系中表達(dá)最高的 miRNA。顯示的結(jié)果包括以降序顯示所有 miRNA 表達(dá)的數(shù)據(jù)表和描繪所需組織或細(xì)胞系中最高表達(dá) miRNA 的條形圖。
Top-sites頁面專門用于檢索特定 miRNA 最豐富的組織或細(xì)胞系。與Top-miRNAs頁面類似,結(jié)果包括一個(gè)表格,其中包含按降序排列的組織/細(xì)胞系的表達(dá)值,以及一個(gè)描述輸入表達(dá)最多的頂部組織或細(xì)胞系的條形圖。
DIANA-miTED 還通過其Visualizations菜單提供三個(gè)可視化頁面。第一頁,提供了一個(gè)圖網(wǎng)絡(luò),描述了組織或起源器官與組織子區(qū)域之間的關(guān)系。它是一個(gè)交互式圖表,能夠突出顯示和移動(dòng)節(jié)點(diǎn),以探索它們之間的互連程度。“TCGA Projects Exploration”頁面包含用于分別探索 TCGA 數(shù)據(jù)集的組織-疾病和組織-性別關(guān)系的?;鶊D。