癌癥相關(guān)的lncRNA/circRNA的web工具

欄目:最新研究動態(tài) 發(fā)布時間:2021-03-15
癌癥是一個主要的公共衛(wèi)生問題,也是全球發(fā)病和死亡的主要原因。在過去的幾十年里,RNA分子的新細(xì)胞作用被發(fā)現(xiàn)......

癌癥是一個主要的公共衛(wèi)生問題,也是全球發(fā)病和死亡的主要原因。在過去的幾十年里,RNA分子的新細(xì)胞作用被發(fā)現(xiàn),已經(jīng)確定癌癥病理學(xué)中基因表達(dá)的動力學(xué)非常復(fù)雜。長鏈非編碼RNAlncRNA)作為早期篩查、診斷、預(yù)后判斷和分析治療反應(yīng)的癌癥生物標(biāo)志物越來越受到關(guān)注。環(huán)狀RNAcircRNA)是非編碼癌癥基因組的新成員,表現(xiàn)出截然不同的特性和多樣的細(xì)胞功能。人們對人類lncRNAcircRNA越來越感興趣,高通量和單細(xì)胞技術(shù)的可獲得性導(dǎo)致了癌癥相關(guān)lncRNAcircRNA數(shù)量的迅速增加。值得注意的是,癌癥相關(guān)的lncRNAcircRNA可以根據(jù)其調(diào)控機(jī)制、生物學(xué)功能或臨床應(yīng)用分為不同的組。lncRNAcircRNA在涉及增強(qiáng)子、遺傳變異、microRNA相互作用、轉(zhuǎn)錄因子(TF)和甲基化修飾的癌癥相關(guān)調(diào)控機(jī)制中的作用也得到了廣泛的研究。此外,癌癥相關(guān)lncRNAcircRNA的新生物學(xué)功能已經(jīng)出現(xiàn)。近年來,越來越多的證據(jù)表明lncRNAcircRNA在細(xì)胞生長、凋亡、自噬、上皮間質(zhì)轉(zhuǎn)化、免疫和編碼能力中發(fā)揮重要功能。然而,沒有專門的資源用于收集、存儲和分發(fā)這些數(shù)據(jù)。大量的scRNA-seqRNA-seq數(shù)據(jù)為數(shù)據(jù)挖掘和更深入地理解lncRNA功能創(chuàng)造了新的機(jī)會。開發(fā)快速、可定制的lncRNA分析和可視化方法是癌癥研究的關(guān)鍵問題。方便高效的網(wǎng)絡(luò)工具可以填補癌癥相關(guān)lncRNA數(shù)據(jù)與向終端用戶傳遞整合信息之間的空白,從而利用目前的lncRNA數(shù)據(jù)資源來研究人類癌癥。近期,哈爾濱醫(yī)科大學(xué)生物信息科學(xué)與技術(shù)學(xué)院張云鵬博士及其團(tuán)隊將Lnc2Cancer數(shù)據(jù)庫更新為3.0版(http://www.bio-bigdata.net/lnc2cancer或者http://bio-bigdata.hrbmu.edu.cn/lnc2cancer), 提供了實驗支持的lncRNA在人類癌癥中的調(diào)控機(jī)制(miRNA、TF、遺傳變異、甲基化和增強(qiáng)子)、生物學(xué)功能(細(xì)胞生長、凋亡、自噬、EMT、免疫和編碼能力)以及臨床應(yīng)用(轉(zhuǎn)移、復(fù)發(fā)、循環(huán)、耐藥和預(yù)后)的信息,并開發(fā)了包括RNAscRNA-seq表達(dá)數(shù)據(jù)在內(nèi)的兩個交互式網(wǎng)絡(luò)工具平臺,允許使用標(biāo)準(zhǔn)處理流水線探索lncRNA在癌癥中的參與,相關(guān)研究以“Lnc2Cancer 3.0: an updated resource forexperimentally supported lncRNA/circRNA cancer associations and web tools based on RNA-seq and scRNA-seq data”為題發(fā)表在Nucleic Acids Research雜志上,雜志影響因子為11.501。

技術(shù)路線:

 

結(jié)果:

1.      數(shù)據(jù)擴(kuò)展和預(yù)處理

作者在Pubmed數(shù)據(jù)庫中篩選了>8000項研究,2018年至2020年的6500份報告涉及lncRNA,2017年至2020年的1570篇出版物涉及circRNA,并重新篩選了6500項研究(主要是2015年之前發(fā)表的報告),這些研究已被納入Lnc2Cancer 2.0。隨后,提取了實驗支持的lncRNAcircRNA癌癥關(guān)聯(lián)信息,這些關(guān)聯(lián)得到RNA干擾、體外敲低、western blot、實時定量聚合酶鏈反應(yīng)或熒光素酶報告基因檢測等相關(guān)實驗的強(qiáng)烈支持,并提取了一些lncRNA在癌癥中的高質(zhì)量scRNA-seq表達(dá)數(shù)據(jù),包括不同的癌癥亞型、細(xì)胞數(shù)量、lncRNA數(shù)量、細(xì)胞系和組織,同時記錄lncRNAcircRNA和癌癥的詳細(xì)信息。采用國際腫瘤學(xué)疾病分類第3版標(biāo)準(zhǔn)化分類注釋每種癌癥類型。Lnc2Cancer 3.0涉及了對15000篇已發(fā)表論文的系統(tǒng)綜述,包括2775個人類lncRNA220個人類癌癥亞型之間關(guān)聯(lián)的8297個條目,并包含了743個人類circRNA64個人類癌癥亞型之間關(guān)聯(lián)的1049個條目。

2.      Lnc2Cancer 3.0的實用性工具

為了全面表征lncRNAcircRNA在癌癥中的作用,作者手動繪制了它們的調(diào)控機(jī)制、生物學(xué)功能和臨床應(yīng)用,這些信息已經(jīng)通過高質(zhì)量的實驗進(jìn)行驗證,分析了N6-甲基腺苷和肽的保守性,部分涉及了與免疫相關(guān)lncRNAcircRNA的免疫細(xì)胞類型,納入了循環(huán)RNA(主要是外泌體檢測到的lncRNAcircRNA)??偟膩碚f,Lnc2Cancer 3.0提供了包括lncRNAcircRNA在癌癥中的調(diào)控機(jī)制、生物學(xué)功能以及臨床應(yīng)用的系統(tǒng)流水線。在Lnc2Cancer 3.0中,作者設(shè)計了一個單細(xì)胞web工具,根據(jù)提供的單細(xì)胞數(shù)據(jù)集,可以被用來鑒定新的癌癥相關(guān)的lncRNA。9個關(guān)于lncRNA表達(dá)的單細(xì)胞數(shù)據(jù)集,包括20種癌癥類型和22100個細(xì)胞,收集自Gene expression OmnibusGEOhttps://www.ncbi.nlm.nih.gov/geo/)。單細(xì)胞web工具配備了三個關(guān)鍵功能:Cluster函數(shù)允許用戶基于UMAPt-SNE降維方法對單細(xì)胞lncRNA表達(dá)數(shù)據(jù)進(jìn)行聚類分析;Heatmap功能提供了不同簇間差異表達(dá)lncRNA的熱圖;差異表達(dá)分析(DEA)功能使用戶能夠獲得lncRNA的差異表達(dá)信息和小提琴圖;上述所有功能均可使用RSeurat(版本3.1.5)執(zhí)行。作者從The cancer Genome AtlasTCGAhttps://portal.gdc.cancer.gov) 獲得了包含lncRNA表達(dá)信息的RNA-seq數(shù)據(jù)集,建立了RNA-seq工具的9個功能:(1)一般功能允許用戶構(gòu)建涉及癌癥相關(guān)lncRNA的低通量和高通量實驗之間的串?dāng)_,提供了亞細(xì)胞定位(來自lncATLAS)、功能(來自LncBook)、基因本體注釋(來自LncBook)、癌癥和正常組織中的平均表達(dá)的一般信息,以及各種癌癥中特定lncRNA的箱形圖;(2DEA功能使用戶能夠利用不同的自定義統(tǒng)計方法和特定癌癥的閾值獲得差異lncRNA表達(dá)分析和熱圖;(3Boxplot功能生成帶有自定義顏色的箱形圖,用于比較癌癥和正常樣本中特定lncRNA的表達(dá);(4Stage Plot函數(shù)根據(jù)主要和詳細(xì)的病理分期對特定lncRNA生成表達(dá)小提琴圖;(5Survival函數(shù)根據(jù)特定lncRNA的中位和分位數(shù)表達(dá)值進(jìn)行總生存期或無病生存期(也稱為無復(fù)發(fā)生存期)分析;(6Similar功能使用一個輸入的lncRNA和一個選擇的癌癥類型來識別一系列具有相似表達(dá)模式的lncRNA;(7Correlation功能為兩個癌癥相關(guān)的lncRNA提供基于定制方法的lncRNA表達(dá)相關(guān)性分析,包括Pearson、SpearmanKendall;(8Network功能給出miRNA-lncRNAmRNA-lncRNA共表達(dá)網(wǎng)絡(luò)的信息;(9TF基序功能預(yù)測特定lncRNATF基序,提供TF基序序列LOGO圖。

3.      數(shù)據(jù)庫用戶使用界面

Lnc2Cancer 3.0中所有數(shù)據(jù)都使用MySQL5.7.18版本)數(shù)據(jù)服務(wù)器進(jìn)行存儲和管理,web接口是在LinuxApache平臺上用JSP構(gòu)建的。用戶通過以下步驟查詢數(shù)據(jù)庫:(1)在“瀏覽”頁面,用戶可以瀏覽所有實驗支持的lncRNA、circRNA和原發(fā)癌癥組織的關(guān)聯(lián)(圖A)。在以癌癥為中心的部分,有兩種方法搜索數(shù)據(jù)。第一種包括使用人體圖的解剖學(xué)分類,而第二種是癌癥類型列表。在lncRNAcircRNA中心部分,用戶可以瀏覽lncRNAcircRNA的多種調(diào)控機(jī)制、生物學(xué)功能和臨床應(yīng)用。(2)“搜索”頁面提供“一般搜索”和“高級搜索”選項(圖B-D)。利用一般的搜索,用戶可以通過lncRNA和癌癥名稱搜索數(shù)據(jù)庫。在高級搜索中,用戶可以通過限制基于失調(diào)表達(dá)模式、樣本、RNA類型、調(diào)節(jié)機(jī)制、生物學(xué)功能和臨床應(yīng)用的輸出來輸入更詳細(xì)和系統(tǒng)的信息。

3)從“單細(xì)胞Web工具”頁面,用戶可以利用交互式和可定制的功能,包括訪問一般信息,基于49個單細(xì)胞數(shù)據(jù)集對lncRNA進(jìn)行聚類、熱圖生成和差異表達(dá)分析(圖A)。(4)從“RNA-seq網(wǎng)絡(luò)工具”頁面,用戶可以進(jìn)行復(fù)雜的功能,獲得癌癥相關(guān)lncRNA的詳細(xì)數(shù)據(jù),包括一般信息、差異表達(dá)分析、盒子圖、小提琴樣圖、生存分析、相似 lncRNAs識別、關(guān)聯(lián)分析、網(wǎng)絡(luò)圖構(gòu)建和TF預(yù)測(圖B)。(5Lnc2Cancer 3.0是一個完全開放的資源,用戶可以從“下載”頁面獲得所有數(shù)據(jù)。(6)從“幫助”頁面,用戶可以訪問關(guān)于如何使用Lnc2Cancer 3.0的詳細(xì)教程。

 

參考文獻(xiàn):

Yue Gao, Shipeng Shang, Shuang Guo, et al. Lnc2Cancer 3.0: an updated resource for

experimentally supported lncRNA/circRNA cancer associations and web tools based on RNA-seq and scRNA-seq data. Nucleic Acids Research. 2020.