類風(fēng)濕性關(guān)節(jié)炎(RA)是一種典型的自身免疫性疾病,影響全球約0.24%至1%的人口。RA患者的炎癥反應(yīng)會(huì)導(dǎo)致關(guān)節(jié)疼痛,腫脹,僵硬和功能喪失,如果不及時(shí)治療,可能導(dǎo)致嚴(yán)重殘疾。因此,RA給患者帶來(lái)嚴(yán)重不便,并給社會(huì)帶來(lái)巨大負(fù)擔(dān)。隨著測(cè)序技術(shù)的發(fā)展,RA的海量數(shù)據(jù)層出不窮,涉及轉(zhuǎn)錄組、表觀基因組、基因組、蛋白質(zhì)組等。這些數(shù)據(jù)可以評(píng)估當(dāng)前數(shù)據(jù)分析方法的可重復(fù)性,并為解決各種與RA相關(guān)的生物學(xué)問(wèn)題提供實(shí)質(zhì)性幫助,包括識(shí)別生物標(biāo)志物和探索發(fā)病機(jī)制。
最近,哈爾濱醫(yī)科大學(xué)生物信息科學(xué)與技術(shù)學(xué)院團(tuán)隊(duì)發(fā)布了一個(gè)綜合性的RA生物信息數(shù)據(jù)庫(kù)——RABC(http://www.onethird-lab.com/RABC/),該數(shù)據(jù)相關(guān)文章發(fā)表在Nucleic Acids Res期刊(IF:19.160)。該數(shù)據(jù)庫(kù)對(duì)分散的RA數(shù)據(jù)進(jìn)行收集和分類,使用統(tǒng)一的標(biāo)準(zhǔn)化管道處理多組學(xué)數(shù)據(jù),并對(duì)用戶提供數(shù)據(jù)可視化。
RABC數(shù)據(jù)庫(kù)收集了175個(gè)多組學(xué)數(shù)據(jù)集,其中140個(gè)轉(zhuǎn)錄組、22表觀基因組、8個(gè)基因組和5個(gè)蛋白質(zhì)組結(jié)果,涵蓋約90萬(wàn)個(gè)樣本。在RA相關(guān)的生物標(biāo)志物和生物學(xué)功能中,分析標(biāo)準(zhǔn)化預(yù)處理的多組學(xué)數(shù)據(jù),獲得175209個(gè)DEG、105DEM、184464個(gè)DMG、1764個(gè)KEGG途徑、30491個(gè)GO術(shù)語(yǔ)、74334個(gè)風(fēng)險(xiǎn)SNPs、和105個(gè)m6A SNPs。
RABC數(shù)據(jù)庫(kù)首頁(yè)提供四個(gè)選項(xiàng)包括瀏覽、搜索、下載和可視化。用戶可以瀏覽模塊快速瀏覽感興趣的數(shù)據(jù)。首先,在多組學(xué)數(shù)據(jù)瀏覽界面中,用戶可以查看數(shù)據(jù)的描述信息。每個(gè)數(shù)據(jù)集的詳細(xì)信息接口不僅提供更詳細(xì)的數(shù)據(jù)描述,還提供原始數(shù)據(jù)、預(yù)處理矩陣數(shù)據(jù)和分析結(jié)果。瀏覽模塊還支持查看差異分析的結(jié)果和基因表達(dá)數(shù)據(jù)的基因表達(dá)火山圖。其次,在RA相關(guān)生物標(biāo)志物和生物學(xué)功能頁(yè)面上,用戶可以快速瀏覽DEG,DMG,DEM,GO術(shù)語(yǔ),KEGG途徑,風(fēng)險(xiǎn)SNP,風(fēng)險(xiǎn)eQTL,風(fēng)險(xiǎn)m6A-SNP和風(fēng)險(xiǎn)mQTL。RA相關(guān)先驗(yàn)知識(shí)(補(bǔ)充圖S15和S16)和RA相關(guān)文獻(xiàn)的相關(guān)信息也可以在RABC瀏覽界面中瀏覽和搜索。
搜索界面支持用戶通過(guò)多種條件查詢RABC的內(nèi)容,包括數(shù)據(jù)集ID、數(shù)據(jù)類型、基因名稱、PMID等。用戶可以直接從下載模塊下載生物標(biāo)志物和生物學(xué)功能文件以及先驗(yàn)知識(shí)。
可視化模塊支持繪制差異表達(dá)分析的火山圖、基因表達(dá)的箱線圖、兩個(gè)基因之間相關(guān)性的散點(diǎn)圖、條形圖和基因表達(dá)譜分析數(shù)據(jù)集的功能富集分析氣泡圖。這些可視化功能只需要用戶選擇數(shù)據(jù)集并輸入指定的閾值或參數(shù),就可以繪制出相應(yīng)的圖形。這些圖表也可以支持下載。