CancerSCEM:人類癌癥的單細(xì)胞數(shù)據(jù)庫(kù)

欄目:最新研究動(dòng)態(tài) 發(fā)布時(shí)間:2022-04-19
該數(shù)據(jù)庫(kù)收集了公共 scRNA-seq 數(shù)據(jù)集,涉及來(lái)自 20 種人類癌癥的 208 個(gè)樣本的 638 341 個(gè)高質(zhì)量單細(xì)胞......


隨著單細(xì)胞 RNA 測(cè)序技術(shù) (scRNA-seq) 被廣泛應(yīng)用于回答發(fā)育生物學(xué)、神經(jīng)科學(xué)、腫瘤學(xué)和免疫學(xué)中的許多基本問(wèn)題。scRNA-seq對(duì)人類癌癥的研究不斷增多,各種癌癥中的細(xì)胞異質(zhì)性、免疫浸潤(rùn)和發(fā)病機(jī)制已陸續(xù)被揭示。scRNA-seq 成為研究腫瘤微環(huán)境、異質(zhì)性、發(fā)病機(jī)制、轉(zhuǎn)移和侵襲以及治療和診斷多種腫瘤不可或缺的手段。在過(guò)去十年中,大規(guī)模癌癥 scRNA-seq 數(shù)據(jù)集呈指數(shù)級(jí)增長(zhǎng),迫切需要整合和處理各種癌癥類型的腫瘤微環(huán)境的基本研究。當(dāng)前的腫瘤單細(xì)胞測(cè)序數(shù)據(jù)庫(kù)的整合、準(zhǔn)確的細(xì)胞類型識(shí)別和全面的在線分析平臺(tái)在某種程度上仍然存在不足,給人類癌癥研究留下了巨大的挑戰(zhàn)。

最近中國(guó)科學(xué)院團(tuán)隊(duì)構(gòu)建了一個(gè)腫瘤單細(xì)胞測(cè)序數(shù)據(jù)庫(kù):CancerSCEM(https ://ngdc.cncb.ac.cn/cancerscem),該數(shù)據(jù)庫(kù)相關(guān)文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為CancerSCEM: a database of single-cell expression map across various human cancers。該數(shù)據(jù)庫(kù)收集了公共 scRNA-seq 數(shù)據(jù)集,涉及來(lái)自 20 種人類癌癥的 208 個(gè)樣本的 638 341 個(gè)高質(zhì)量單細(xì)胞。使用內(nèi)部管道進(jìn)行 TME 分析和功能基因注釋的多尺度數(shù)據(jù)分析,并在 CancerSCEM 中配備了一個(gè)全面的在線分析平臺(tái)。



以單細(xì)胞分辨率處理了 208 個(gè)癌癥樣本的多尺度數(shù)據(jù)分析,用戶可以瀏覽、搜索、在線分析和下載所有感興趣的元數(shù)據(jù)和分析結(jié)果。Project Browse頁(yè)面上的概覽和交互式表格展示了所有收集的癌癥 scRNA-seq 項(xiàng)目,信息范圍從新分配的唯一項(xiàng)目 ID、癌癥類型、樣本 ID、樣本詳細(xì)信息、細(xì)胞計(jì)數(shù)到。Sample Details和Analysis列還提供了指向腫瘤樣本詳細(xì)信息的超鏈接和每個(gè)數(shù)據(jù)集的綜合分析結(jié)果。



為了更好地訪問(wèn)感興趣的數(shù)據(jù)集或基因,CancerSCEM 提供了幾種查詢方法:(i)快速搜索框和關(guān)鍵字,都可以通過(guò)指定癌癥類型、基因或數(shù)據(jù)協(xié)議進(jìn)行實(shí)時(shí)查詢;(ii) 搜索頁(yè)面上的高級(jí)搜索模塊:在項(xiàng)目方面,用戶可以指定項(xiàng)目/樣本ID或登錄號(hào),或選擇特定的癌癥類型; 在基因方面,通過(guò)搜索基因符號(hào)或基因 ID,用戶可以快速查看單細(xì)胞和批量 RNA水平的基因摘要和表達(dá)分布。



   基因分析模塊。它包含四個(gè)功能: (i) 樣本中的基因表達(dá) (GE)——特定癌癥單細(xì)胞樣本進(jìn)行全表達(dá)譜分析;(ii) 亞型中的基因表達(dá)——樣本中不同細(xì)胞類型或亞型的基因表達(dá);(iii) GE相關(guān)性——特定樣本中任意兩個(gè)基因之間的 pearson 相關(guān)性計(jì)算;(iv) GE比較——不同 scRNA-seq 或 TCGA bulk RNA-seq 數(shù)據(jù)集的基因表達(dá)比較。