Nat. Methods | TooManyCells識別并可視化單細胞進化枝的關(guān)系

欄目:最新研究動態(tài) 發(fā)布時間:2020-07-08
細胞轉(zhuǎn)錄輸出有助于細胞類型和狀態(tài)的確定。新興技術(shù),如單細胞RNA-seq (scRNA-seq)改善了...

    細胞轉(zhuǎn)錄輸出有助于細胞類型和狀態(tài)的確定。新興技術(shù),如單細胞RNA-seq (scRNA-seq)改善了識別和描述的細胞狀態(tài)異質(zhì)性由不同的基因表達程序和擁有先進我們理解細胞多樣性的功能作用在細胞分化等領(lǐng)域,對刺激的回應(yīng),和失調(diào)疾病。
    許多聚類算法建議對scRNA-seq數(shù)據(jù)進行劃分,以識別具有相關(guān)轉(zhuǎn)錄程序的細胞群,將細胞劃分為已知的細胞類型或狀態(tài),在某些情況下描述新的稀有細胞種群?;趌ouva的聚類方法s1是應(yīng)用最廣泛的scRNA-seq聚類方法之一。這些算法以貪婪的方式迭代地優(yōu)化社區(qū)度量,即Newman-Girvan模塊化,以生成單個的單元劃分。在大多數(shù)scRNA-seq分析工作流程,確定細胞具有相似的轉(zhuǎn)錄組的集群模式然后使用降維可視化技術(shù),如t-distributed隨機鄰居嵌入(t-SNE) 2,在高維基因表達空間隨機減少到項目每個細胞的位置在一個二維曲面。這個工作流程導(dǎo)致識別單個單層的單元分區(qū),這些單元使用缺乏定量的組間和組內(nèi)關(guān)系信息的可視化方法進行解釋。考慮到精確的細胞狀態(tài)定義和國米和intra-relationships是上下文相關(guān)的,可能不適合一個uni-layer分區(qū)的細胞,而是一個層次結(jié)構(gòu)的嵌套細胞狀態(tài),我們介紹了一個范式轉(zhuǎn)變套件工具的分析,解釋和單細胞的可視化數(shù)據(jù)通過啟用同步描述和可視化的多層細胞演化支。
    TooManyCells是一套基于圖形的算法和工具,可在保持和呈現(xiàn)細胞群之間的相互關(guān)系的同時,高效,全局且無偏見地識別和鑒定細胞進化枝。TooManyCells提供了一種新穎的單細胞聚類算法ClusterTree,該算法為單細胞測量分析實現(xiàn)了有效的無矩陣分裂分層光譜聚類。此外,TooManyCells 能夠評估細胞多樣性并估計調(diào)查異質(zhì)種群中特定水平的細胞物種豐富度所需的樣本量。TooManyCells還提供BirchBeer了一個完全可定制的新穎模型,用于以單細胞分辨率可視化分層細胞聚類分析。在渲染聚類樹時,BirchBeer利用著色標簽,縮放分支,模塊化疊加,內(nèi)部節(jié)點標簽,葉節(jié)點摘要等的加權(quán)平均混合,可以對單細胞進化枝進行多層和多方面的探索。為了提供最大的適用性,TooManyCells加載并生成幾種標準文件格式。因此,可以將替代聚類算法與可視化結(jié)合使用,從而在多種方法之間提供協(xié)調(diào),以幫助闡明單個單元格之間的關(guān)系。這些聚類和可視化算法能夠描述依賴于上下文和應(yīng)用程序的細胞集群,并加速探索和量化細胞分支之間的相互關(guān)系。
    近日,來自賓夕法尼亞大學佩雷爾曼醫(yī)學院的病理學和檢驗醫(yī)學系,賓夕法尼亞大學佩雷爾曼醫(yī)學院遺傳學系,美國賓夕法尼亞州佩雷爾曼醫(yī)學院的賓夕法尼亞大學艾布拉姆森家庭癌癥研究所,法尼亞大學賓夕法尼亞大學表生遺傳研究所課題組在
Nat. Methods 發(fā)表題為TooManyCells identifies and visualizes relationships of single-cell clades的研究,報道了一種新軟件——TooManyCells,可以識別并可視化單細胞進化枝的關(guān)系。
    這組工具通過在依賴于上下文和應(yīng)用程序的范圍內(nèi)同時比較單元狀態(tài),從而在分析和解釋單細胞數(shù)據(jù)方面提供了范式轉(zhuǎn)換。這種轉(zhuǎn)變的一個副產(chǎn)品是對稀有種群的即時檢測和可視化,其性能優(yōu)于以前的算法,這是通過將這些工具應(yīng)用于來自各種小鼠器官的現(xiàn)有單細胞RNA-seq數(shù)據(jù)集而得到證明的。
一、TooManyCells 用于單細胞分辨率的聚類和可視化

    例如,通過scRNA-seq測量對遞歸結(jié)構(gòu)進行遞歸劃分可以概括脾臟中的淋巴樣群體,在該群體中,分裂將B與T細胞分開,然后可以將血漿細胞譜系與過渡性B細胞分離,然后分離成漿細胞和漿細胞,直至達到具有不同B細胞受體結(jié)構(gòu)的漿細胞的分離。要確定單元狀態(tài)的連續(xù)體ClusterTree,TooManyCells,從屬于單個組的所有單元格開始,作為聚類樹的根(圖1a和1b)。這些細胞由具有m個細胞和n個基因的m × n矩陣表示。矩陣中的每個條目都是細胞中某個基因的豐度數(shù)據(jù)。因此,ClusterTree生成嵌套單元簇的層次結(jié)構(gòu),其中每個內(nèi)部節(jié)點都是給定規(guī)模的簇,葉節(jié)點是細粒度簇,其中任何附加的二分分割都將與單元的隨機分裂一樣好。
二、ClusterTree:用于scRNA-seq的無矩陣分裂分層光譜聚類算法

    單細胞分辨率的可視化是scRNA-seq數(shù)據(jù)解釋的組成部分。為了適應(yīng)對嵌套細胞簇的層次結(jié)構(gòu)的詢問,TooManyCells它配備了BirchBeer一個完全可定制的新穎軟件,專門為清晰,可解釋地顯示細胞簇的層次結(jié)構(gòu)而開發(fā)(圖2a)。BirchBeer是專為顯示整個樹而設(shè)計的,它具有其他一些功能,可幫助用戶查找相關(guān)種群并促進數(shù)據(jù)探索。BirchBeer可以根據(jù)該子樹中的單元格數(shù)量縮放每個分支,并使用通過該分支連接的單元格標簽顏色的加權(quán)平均混合為每個分支點著色(圖2a)?;焐梢栽诙鄠€范圍內(nèi)增強對重疊或不同種群的識別(圖2b)。葉節(jié)點上的單元組可以使用多種可視化格式。葉節(jié)點可以顯示一個餅狀圖,顯示其細胞組成的分布。為了以單細胞分辨率描述信息,可以在葉節(jié)點處對每個單個細胞進行渲染和顏色編碼,以可視化其他信息,例如細胞的確切數(shù)量,每個細胞上給定基因的表達水平以及其他信息。葉簇(圖2b)。為了幫助解釋和分析復(fù)雜的細胞混合物,birch-tree提供了幾種修剪聚類樹的方法(圖2c-k)。這些方法包括距根的步驟數(shù),最小葉節(jié)點大小以及基于分位數(shù)的修剪解決方案(圖2c)。重要的是,TooManyCells可以在葉節(jié)點群集和群集層次結(jié)構(gòu)中的所有嵌套群集之間進行比較。為了幫助選擇給定的細胞分區(qū),請BirchBeer提供每個內(nèi)部或葉節(jié)點群集標識號的覆蓋圖,可用作重疊TooManyCells表達式分析模塊的輸入,以比較分析不同規(guī)模的群集或進行其他下游分析(圖2d) 。由于分支縮放寬度在美學上可能是主觀的,因此可以對其進行調(diào)整(圖2e與圖2c)或完全禁用(圖2f)。由于候選分割的模塊性證明了該分裂相對于隨機分割模型的重要性,因此BirchBeer可以將模塊顯示為圓周黑暗程度不同的黑圈,以幫助識別彼此非常不同的種群(圖2g)。BirchBeer可以可視化內(nèi)部和葉節(jié)點的多樣性(圖2h)。除了在樹上覆蓋連續(xù)變量之外,還BirchBeer可以覆蓋離散變量。例如,BirchBeer可以覆蓋每個細胞和簇的UMI計數(shù)(圖2i),以及一個或多個基因的表達狀態(tài)以適應(yīng)可視細胞分級分析(圖2j和2k)。
三、TooManyCells 識別純細胞簇

    簇純度的比較分析。(a)所分析的種群由x軸(胸腺,脾臟,骨髓,肢體肌肉,舌頭,心臟,肺,乳腺,膀胱,膀胱)左側(cè)的x軸上的部位(即器官和組織)的數(shù)量表示,腎臟,肝臟}。比較了集群多樣性的分布。從TooManyCells分層群集樹中考慮了全部,64或32個群集(從根開始的所有步驟,從根開始的6個步驟或從根開始的5個步驟)群集。所有算法均使用默認過濾和參數(shù)。較高的多樣性表示較低的準確性。(b)逆加權(quán)分集定義為逆最小-最大歸一化分集和簇大小與單元總數(shù)之比的乘積。值越大表示簇越純凈。(c)與(a)相同,不同之處TooManyCells標準化程序:TooManyCells默認標準化(默認標度)項頻率-逆文檔頻率(tf-idf),上四分位數(shù)標準化(Upper Quartile Scaled),總和基因中位數(shù)計數(shù)標準化(Cell和Gene Scaled),然后進行tf-idf標準化。(d)與(b)相同,不同的TooManyCells歸一化程序相同。
四、TooManyCells 準確描繪出細胞混合物中的稀有種群

    從兩個稀有種群與一個普通細胞種群混合中檢測細胞,以此作為通用聚類算法(a和b)的基準。從左到右的列:用實際類型(即器官)標記的細胞,以及用scRNA-seq聚類算法分配的簇標記的細胞。從上到下的行:Monocle,Phenograph,Seurat和Cellranger t-SNE投影。提出了對a)900個普通(舌)細胞和100個稀有(50個乳腺和50個骨髓)細胞以及b)990個普通和10個稀有細胞(5個乳腺和5個骨髓)的分析。(c)結(jié)果TooManyCells聚類和可視化。左:900(普通)(普通)和100(罕見)。右:990個普通細胞和10個稀有細胞。(d)量化稀有人口基準。對于每次運行,性能代表真正的稀有對(乳腺與乳腺以及骨髓和骨髓在同一簇中)/總稀有對(真正的稀有對和具有骨髓的乳腺)。
五、小鼠脾臟中成漿細胞亞群的鑒定

    (a) TooManyCells用先前識別的細胞類型標記的小鼠脾臟數(shù)據(jù)集的聚類樹(b)來自(a)的具有新識別的b細胞亞型的樹(c)與所有其他細胞相比,來自(b)的成漿細胞節(jié)點的前100個差異表達基因的MyGeneSet基因表達(d) (a)中的細胞使用秀蘭的加工和t-SNE投影,用TooManyCells對樹葉進行聚類,為每片樹葉分配不同的顏色類似的顏色表示樹中的附近位置,例如,粉色和紫色在樹中的位置比粉色和綠色更近(e) (d)中t-SNE投影的坐標,其坐標為(b)中子集的人口成漿細胞是橙色的,分布在整個b細胞群中(f)來自(d)中t-SNE投影的坐標,該投影由修生成的簇標簽著色。
六、SOX
2OT對體內(nèi)BCSC生長和致瘤性的影響
    SOX2OT對體內(nèi)BCSC生長和致瘤性的影響。顯示了從小鼠收集的腫瘤。b測量并分析了sh-SOX2OT和sh-NC治療組的腫瘤重量。c測量并分析了sh-SOX2OT和sh-NC治療組的腫瘤體積曲線。d測量和分析了sh-SOX2OT和sh-NC治療組的無腫瘤比例。敲低SOX2OT在體內(nèi)抑制膀胱癌細胞的生長。e和f敲低SOX2OT在體內(nèi)的BCC中增加了miR-200c的表達,降低了SOX2和SOX2靶基因的表達,并抑制了EMT。G:擊倒SOX2OT降低了SOX2的表達,并且SOX2OT和SOX2在BCC體內(nèi)共定位。h和i擊倒SOX2OT會降低體內(nèi)BCC中SOX2和ki67的表達。j細胞熒光示蹤系統(tǒng)的示意圖。敲除SOX2OT的k和l顯著降低了異種移植物中sh-SOX2OT細胞的比例。數(shù)據(jù)顯示為平均值±SD。* p ?<0.05;** p ?<0.01

七、敲減SOX2OT抑制膀胱癌轉(zhuǎn)移
    SOX2OT對膀胱癌肺轉(zhuǎn)移的影響以及SOX2OT致癌作用的示意圖。a和b sh-SOX2OT組的熒光素酶信號顯著低于sh-NC組的熒光素酶信號。c兩個治療組的小鼠體重之間無顯著差異。d和e與sh-NC組相比,sh-SOX2OT組的肺轉(zhuǎn)移數(shù)目和大小明顯減少。f和h降低SOX2OT的表達會降低肺轉(zhuǎn)移中SOX2的表達。G在sh-SOX2OT組中,E-cadherin的表達明顯高于在sh-NC組中。敲除SOX2OT可降低肺轉(zhuǎn)移中N-鈣黏著蛋白的表達。i SOX2OT在膀胱癌中的致癌作用示意圖