17分生信——circRNA單細(xì)胞圖譜首發(fā)

欄目:最新研究動態(tài) 發(fā)布時間:2022-09-27
本文表征了circRNAs在人類和小鼠組織單細(xì)胞水平的表達(dá)圖譜,將我們對circRNAs表達(dá)的了解擴(kuò)展到單細(xì)胞水平......


以往的研究表明,circRNAs在不同的組織和生物中具有高度特異性的表達(dá),但circRNAs的細(xì)胞水平結(jié)構(gòu)尚未完全確定。本文表征了circRNAs在人類和小鼠組織單細(xì)胞水平的表達(dá)圖譜,將我們對circRNAs表達(dá)的了解擴(kuò)展到單細(xì)胞水平,并構(gòu)建了circRNAs的單細(xì)胞數(shù)據(jù)集的在線網(wǎng)站,為以這種前所未有的分辨率探索circRNAs提供了有用的資源。本文于2022年6月發(fā)表在《Nature Communications》IF:17.694期刊上。

 

技術(shù)路線



主要研究結(jié)果:

1、大規(guī)模單細(xì)胞研究顯示circRNA具有高度細(xì)胞特異性

為了闡明circRNA的細(xì)胞構(gòu)架,作者收集了171項(xiàng)涉及58種不同人類和小鼠組織或細(xì)胞類型的公開全長scRNA-seq數(shù)據(jù)集(圖1a)??紤]到大多數(shù)3’RNA測序方法無法檢測到缺乏poly(A)尾的circRNA,所以作者只收集全長測序技術(shù)的研究,然后使用嵌入多個最先進(jìn)工具的綜合管道計(jì)算基因和 circRNA 的單細(xì)胞水平表達(dá)值(圖1b)??傊?,40,604個人類和131,533個小鼠單細(xì)胞通過質(zhì)量控制,并檢測這些細(xì)胞中的circRNA進(jìn)行下游分析。為了評估circRNA檢測的可靠性,將所有的單細(xì)胞數(shù)據(jù)中的circRNA比對至circAtlas v2.0或其它數(shù)據(jù)庫中。如圖1c所示,在scRNA-seq隊(duì)列中共檢測到354,390個circRNA,其中76,824(21.67%)個circRNA可以在所有三個circRNA組中同時檢測到??傊?,32.43%的circRNA存在于這些批量RNA-seq數(shù)據(jù)庫中,而其余67.57%的circRNA只在單細(xì)胞數(shù)據(jù)中檢測到。值得注意的是,在circAtlas中唯一檢測到的circRNAs比在circAtlas和單細(xì)胞數(shù)據(jù)集中共享的表達(dá)水平更低且長度更短(圖1d,e)。這表明scRNA-seq可以有效捕獲大多數(shù)高豐度circRNA。此外,通過MCS評分,這些共享的circRNA顯示出很高的組織特異性,48.9%的共享的circRNA在兩個以上物種中保守(MCS評分≥2),表明鑒定的circRNA具有很高的可靠性(圖1f)。

對于所有在scRNA-seq數(shù)據(jù)集中檢測到的circRNAs,其表達(dá)細(xì)胞數(shù)量與其平均表達(dá)水平之間正相關(guān),一些高表circRNA如mmu-Cdr1_0001、mmu-Tulp4_0006和hsa-RIMS1_0021也在之前的研究中被報(bào)道(圖1g)。再次證實(shí)了數(shù)據(jù)分析的可靠性。同時,在 scRNA-seq 數(shù)據(jù)中唯一檢測到的 circRNA 通常在較少數(shù)量的細(xì)胞中表達(dá)(圖 1h),但與其他數(shù)據(jù)庫驗(yàn)證的 circRNA 相比具有相似的表達(dá)水平(圖1i),提示這些circRNA具有高度的細(xì)胞特異性。特別是在人類和小鼠樣本中,約 90% 的 scRNA-seq 特異性 circRNA 在不到 10 個細(xì)胞中表達(dá),這使得使用bulk RNA-seq 技術(shù)幾乎無法檢測到(圖1j)。綜上所述,這些結(jié)果表明全長 scRNA-seq在揭示具有高細(xì)胞特異性的 circRNA 方面具有高靈敏度和可靠性,而由于在傳統(tǒng)bulk RNA-seq 樣本中表達(dá)細(xì)胞的比例相對較低,其中大部分可能被錯誤地忽略。此外,這些 scRNA-seq 特異性 circRNA 還在具有超過 10 個反向剪接讀數(shù)的細(xì)胞中廣泛表達(dá)(圖1k)。


1從單細(xì)胞測序數(shù)據(jù)集這發(fā)現(xiàn)circRNAs

 

2、腦circRNA在抑制性和興奮性神經(jīng)元中顯示細(xì)胞特異性表達(dá)模式

為了研究 circRNA 的細(xì)胞景觀,首先收集并分析了 18 項(xiàng)對小鼠大腦樣本的研究,這也是收集的數(shù)據(jù)集中最大的隊(duì)列,并分析和整合人類的腦細(xì)胞。共將41,911個細(xì)胞分為14個簇,檢測到64,311個circRNA(圖2a)。如圖2b所示,大多數(shù)細(xì)胞聚集成GABA能神經(jīng)元(GABA)、谷氨酸能神經(jīng)元(GLUT)和小膠質(zhì)細(xì)胞(MG)。 盡管這些簇中的細(xì)胞數(shù)量相似,但 GABA 能神經(jīng)元和谷氨酸能神經(jīng)元中circRNA尤其地豐富。作者對12個細(xì)胞特異性circRNA進(jìn)行了PCR驗(yàn)證,并采用廣泛使用的Tau方法檢測了circRNA的細(xì)胞特異性,并將基因分為circRNA宿主基因和其他基因進(jìn)行進(jìn)一步的比較,如圖2c所示,circRNA的特異性明顯高于兩組基因。同時,circRNA宿主基因的特異性也顯著低于其他非宿主基因,因?yàn)閏ircRNA往往來源于具有較高表達(dá)水平的基因,這導(dǎo)致細(xì)胞特異性相對較低。例如,在神經(jīng)元細(xì)胞中特異性檢測到來自小鼠 Taf1 基因的 12 個 circRNA 中的 10 個,并且在 GABA 能和谷氨酸能神經(jīng)元中也觀察到了不同的表達(dá)模式(圖 2d)。

為了進(jìn)一步驗(yàn)證circRNA在人腦中的表達(dá)譜,收集4個人腦scRNA-seq數(shù)據(jù)集,如圖 2e 所示,具有較高表達(dá)水平的 circRNA 在兩個物種中更可能是保守的,而物種特異性 circRNA往往具有較低的表達(dá)水平。與之前的結(jié)果一致,這些保守的circRNA中的大多數(shù)在 GABA 能和谷氨酸能神經(jīng)元中高度富集,并且一部分circRNA也表現(xiàn)出在所有類型的細(xì)胞中普遍表達(dá)(圖 2f)。circRNA的表達(dá)水平與RNA結(jié)合蛋白(RBP)的活性密切相關(guān),作者計(jì)算了所有circRNA與所有細(xì)胞中circRNA宿主基因或RBP之間的Spearman相關(guān)系數(shù)并進(jìn)行比較,結(jié)果發(fā)現(xiàn)circRNA與RBP之間的相關(guān)性顯著高于宿主基因(圖2g),尤其是PTBP1和PTBP2和circRNA高度相關(guān)。如預(yù)期的,在大多數(shù)細(xì)胞類型中,circRNA的表達(dá)水平,如circCdr1和circular-to-linear比率與PTBP1的下調(diào)及其補(bǔ)償因子PTBP2的上調(diào)高度相關(guān)(圖2h)。總之,這些結(jié)果證明了circRNA的高度細(xì)胞特異性表達(dá)景觀,并進(jìn)一步揭示了circRNA生物發(fā)生與RBP活性之間的復(fù)雜關(guān)聯(lián),特別是在這些抑制性和興奮性神經(jīng)元中。


2 抑制性和興奮性神經(jīng)元中具有豐富的circRNA

 

3、早期胚胎發(fā)育過程中母體和合子circRNA的動態(tài)表達(dá)

單細(xì)胞RNA測序使胚胎發(fā)育階段的基因異質(zhì)性研究成為可能,但這一過程中circRNA表達(dá)模式的變化仍需進(jìn)一步探索。作者分析了11項(xiàng)人類和小鼠胚胎研究,其中包含來自16個從卵母細(xì)胞到早期芽的不同階段的樣本(圖 3a)。在人和小鼠胚胎中分別檢測到41,041和24,818個circRNA。為了揭示胚胎發(fā)育過程中circRNA之間的動態(tài)變化,計(jì)算了不同階段circRNA表達(dá)水平之間的Pearson相關(guān)性。如圖3b所示,在受精后的前3-4天觀察到細(xì)胞之間的高度相關(guān)性,這與circRNA在早期胚胎發(fā)育過程中的母體效應(yīng)一致。此外,從囊胚到植入胚胎的細(xì)胞表現(xiàn)出不同的 circRNA 表達(dá)模式,表明合子 circRNA 在囊胚期后表達(dá)。此外,在人類和小鼠樣本上均觀察到在發(fā)育階段檢測到的circRNA的多樣性和連接率都有所增加,這也驗(yàn)證了這些合子circRNAs在胚胎發(fā)育過程中的積累(圖3c)??紤]到在人類數(shù)據(jù)集中只收集到相對較少的細(xì)胞,下游分析只包括小鼠胚胎。為了消除隨機(jī)性效應(yīng),可以在兩個以上階段檢測到circRNA的表達(dá)模式繪制在圖3d中。如預(yù)期的,觀察到母體 circRNAs 逐漸降解,大多數(shù)其他 circRNAs 表現(xiàn)出階段特異性表達(dá)譜。為進(jìn)一步研究母體向合子轉(zhuǎn)變過程中circRNA的動態(tài)表達(dá)變化,將樣本分為四個時間點(diǎn),包括全能卵裂球(TB)、第一譜系(TE/ICM)、第二譜系(EPI/PE)和植入胚胎,反映發(fā)育過程中全能性和譜系分離的變化。隨后,將基因和circRNA聚類為5組。如圖3e所示,簇1和簇2中的circRNA和基因在TB早期高表達(dá),然后隨著胚胎發(fā)育不斷下降。相反,第3到第5簇 circRNA代表受精后特異性表達(dá)的合子circRNA。

為確定合子circRNA的激活是否是宿主基因表達(dá)的副產(chǎn)物,檢查了circRNA與其宿主基因之間的對應(yīng)關(guān)系。大部分合子circRNA(簇3中67.50%、簇4中69.2%和簇5中83.9%)是由母體表達(dá)的基因產(chǎn)生的,這表明這些合子circRNA在胚胎發(fā)育過程中具有獨(dú)特的生物發(fā)生機(jī)制(圖3h)。為進(jìn)一步研究合子基因和circRNA激活過程之間的差異,計(jì)算每個簇中基因和circRNA的reads組成。僅包括在一個以上階段中同時表達(dá)的circRNA。與發(fā)育階段合子基因讀數(shù)的溫和增加相反,在圖3g中觀察到8個細(xì)胞階段后合子 circRNA的急劇爆發(fā),為母體circRNA降解和合子circRNA激活提供了令人信服的證據(jù)。例如,作者展示了兩個合子和三個母體 circRNA 的不同表達(dá)模式。如圖3h所示,源自Erdr1的mmu-Erdr1_0001和mmu-Erdr1_0002是一種調(diào)節(jié)細(xì)胞存活和細(xì)胞凋亡的分泌因子,在植入的胚胎中高度表達(dá)。因此,這些circRNA的高度特異性表達(dá)表明,與線性基因相比,circRNA 經(jīng)歷了更顯著的母體到合子的轉(zhuǎn)變過程。最后,對母本和合子circRNA的親本基因進(jìn)行基因本體富集分析。如圖3i所示,基于微管的運(yùn)動和纖毛組裝在母體circRNA中富集,而剪接相關(guān)過程在合子circRNA中富集,這與發(fā)育中胚胎的極性建立和胚胎基因組激活一致??偟膩碚f,這些結(jié)果證明了circRNA 的高度細(xì)胞特異性表達(dá)譜和合子circRNA在胚胎發(fā)育中的大量激活,這也表明了這些母體和合子circRNA 在此過程中的重要作用。


3 母體向合子轉(zhuǎn)變過程中合子circRNA 激活的解析

 

4、在人類乳腺癌轉(zhuǎn)移中的腫瘤間和腫瘤內(nèi)circRNA異質(zhì)性

為分析乳腺癌腫瘤發(fā)生過程中的單細(xì)胞水平的circRNA,對26個原發(fā)性和轉(zhuǎn)移性腫瘤 scRNA-seq 樣本進(jìn)行分析,如圖4a所示。然后,進(jìn)一步研究正常人群和癌人群circRNA表達(dá)水平的差異。如圖4b所示,超過49.88%的正常人群和67.28%的癌人群被鑒定為上皮細(xì)胞。與之前的研究一致,非整倍體重排的腫瘤細(xì)胞在轉(zhuǎn)移瘤和原發(fā)瘤中circRNAs的表達(dá)均顯著降低(圖4c),在大多數(shù)已鑒定的細(xì)胞類型中也觀察到同樣的情況(圖4d)。來自預(yù)后較好的低級別(luminal A、luminal B和HER2陰性)腫瘤的正常細(xì)胞和癌細(xì)胞往往比高級別三陰性乳腺癌(TNBC)細(xì)胞表達(dá)更多的circRNA,這表明積累較少TNBC細(xì)胞中的circRNAs 具有更快的進(jìn)展速度。

鑒于該隊(duì)列中上皮細(xì)胞的主要數(shù)量以及EMT在腫瘤侵襲和轉(zhuǎn)移中的重要作用,所以作者進(jìn)一步研究了EMT期間的circRNA。首先,將所有上皮細(xì)胞聚集在一起,并進(jìn)行軌跡推斷分析以揭示動態(tài)細(xì)胞的分化過程(圖4f)。為了更好地探索單個細(xì)胞的過渡狀態(tài),計(jì)算了EMT分?jǐn)?shù)。如圖4g所示,細(xì)胞軌跡結(jié)果通常相應(yīng)地?cái)M合EMT分?jǐn)?shù)的增加。GO富集分析上皮細(xì)胞增殖過程在EMT評分較低的簇中富集,而細(xì)胞遷移和間充質(zhì)相關(guān)過程在EMT水平較高的簇中富集。此外,計(jì)算每個簇中癌細(xì)胞的比例,并相應(yīng)地觀察到腫瘤細(xì)胞百分比與EMT評分之間的正相關(guān)(圖4h)。最后計(jì)算每個簇中circRNA的表達(dá)水平,隨著從上皮細(xì)胞(簇 1-2)到中間EMT狀態(tài)(簇 3-5)的轉(zhuǎn)變,circRNA 的平均表達(dá)水平相應(yīng)增加(圖 4i),這與EMT期間circRNA的全局激活一致。總之,作者分析了EMT期間circRNA表達(dá)的詳細(xì)概況,揭示了乳腺癌患者原發(fā)性和轉(zhuǎn)移性樣本之間circRNA 的復(fù)雜腫瘤間和腫瘤內(nèi)異質(zhì)性。

 

4 乳腺癌患者正常細(xì)胞和腫瘤細(xì)胞之間circRNA的異質(zhì)性

 

5、細(xì)胞特異性circRNA為最佳細(xì)胞類型的識別提供了的見解

基于circRNAs的高度細(xì)胞特異性,作者推測了利用circRNAs作為生物標(biāo)志物來提高細(xì)胞類型的可能性。為了構(gòu)建高質(zhì)量的circRNA特征矩陣,研究了來自17個不同人類和小鼠組織的scRNA-seq隊(duì)列以及同源的癌癥樣本(圖5a)。在不同細(xì)胞類型和組織類型中所有的circRNA根據(jù)其表達(dá)模式被分為5類(圖5b)。隨后,作者總結(jié)了人和小鼠樣本中circRNAs的細(xì)胞類型特異性,共享的circRNAs的關(guān)系如圖5c所示。與之前研究中報(bào)道的基因表達(dá)圖譜相似,circRNAs 在不同功能的細(xì)胞類型之間也表現(xiàn)出不同的表達(dá)簇。此外,還檢測到人和小鼠細(xì)胞之間的幾種直系同源細(xì)胞類型特異性circRNA,這意味著這些circRNA亞群具有保守的生物學(xué)功能。

為了驗(yàn)證circRNA作為細(xì)胞類型生物標(biāo)志物的潛力,計(jì)算了在不同細(xì)胞類型中表達(dá)的circRNA與bulk RNA-seq數(shù)據(jù)集之間的重疊。如圖5d所示,在bulk RNA-seq 數(shù)據(jù)中檢測到的circRNA與細(xì)胞表達(dá)的circRNA具有高度特異性的重疊。例如,在GABAergic神經(jīng)元中檢測到的39.36%的circRNA也可以在正常腦樣本中同時檢測到。為了比較circRNA和基因作為細(xì)胞生物標(biāo)志物在分析腫瘤浸潤細(xì)胞中的潛能,只有在人類腫瘤樣本中注釋到的細(xì)胞類型被用于下游分析。之后,計(jì)算了所有表達(dá)的circRNA、來自公共數(shù)據(jù)庫的標(biāo)志基因和1000個隨機(jī)選擇基因的細(xì)胞類型特異性。值得注意的是,circRNAs的細(xì)胞類型特異性顯著高于標(biāo)記基因和隨機(jī)對照基因,這進(jìn)一步表明circRNAs作為細(xì)胞類型生物標(biāo)志物的能力(圖5e)。然后,使用CIBERSORT68計(jì)算癌癥相關(guān)的bulk RNA-seq數(shù)據(jù)集中腫瘤浸潤免疫細(xì)胞的組成,分別基于LM22基因組的標(biāo)記基因和細(xì)胞類型特異性circRNA的表達(dá)(圖5f)?;赾ircRNA和基因的反卷積結(jié)果都被整合到 scRNA-seq 隊(duì)列中鑒定的10種免疫細(xì)胞類型中。隨后利用對數(shù)尺度均方根誤差(RMSE)評估CIBERSORT 提供的細(xì)胞特異性反卷積的結(jié)果,它代表原始標(biāo)記基因表達(dá)值和推算標(biāo)記基因表達(dá)值之間的偏差。如圖5g所示,使用circRNA的反卷積結(jié)果具有顯著更低的RMSE值,這表明circRNA估計(jì)細(xì)胞組成的效果更準(zhǔn)確。這些結(jié)果證明了circRNA在探索腫瘤浸潤性免疫細(xì)胞異質(zhì)性方面作為更好的細(xì)胞類型生物標(biāo)志物的適用性,也表明了這些circRNA在某些細(xì)胞類型中的重要生物學(xué)作用。


5 探索細(xì)胞類型特異性circRNA作為細(xì)胞成分去褶積的生物標(biāo)志物

 

作者將circRNA的細(xì)胞結(jié)構(gòu)和免疫細(xì)胞中的circRNA特征矩陣集成到稱為 circRNA單細(xì)胞門戶(circSC)的網(wǎng)絡(luò)服務(wù)器中。circSC提供全面的circRNA信息,包括細(xì)胞表達(dá)譜、差異表達(dá)結(jié)果以及在大量人類和小鼠細(xì)胞中鑒定的 circRNA 目錄(圖 6)。circSC已作為單獨(dú)的模塊集成到circAtlas中(http://circatlas.biols.ac.cn/),為circRNA的單細(xì)胞和bulk RNA-seq表達(dá)模式提供方便的瀏覽和搜索功能。作者認(rèn)為該數(shù)據(jù)庫可以作為探索circRNA在胚胎發(fā)育、組織分化和癌癥生物發(fā)生過程中動態(tài)變化的重要資源,并為circRNA群落提供一個獨(dú)特而有用的平臺。


6 circSC在線網(wǎng)站的建設(shè)與功能

 

參考文獻(xiàn):

Wu Wanying., Zhang Jinyang., Cao Xiaofei., Cai Zhengyi., Zhao Fangqing.(2022). Exploring the cellular landscape of circular RNAs using full-length single-cell RNA sequencing. Nat Commun, 13(1), 3242. doi:10.1038/s41467-022-30963-8