整合scRNA-seq和ATAC-seq數(shù)據(jù)分析人類發(fā)育過程中造血功能的調(diào)控

欄目:最新研究動(dòng)態(tài) 發(fā)布時(shí)間:2021-05-24
劍橋大學(xué)血液學(xué)系A(chǔ)na Cvejic教授團(tuán)隊(duì)?wèi)?yīng)用scRNA-seq和scATAC-seq技術(shù)對(duì)來自胚胎肝臟和骨髓的8,000多個(gè)免疫表型HSPCs進(jìn)行綜合分析,探......

2021年3月,劍橋大學(xué)血液學(xué)系A(chǔ)na Cvejic教授團(tuán)隊(duì)?wèi)?yīng)用scRNA-seq和scATAC-seq技術(shù)對(duì)來自胚胎肝臟和骨髓的8,000多個(gè)免疫表型HSPCs進(jìn)行綜合分析,探索人類發(fā)育過程中造血功能的調(diào)節(jié)機(jī)制。該項(xiàng)工作以“Integrative single-cell RNA-seq and ATAC-seq analysis of human developmental hematopoiesis”為題發(fā)表在Cell Stem Cell上。

在胚胎發(fā)育過程中,造血干細(xì)胞(HSCs)需要快速分化為成熟的血細(xì)胞。我們目前對(duì)胎兒造血干細(xì)胞和祖細(xì)胞(HSPCs)的認(rèn)識(shí)主要是通過小鼠和體外模型系統(tǒng)取得的。已有研究表明,胎兒造血過程包括發(fā)育過程中不同器官上罕見造血干細(xì)胞的分化、遷移和分化的幾個(gè)獨(dú)立波。在人類中,最終的造血功能開始于懷孕27天后,造血干細(xì)胞出現(xiàn)在造血集群的背主動(dòng)脈內(nèi)。這些明確的造血干細(xì)胞在妊娠后4周(pcw)首先在胎兒肝臟定植,并在那里大量擴(kuò)張。在10.5 pcw時(shí),造血部位再次轉(zhuǎn)移到骨腔(即骨髓[BM]),成人造血在此處永久建立。人們認(rèn)為,第一批在骨髓中播種的造血干細(xì)胞在其增殖和分化特性發(fā)生戲劇性變化之前,會(huì)繼續(xù)快速增加數(shù)量,以適應(yīng)高產(chǎn)量分化子代的需要。

歷史上,造血系統(tǒng)的分化過程被描述為一系列中間步驟,由細(xì)胞表面標(biāo)記物(即分化簇[CD])定義。在這個(gè)模型中,造血干細(xì)胞通常表現(xiàn)為造血樹,造血干細(xì)胞產(chǎn)生了越來越多的譜系限制性細(xì)胞類型,最終導(dǎo)致成熟的血細(xì)胞。這種模式在過去的5年里發(fā)生了改變,一些研究報(bào)告了數(shù)千個(gè)單個(gè)造血細(xì)胞的轉(zhuǎn)錄組,這些細(xì)胞被細(xì)胞表面標(biāo)記物隔離,在小鼠模型和成人中。這些報(bào)告表明,以前被認(rèn)為是同質(zhì)的祖先種群,實(shí)際上在轉(zhuǎn)錄水平上是非常異構(gòu)的。

造血干細(xì)胞早期命運(yùn)決定的機(jī)制在很大程度上尚不清楚。據(jù)推測(cè),譜系特異性轉(zhuǎn)錄因子(TFs)在噪聲閾值以上的隨機(jī)表達(dá)可以鎖定一個(gè)細(xì)胞進(jìn)入一個(gè)獨(dú)特的細(xì)胞命運(yùn)。與此相一致的是,在多能造血細(xì)胞中觀察到與拮抗譜系相關(guān)的基因的共表達(dá),包括關(guān)鍵的TFs,這表明在多能細(xì)胞室中存在一些細(xì)胞亞群,這些亞群允許細(xì)胞在譜系承諾之前的命運(yùn)相反,這一現(xiàn)象被稱為啟動(dòng)。最近,人類hspc的單細(xì)胞RNA測(cè)序(scRNA-seq)引入了一個(gè)不同的啟動(dòng)概念。對(duì)成人骨髓和胎兒肝臟造血的研究已經(jīng)確定了造血干細(xì)胞和多能祖細(xì)胞(MPPs)的亞群,這些亞群具有協(xié)調(diào)表達(dá)的標(biāo)記基因,特異于不同的單胎分化程序,并沿著所有分化分支逐漸增加。有一些跡象表明,星狀細(xì)胞間室的譜系啟動(dòng)可能不僅發(fā)生在轉(zhuǎn)錄水平,也發(fā)生在表觀遺傳水平。來自成人骨髓表型hspc的轉(zhuǎn)座酶可及染色質(zhì)測(cè)序(scATAC-seq)的單細(xì)胞分析數(shù)據(jù)顯示,表型MPPs在染色質(zhì)可及性方面存在差異。

技術(shù)路線:

 

 

一、人胎肝和骨髓造血室的單細(xì)胞轉(zhuǎn)錄組

 

 



為獲取胚胎發(fā)育期間造血細(xì)胞的全部譜系,研究者從17 – 22 PCW的胚胎肝臟、股骨和髖骨中對(duì)表型確定的血液群體進(jìn)行單細(xì)胞分類,并對(duì)15個(gè)胚胎的單個(gè)細(xì)胞進(jìn)行scRNA-seq檢測(cè)(圖1)。基于差異表達(dá)分析和標(biāo)準(zhǔn)化表達(dá)顯著性排名前20的標(biāo)記基因,標(biāo)注了23個(gè)不同的群體,發(fā)現(xiàn)在肝臟或股骨中檢測(cè)不到任何T細(xì)胞或先天淋巴細(xì)胞(ILCs),單細(xì)胞分析顯示在所有免疫表型定義的干細(xì)胞和祖細(xì)胞群體中存在大量的轉(zhuǎn)錄異質(zhì)性,其中一些表型祖細(xì)胞群體(如HSCs,MPPs,CMPs,GMPs,MEPs和CLPs)由10多個(gè)不同的轉(zhuǎn)錄表型定義群體組成,這進(jìn)一步證明人類臍帶血的祖細(xì)胞室具有高度的異質(zhì)性。此外,該研究分析表明當(dāng)前使用的細(xì)胞表面標(biāo)記物不能很好地預(yù)測(cè)人類胚胎造血祖細(xì)胞的轉(zhuǎn)錄狀態(tài)

使用SmartSeq2協(xié)議對(duì)15個(gè)胎兒的單個(gè)細(xì)胞進(jìn)行scRNA-seq處理(圖1 a)。

基于差異表達(dá)(DE)分析和按標(biāo)準(zhǔn)化表達(dá)顯著性排序的前20個(gè)標(biāo)記基因。紅細(xì)胞(表達(dá)HBG1、HBA1、GYPA和ALAS2)、mk(表達(dá)FLI1、ITGA2B和GP9)、單核細(xì)胞祖細(xì)胞和單核細(xì)胞(表達(dá)CD14、MPEG1和CD33)、CD4+單核細(xì)胞、肥大細(xì)胞(表達(dá)CD63、GATA2和HDC)、漿細(xì)胞樣樹突狀細(xì)胞(pDCs;表達(dá)IL3RA, IRF8, MPEG1和JCHAIN)和另一簇高循環(huán)pDCs(表達(dá)pDC和增殖標(biāo)記物;例如,MKI67)和粒細(xì)胞1、2和3(表達(dá)AZU1、MPO和PRTN3)(圖1B)

單細(xì)胞分析顯示,在所有免疫表型定義的干細(xì)胞和祖細(xì)胞群體中存在顯著的轉(zhuǎn)錄異質(zhì)性,一些表型祖細(xì)胞群體(如造血干細(xì)胞、MPPs、cmp、gmp、MEPs和CLPs)由超過10個(gè)不同的轉(zhuǎn)錄定義群體組成(圖1 c).

注釋了23個(gè)不同群體(圖1 d).


二、胎兒造血過程中分化軌跡的推斷




接下來,研究者使用力導(dǎo)向圖繪制算法推斷了人類胚胎發(fā)育期間造血細(xì)胞的分化軌跡。結(jié)果顯示HSCs/MPPs位于軌跡頂端,并且在HSCs/MPPs下游,研究者鑒定了三個(gè)高度增殖的寡能祖細(xì)胞群,即MEMPs(紅系細(xì)胞、MKs和肥大細(xì)胞);GPs(粒細(xì)胞);LMPs(淋巴樣細(xì)胞、單核細(xì)胞和樹突狀細(xì)胞)(圖2A和2B)。并使用Scanpy的paga_path函數(shù)顯示了沿三條分化途徑(MEMPs、GPs和LMPs)的譜系特異性基因動(dòng)態(tài)表達(dá)(圖2C)。MEMPs將hsc / mpp與MKs、紅細(xì)胞和肥大細(xì)胞連接起來。與此一致的是,HSC/MPP向MEMPs轉(zhuǎn)化的差異調(diào)控基因包括MK/紅系/肥大細(xì)胞譜系特異性基因,如GATA1、ITGA2B、PLEK、KLF1、HDC和MS4A3(圖2C)。然后利用SCENIC通過分化軌跡識(shí)別出HSPCs和成熟血細(xì)胞中162個(gè)調(diào)節(jié)子,其中HLF和HOXA9是HSCs/MPPs中的主要調(diào)節(jié)子,且HSC/MPPs簇在轉(zhuǎn)錄上為高度未成熟的細(xì)胞群(圖2D)鑒定了一個(gè)增殖的MEMPs- cycle群體,92%的MEMPs處于G2M/S期,而65%的MEMPs處于G2M/S期(圖2E)。此外,研究者對(duì)HSCs/MPPs- cycle和HSCs/MPPs進(jìn)行DE分析,結(jié)果顯示HSCs/MPPs- cycle增加了糖酵解相關(guān)基因的表達(dá),除了HSCs/MPPS-Cycle簇中存在轉(zhuǎn)錄啟動(dòng)外,HSCs/MPPs和HSCs/MPPs-Cycle之間沒有其它轉(zhuǎn)錄差異。


三、沿著推斷分化軌跡的Motif可及性動(dòng)態(tài)

 


 

由于技術(shù)限制,scRNA-seq難以檢測(cè)低豐度轉(zhuǎn)錄本(如轉(zhuǎn)錄因子TFs),而通過染色質(zhì)的可及性可推斷出這些TFs的活性,因此整合scRNA-seq和scATAC-seq方法具有重要意義。研究者利用scATAC-seq檢測(cè)了人類胚胎Lin- CD34+ CD38-細(xì)胞的單細(xì)胞染色質(zhì)可及性,分別對(duì)18、20和21PCW胚胎的肝臟和股骨中的4,001個(gè)細(xì)胞進(jìn)行了測(cè)序,基于SNN算法,共得到7個(gè)不同的可明顯分離的集群 (Figure 3A)。scRNA-seq數(shù)據(jù)中檢測(cè)了所選標(biāo)記基因的可及性,與干細(xì)胞相關(guān)的標(biāo)記基因(如MLLT3、PROM1、FLI1和GATA2)的可及性較高,而與不同譜系相關(guān)的基因(如MPO、ALAS2、MPEG1和CD19)的可及性較低,這與分選細(xì)胞的未分化特性一致(圖3B)。生成的軌跡顯示出兩個(gè)分支,每個(gè)分支的染色質(zhì)可及性和分化有明顯的趨勢(shì)(圖3D和3E)。我們觀察到簇1、簇2和簇4的可達(dá)性最高,并逐漸向兩個(gè)分枝的頂端遞減。接下來,研究者使用chromVAR計(jì)算不同簇中可及性TF序列基序,沿著軌跡推斷確定的兩個(gè)分支,可觀察到譜系特異性造血TF基序的可及性的動(dòng)態(tài)變化(如GATA1、TAL1、KLF1、HTF4、ID4、IRF8和TFE2),其中GATA1是紅系細(xì)胞、巨核細(xì)胞和肥大細(xì)胞分化的重要調(diào)節(jié)因子,且僅在scRNA-seq數(shù)據(jù)集中的MEMP簇中表達(dá);TAL1有兩種不同的結(jié)合基序,在胎兒造血過程中,這兩種基序在不同的造血祖細(xì)胞中均具有活性;CEBPD和IRF8的活性對(duì)髓系和樹突狀細(xì)胞的分化至關(guān)重要;ID4和HTF4參與淋巴系的建立;這與scRNA-seq數(shù)據(jù)中的觀察結(jié)果一致(圖3F 3H)。

 

四、scRNA-seq和scATAC-seq數(shù)據(jù)整合




目前尚無人類胚胎HSPCs的染色質(zhì)可及性圖譜,研究者基于基因體可及性繪制細(xì)胞圖譜來整合scRNA-seq和scATAC-seq數(shù)據(jù)。首先使用6種豐富的細(xì)胞類型對(duì)scRNA-seq實(shí)驗(yàn)中篩選出的CD34+ CD38- 細(xì)胞進(jìn)行分類,結(jié)果顯示scATAC-seq數(shù)據(jù)集中指定細(xì)胞類型的頻率與scRNA-seq數(shù)據(jù)中的頻率高度一致,這表明染色質(zhì)可及性和轉(zhuǎn)錄組具有相關(guān)性。然而,不同類型的細(xì)胞在整個(gè)軌跡上有相當(dāng)大的混合,如HSCs/MPPs-Cycle廣泛分布在七個(gè)集群中,這表明在HSCs/MPP群體中存在廣泛的染色質(zhì)啟動(dòng),從而導(dǎo)致了異質(zhì)性。之后研究者比較了7個(gè)集群中HSCs /MPPs中選定的譜系特異性TF基序的可及性,結(jié)果顯示在轉(zhuǎn)錄同源的HSCs/MPPs集群中,一些先于基因表達(dá)的TFs的活性存在顯著差異。 最后,研究者進(jìn)一步探索分化過程中染色質(zhì)可及性和基因表達(dá)之間的“時(shí)滯”,結(jié)果顯示在HSCs/MPS中,GATA1-調(diào)節(jié)子靶基因的啟動(dòng)子在任何明顯基因表達(dá)之前均是開放的,這證實(shí)HSCs/MPP中染色質(zhì)的可及性早于轉(zhuǎn)錄變化。


五、gata1調(diào)控靶基因的染色質(zhì)可及性及表達(dá)動(dòng)態(tài)




檢測(cè)了pySCENIC鑒定的最頂層gata1調(diào)控靶基因的scRNA-seq和scATAC-seq數(shù)據(jù)(根據(jù)AUCell評(píng)分排序)(圖5)。

我們觀察了兩個(gè)基因啟動(dòng)子(距轉(zhuǎn)錄起始位點(diǎn)3kb [TSS])和遠(yuǎn)端調(diào)控區(qū)域(距TSS 50 kb)的可及性,以及沿MEMP分化軌跡所選靶基因的表達(dá)水平(圖5A)。我們觀察到,在造血干細(xì)胞/ mpp中,gata1調(diào)控靶基因的啟動(dòng)子在任何明顯的基因表達(dá)之前通常是開放的(圖5A)。因此,與我們之前的觀察一致,造血干細(xì)胞/ mpp的染色質(zhì)可及性發(fā)生在僅存在于分化程度更高的細(xì)胞中的轉(zhuǎn)錄變化之前。有趣的是,與第1類(hsc /MPPs)相比,第6類(MEMPs)中GATA1靶基因的啟動(dòng)子可及性總體較低(圖5B、5D和5E),與拮抗基因(即針對(duì)不同譜系的基因)的啟動(dòng)子共可及性較低相吻合(圖5F)。相比之下,簇6中遠(yuǎn)端調(diào)控元件/增強(qiáng)子的可及性高于簇1(圖5C)。這可能表明gata調(diào)控基因可能在啟動(dòng)子上啟動(dòng),而增強(qiáng)子則提供細(xì)胞類型特異性的表達(dá)。

 

六、改進(jìn)分選策略以分離胚胎HSCs/MPPs


研究者基于細(xì)胞表面標(biāo)記設(shè)計(jì)了一種針對(duì)HSCs / MPP的新的熒光激活細(xì)胞分選策略(簡(jiǎn)稱CD-REF),使用CD-REF分選板對(duì)股骨BM細(xì)胞進(jìn)行分選,結(jié)果顯示標(biāo)記為HSCs / MPP和HSCs / MPPs-Cycle簇的CD-REF細(xì)胞約占88%。為了評(píng)估CD-REF細(xì)胞譜系輸出的分化潛力和穩(wěn)健性,研究人員在小鼠MS5飼養(yǎng)層或更具生理相關(guān)性的人類胎兒間充質(zhì)干細(xì)胞(fMSCs)上對(duì)三個(gè)胎兒的單個(gè)細(xì)胞進(jìn)行了分選,結(jié)果顯示MS5和fMSCs上分別存在著四系、三系、雙系、單系和未分化的譜系集落。接下來,又對(duì)單個(gè)CD-REF和免疫表型HSCs進(jìn)行了分類,結(jié)果顯示CD-REF在胎兒肝臟和骨髓中富集了多譜系輸出的細(xì)胞群,且CD-REF細(xì)胞具有與表型HSCs相當(dāng)?shù)亩酀撃苄院妥V系輸出能力,這與前述分化軌跡探究一致,再次驗(yàn)證CD-REF代表了高富集的HSC/MPPs群體。


七、股骨和肝臟細(xì)胞在不同細(xì)胞類型之間的統(tǒng)計(jì)學(xué)差異


HSC / MPP簇中的細(xì)胞來源于肝臟,股骨和髖部,這為評(píng)估起源于胚胎肝臟或骨髓的HSC/MPP群體中潛在的定性和定量差異提供了機(jī)會(huì)。研究者首先對(duì)處于不同細(xì)胞周期狀態(tài)的肝臟和股骨細(xì)胞的數(shù)量進(jìn)行了Fisher精確檢驗(yàn)。結(jié)果顯示,在股骨和肝臟中,絕大多數(shù)CD-REF細(xì)胞處于G0/G1期,而肝臟中處于S-G2-M期的細(xì)胞數(shù)量幾乎是股骨的兩倍。KS和MWW檢驗(yàn)顯示,與肝臟相比,股骨中HSCs/MPPS中基因表達(dá)數(shù)量也比較少,但股骨中HSCs/MPPs顯著上調(diào)了與核小體組裝、染色質(zhì)組裝和DNA組裝有關(guān)的基因,而肝臟中HSC/MPPs顯著上調(diào)了與肌動(dòng)蛋細(xì)胞骨架重塑、細(xì)胞粘附和遷移有關(guān)的基因。