量化老年率對于評估與年齡相關(guān)的衰老和死亡率很重要。最近生成了一個七位超級百歲老人(SCs)的血液單細(xì)胞RNA測序數(shù)據(jù)集。在這里,作者生成一個參考28個樣本的年齡隊列,以計算單細(xì)胞水平的老化時鐘,并確定SCs的生物年齡。作者的時鐘模型將SCs的血液生物學(xué)年齡定在80.43歲到102.67歲之間。與模型預(yù)期的衰老軌跡相比,SCs表現(xiàn)為原始CD8+T細(xì)胞增加,細(xì)胞毒性CD8+T細(xì)胞減少,記憶CD4+T細(xì)胞和巨核細(xì)胞減少。作為單細(xì)胞水平上最顯著的分子標(biāo)志,SCs含有更多的高核糖體水平的細(xì)胞和細(xì)胞類型,根據(jù)貝葉斯網(wǎng)絡(luò)推斷,這與SCs的低炎癥狀態(tài)和緩慢衰老有關(guān)。通過抑制單核細(xì)胞中的核糖體活性或翻譯過程,驗證了單細(xì)胞衰老時鐘揭示的翻譯與炎癥平衡的關(guān)系。
該研究于2023年6月發(fā)表在《Science advances》,IF:14.957。
技術(shù)路線
結(jié)果
1、scRNA-seq揭示了衰老隊列中的細(xì)胞類型組成
為了構(gòu)建基于單細(xì)胞轉(zhuǎn)錄組的衰老速率預(yù)測模型,作者從28歲到77歲的17個個體(其中6個男性和11個女性,年齡分布相似)收集了PBMCs(外周血單核細(xì)胞),作者將其稱為上海東方醫(yī)院自然衰老隊列(簡稱SE隊列),并使用10X Genomics scRNAseq對其進(jìn)行測序。對于每個個體,平均測序和分析了8545個細(xì)胞,每個細(xì)胞平均有110,364個reads(圖1A)。作者將這些數(shù)據(jù)與已發(fā)表的PBMC scRNAseq數(shù)據(jù)集一起進(jìn)行進(jìn)一步分析。這些數(shù)據(jù)集包括兩個中國隊列,中國年輕隊列(CYCT)和武漢隊列(WHCT),以及兩個日本隊列,日本老年隊列(JOCT)和超百歲人士隊列(SCs)。每個隊列包含五個個體。由于質(zhì)量不佳(線粒體基因表達(dá)超過10%或檢測到的基因數(shù)小于200),作者移除了25,111個細(xì)胞,總共保留了131,972個單細(xì)胞的SE數(shù)據(jù)集,以及23,796個細(xì)胞的CYCT數(shù)據(jù)集,45,923個細(xì)胞的WHCT數(shù)據(jù)集,19,252個細(xì)胞的JOCT數(shù)據(jù)集和38,417個細(xì)胞的SC數(shù)據(jù)集。然后,作者消除了SE數(shù)據(jù)集和其他獨(dú)立隊列之間的批次效應(yīng),并根據(jù)經(jīng)典細(xì)胞系標(biāo)記物和簇特異性標(biāo)記基因的表達(dá),識別了紅細(xì)胞(RBCs)、巨核細(xì)胞(Mega)和六個主要的免疫細(xì)胞系譜,包括CD4+ T細(xì)胞(TC)、CD8+ T細(xì)胞、自然殺傷細(xì)胞(NK)、單核細(xì)胞(MC)和樹突狀細(xì)胞(DC),并通過UMAP進(jìn)行可視化(圖1B)。
2、免疫細(xì)胞亞型重新聚類進(jìn)行細(xì)分
為了分離免疫細(xì)胞的亞型,作者分別對NK和TC系譜的細(xì)胞、BC系譜的細(xì)胞以及MC和DC系譜的細(xì)胞進(jìn)行了重新聚類。利用每個簇中最顯著上調(diào)的基因,作者總共確定了29個細(xì)胞亞型(圖1B)。這些細(xì)胞亞型隨后被用于下游分析。
圖 1. 衰老過程中人血外周血單核細(xì)胞 (PBMC) 的單細(xì)胞 RNA 測序 (scRNA-seq) 圖譜
3、基于細(xì)胞類型比例的時鐘模型顯示,SCs比實際年齡年輕得多
隨著年齡的增長,各種細(xì)胞類型的比例發(fā)生變化(圖2A)。因此,作者測試使用scRNA-seq數(shù)據(jù)中細(xì)胞類型比例來構(gòu)建一個"時鐘"來預(yù)測年齡。作者首先訓(xùn)練了一個偏最小二乘回歸(PLSR)線性模型,并使用留一法交叉驗證(LOOCV)來評估模型的準(zhǔn)確性。作者計算了變量在投影中的重要性(VIP)來對每個變量對PLSR模型的整體貢獻(xiàn)進(jìn)行排序,VIP得分>1的變量被認(rèn)為是高解釋變量。這些變量包括NK-GZMH、CD8-CTL、CD8-Naive、CD4-Tm、CD4-Naive、Naive-B、NK-FCER1G、CD14-MC和Memory-B-CRIP1(圖2B)。為了擴(kuò)展訓(xùn)練數(shù)據(jù)的年齡范圍,作者使用TOSICA,進(jìn)一步映射了由廣東醫(yī)科大學(xué)產(chǎn)生的包含非常老(72至100歲)樣本(GM)的公開PBMC數(shù)據(jù)集的細(xì)胞類型,并訓(xùn)練了一個PLSR模型。作者發(fā)現(xiàn)它們在細(xì)胞類型組成或scRNA-seq時鐘預(yù)測的cAgeDiff中并沒有顯著差異。因此,作者將這兩組樣本都包含在擴(kuò)展的訓(xùn)練樣本中?;谶@個擴(kuò)展數(shù)據(jù)集(SE + GM),作者發(fā)現(xiàn)僅基于前7個細(xì)胞類型的三個成分的PLSR模型產(chǎn)生了一個預(yù)測年齡與實際年齡之間相關(guān)系數(shù)(PCC)為0.88,平均絕對誤差(MAD)為8.36的模型(圖2C)。作者還使用細(xì)胞類型比例來訓(xùn)練一個彈性網(wǎng)絡(luò)(EN)回歸線性模型,并使用權(quán)重來對每個變量對EN模型的整體貢獻(xiàn)進(jìn)行排序?;谇?個細(xì)胞類型的EN模型具有與PLSR模型類似的準(zhǔn)確預(yù)測能力,在SE + GM隊列中預(yù)測年齡與實際年齡之間的PCC和MAD分別為0.89和7.86,而PLSR模型的準(zhǔn)確性在訓(xùn)練和獨(dú)立隊列之間更為相似,表明稍微具有更好的泛化能力。PLSR模型和EN模型之間前7個細(xì)胞類型有5個共同的,暗示了它們在通過血液細(xì)胞類型組成進(jìn)行年齡預(yù)測中的重要性。
為了進(jìn)一步驗證作者的模型,作者將其應(yīng)用于三個獨(dú)立健康隊列的血液scRNA-seq數(shù)據(jù)上。其中包括五個CYCT個體(年齡范圍為29至58歲)、五個WHCT個體(年齡范圍為37至71歲)和五個JOCT個體(年齡范圍為50至80歲,年齡按十年為單位精確,因此根據(jù)定義,預(yù)期的誤差超過5年)。在這三個隊列中,作者的七種細(xì)胞類型的PLSR模型在按年齡排序三個隊列中的MAD分別為10.06、10.91和10.16,PCC分別為0.43、0.69和0.28。當(dāng)繪制預(yù)測年齡與實際年齡之間的差異(AgeDiff)時,注意到在PLSR和EN模型中老年人中存在輕微的系統(tǒng)性低估(negative AgeDiff),而在年輕人中存在高估(positive AgeDiff)。因此,作者使用Loess模型進(jìn)行了系統(tǒng)性偏差的校正,得到了校正后的AgeDiff(cAgeDiff)。在這種校正后,獨(dú)立對照隊列中與實際年齡的MADs為7.95、8.19和8.62,PCC為0.64、0.85和0.57。值得注意的是,年齡校正不會改變模型與實際年齡的MAD,但會增強(qiáng)PCC。由于作者的單細(xì)胞衰老時鐘與年齡呈線性關(guān)系,作者希望它具有線性可擴(kuò)展性,可以外推到訓(xùn)練數(shù)據(jù)中未包含的年齡譜的任何一端。根據(jù)作者的時鐘模型預(yù)測,比最小的訓(xùn)練樣本小28歲以上,TOSICA映射的臍帶血樣本(Cord)的年齡為-10.10至-5.42歲(圖2D)。而在年齡范圍的另一端,比最年長的訓(xùn)練樣本年大20歲的SCs被預(yù)測為80.43至102.67歲,平均比他們的實際年齡年輕18.64歲。經(jīng)過年齡校正的細(xì)胞類型EN模型將所有SCs預(yù)測為低于110歲,平均年齡為95.23歲,將臍帶血(Cord)預(yù)測為7.12至12.68歲。
為了進(jìn)一步測試時鐘性能,將年齡時鐘應(yīng)用于其他獨(dú)立的疾病數(shù)據(jù)集,包括COVID-19數(shù)據(jù)集和系統(tǒng)性紅斑狼瘡(SLE)數(shù)據(jù)集?;诩?xì)胞類型組成的PLSR模型顯示,處于疾病狀態(tài)的個體的平均生物學(xué)年齡高于年齡匹配的對照組,并且隨著疾病嚴(yán)重程度的增加而增加(圖2,E至G)。也許由于樣本規(guī)模較小,只有嚴(yán)重癥狀的COVID-19患者明顯年齡較大(圖2E;t檢驗,P = 0.040),而SLE癥狀得到控制和病情加重的患者年齡較明顯大于對照組(圖2G;t檢驗,P = 8.77 × 10?4和4.20 × 10?3)。由EN模型預(yù)測的cAgeDiff顯示出疾病與對照組之間一致顯著的增加。這些結(jié)果表明,基于細(xì)胞類型組成的PLSR和EN時鐘模型都能夠識別這些疾病患者免疫相關(guān)生物年齡的增加。
與模型預(yù)測的SCs的“緩慢老化”一致(圖2D),在PLSR和EN模型中使用的七個細(xì)胞類型中,兩個CD8+T細(xì)胞亞群之間存在高度顯著的負(fù)相關(guān),即CD8+ CTL和CD8+ 初始 T細(xì)胞,在SE + GM和SC隊列中,它們分別隨年齡顯著增加和減少,但SCs在很大程度上與70至100歲的SE + GMs個體重疊(圖2H)。這表明,在血液細(xì)胞群體水平上,CD8+ 初始T細(xì)胞向CD8+ CTL的極化是衰老的標(biāo)志。
圖 2. 基于單細(xì)胞 RNA 測序 (scRNA-seq) 的單細(xì)胞成分衰老時鐘和超級百歲老人 (SCs) 的年齡延遲。
4、SCs中與年齡相關(guān)的細(xì)胞成分變化被推遲
作者利用模型預(yù)測與SCs實際狀態(tài)之間的細(xì)胞和分子偏差,來解析其極端長壽相關(guān)的特征(圖3A)。作者通過PLSR時鐘模型反向計算了110歲時的細(xì)胞類型組成。另外,基于PLSR和EN時鐘模型中的前7個細(xì)胞類型(圖2E),作者使用線性回歸模型(LR)定義了與年齡顯著正相關(guān)或負(fù)相關(guān)的細(xì)胞類型(具有RCC與年齡斜率,P < 0.05)。然后,根據(jù)PLSR模型或LR模型計算了110歲時的預(yù)期細(xì)胞比例,如果它們與SCs中的實際比例相比顯著偏高或偏低(z分?jǐn)?shù),P < 0.05),則將這些細(xì)胞類型視為“SC延遲衰老細(xì)胞類型”或“SC延遲年齡下降細(xì)胞類型”(圖3A)。作者發(fā)現(xiàn),與PLSR模型相比,SCs在CD8+ 初始T細(xì)胞、初始B細(xì)胞、記憶B細(xì)胞和NK-GZMK方面顯示出明顯的延遲性年齡相關(guān)性下降(z分?jǐn)?shù),P < 0.05),在CD4+ Tm方面顯示出較小的延遲衰老相關(guān)增加(z分?jǐn)?shù),P < 0.1),在CD8+ 初始T細(xì)胞方面顯示出延遲衰老相關(guān)減少,并在CD4+ Tm和初始B細(xì)胞方面顯示出延遲衰老相關(guān)增加,與LR模型相比。當(dāng)繪制年齡下調(diào)的CD8-初始細(xì)胞和年齡上調(diào)的CD4 Tm細(xì)胞的比例隨年齡變化時,在28到100歲的28個樣本中,SCs與線性趨勢線呈現(xiàn)明顯的延遲偏差。
圖 3. 超級百歲老人 (SCs) 中與衰老相關(guān)的細(xì)胞類型比例和基因表達(dá)變化延遲。
5、SCs中與年齡相關(guān)的單細(xì)胞基因表達(dá)變化延遲
作者使用每個個體所有細(xì)胞的基因表達(dá)之和來訓(xùn)練PLSR模型,作為偽批量轉(zhuǎn)錄組時鐘模型,該模型對28個訓(xùn)練樣本的預(yù)測與實際年齡的MAD為5.04,PCC為0.97(圖3B),并將SCs的平均年齡預(yù)測為82.49歲。作者還使用每個細(xì)胞類型每個個體所有細(xì)胞基因表達(dá)的總和,分別訓(xùn)練了各細(xì)胞類型的偽批量轉(zhuǎn)錄組時鐘模型,MAD在4.80年(ABC細(xì)胞)到9.60年(漿細(xì)胞)之間(圖3C)。與基于細(xì)胞類型比例的時鐘模型相比,這些時鐘模型更加顯著地將SCs的中位轉(zhuǎn)錄組年齡預(yù)測為51.62歲到63.19歲(年齡校正前),年齡校正后為65.01歲到75.83歲(圖3C)。接著,基于這些PLSR時鐘模型,或者根據(jù)貢獻(xiàn)度VIP > 1的基因(表S1)定義為與年齡相關(guān)的基因,使用LR模型在每個細(xì)胞類型中預(yù)測它們在110歲時的表達(dá)水平,然后類似于上面描述的細(xì)胞類型分析,定義了“SC延遲年齡增加基因”(與年齡上調(diào),并且在SCs中延遲)和“SC延遲年齡下調(diào)基因”(與年齡下調(diào),并且在SCs中延遲)(圖3A)。使用LR模型,該模型不顯示對年齡的系統(tǒng)性偏差,作者發(fā)現(xiàn)2749個年齡增加基因和495個年齡下調(diào)基因,并且1023個年齡增加基因和149個年齡下調(diào)基因在SCs中有顯著的延遲表達(dá)。轉(zhuǎn)錄因子(TF)靶標(biāo)富集分析顯示,年齡增加和年齡下調(diào)基因都富集了FOXR2、ZNF318、PSMB5、PER1、ZZZ3和NERF的靶。其中,F(xiàn)OXR2、ZNF318、PSMB5和ZZZ3的靶標(biāo)在SC延遲年齡下調(diào)基因中富集,核因子κB(NFκB)的靶標(biāo)在SC延遲年齡增加基因中富集。KEGG通路富集分析顯示,年齡增加基因富集了NFκB/TNF/TLR/NOD/FoxO信號通路、病毒感染、凋亡、T細(xì)胞受體信號通路、細(xì)胞因子和PD-1通路,其中,NFκB/TNF/TLR/NOD/FoxO信號通路、病毒感染、凋亡、細(xì)胞因子和絲裂原活化蛋白激酶(MAPK)通路在SCs中有顯著的延遲(圖3D),而年齡下調(diào)基因主要富集于核糖體基因,這些基因在SCs的大多數(shù)細(xì)胞類型中顯著延遲表達(dá)(圖3E)。
與PLSR模型預(yù)期值相比,SCs中有111個顯著延遲表達(dá)的年齡上調(diào)基因,與MAPK信號通路、雷帕霉素(mTOR)信號通路、NFκB信號通路和病毒感染有關(guān)。另外,有1261個年齡下調(diào)基因在SCs中顯著延遲表達(dá)。再次,大部分細(xì)胞類型中富集了與核糖體和翻譯相關(guān)的基因。而在其他隊列中,SEs中鑒定出的年齡下調(diào)核糖體基因也隨著年齡的增加而減少。
6、SCs中炎癥細(xì)胞與細(xì)胞間的相互作用受到抑制
通過使用細(xì)胞間通訊數(shù)據(jù)庫,作者計算了每對細(xì)胞類型之間的配體-受體對數(shù)量,利用CellphoneDB進(jìn)行分析。作者發(fā)現(xiàn),在不同的細(xì)胞類型中,許多與衰老相關(guān)的受體-配體對在衰老過程中上調(diào)(PCC,P < 0.05)。這些受體-配體對主要與炎癥、細(xì)胞因子和抗原呈遞相關(guān)(圖3F)。類似于延遲上調(diào)和下調(diào)的細(xì)胞類型和基因,作者定義了在SCs中延遲上調(diào)和下調(diào)的配體-受體對。與大多數(shù)細(xì)胞類型相比,與年齡相關(guān)的下調(diào)的aMb2整合素信號配體-受體對在SCs中普遍延遲,而與炎癥相關(guān)的上調(diào)的TNF信號配體-受體對也被延遲,特別是在pDC中(圖3G)。
7、核糖體/翻譯在單細(xì)胞水平上對抗炎癥
根據(jù)上述結(jié)果,作者想知道核糖體水平的年齡相關(guān)下降和炎癥水平的年齡相關(guān)增加是否是單個細(xì)胞老化的兩個相關(guān)事件。為了定量評估每個細(xì)胞的炎癥狀態(tài),作者根據(jù)炎癥相關(guān)基因列表計算了每個細(xì)胞的炎癥分?jǐn)?shù)。核糖體基因的中位表達(dá)水平被用來指示每個細(xì)胞中核糖體的水平。在SE和SC隊列中,對于所有細(xì)胞類型的所有單個細(xì)胞,核糖體水平與炎癥分?jǐn)?shù)之間存在顯著的負(fù)相關(guān)(圖4A)。此外,在不同的細(xì)胞類型之間,平均核糖體水平和平均炎癥分?jǐn)?shù)之間也存在顯著的負(fù)相關(guān)(圖4B)。根據(jù)核糖體水平與炎癥分?jǐn)?shù)的分布,細(xì)胞類型可以分為高炎癥和低核糖體(HI-LR)細(xì)胞類型,包括Intermed-MC、CD14-MC、CD16-MC、CD14-MC-PPBP和巨核細(xì)胞,以及低炎癥和高核糖體(LI-HR)細(xì)胞類型,即其他細(xì)胞類型(圖4B)。在除一種細(xì)胞類型外,所有核糖體基因的表達(dá)水平都隨著年齡的增長而在SE中降低,在HI-LR細(xì)胞類型中,SCs的水平與年輕的SEs相似(圖4C)。一致地,基于每個細(xì)胞類型內(nèi)的核糖體和炎癥基因表達(dá)的主成分分析(PCA)顯示,對于大多數(shù)細(xì)胞類型(例如CD4-Treg和CD14-MC),單個細(xì)胞分別落入高和低核糖體表達(dá)的兩個主要細(xì)胞狀態(tài)。與核糖體表達(dá)水平一致,大多數(shù)細(xì)胞類型中處于高核糖體狀態(tài)的細(xì)胞比例隨年齡減少(圖4D)。值得注意的是,在HI-LR細(xì)胞類型中,SCs始終比SE擁有更多處于高核糖體狀態(tài)的細(xì)胞(圖4D)。這表明,在血液中,高炎癥低核糖體表達(dá),或者更準(zhǔn)確地說,在高核糖體狀態(tài)下的細(xì)胞更多,是超長壽在單個細(xì)胞水平上的共同特征。
作者還在COVID-19和SLE隊列中驗證了核糖體表達(dá)和炎癥分?jǐn)?shù)的變化。與核糖體表達(dá)和炎癥之間的平衡一致,在COVID-19和SLE的疾病進(jìn)展中,所有細(xì)胞類型和HI-LR細(xì)胞中炎癥分?jǐn)?shù)持續(xù)增加,核糖體表達(dá)水平持續(xù)下降,而在SLE中的變化比COVID-19更顯著。
此外,作者發(fā)現(xiàn)大多數(shù)細(xì)胞類型內(nèi)處于高核糖體狀態(tài)與低核糖體狀態(tài)的細(xì)胞之間的細(xì)胞間通信顯著不同(圖4E)。在低核糖體狀態(tài)下,前100個配體-受體對主要是在CD8-CTL和其他細(xì)胞類型之間,包括MHCII、S100A8/A9TLR4、CCL5-CCR5和TNF相關(guān)的配對,而在高核糖體狀態(tài)下這些配對顯著降低(t檢驗,P < 0.01;圖4E)。在高核糖體狀態(tài)與低核糖體狀態(tài)中,最常見的下調(diào)配體-受體對是核糖體蛋白S19(RPS19)與其膜受體C5AR1,據(jù)報道,該相互作用能抑制免疫反應(yīng)。
最后,為了了解SE + GM數(shù)據(jù)中核糖體水平、炎癥水平、年齡和衰老速率之間的因果關(guān)系,作者分別基于HI-LR和LI-HR細(xì)胞類型中的所有單個細(xì)胞,在衰老速率參考SE + GM數(shù)據(jù)中推斷了一個貝葉斯網(wǎng)絡(luò)(BN)。這里,衰老速率通過年齡校正的AgeDiff來衡量,AgeDiff是基于細(xì)胞組成PLSR模型預(yù)測年齡與實際年齡之間的差異,并經(jīng)過年齡校正。BN模型推斷出AgeDiff取決于HI-LR細(xì)胞類型中的核糖體水平和炎癥水平,而核糖體水平反過來又取決于年齡。模型還推斷出核糖體水平的降低會導(dǎo)致HI-LR細(xì)胞中炎癥水平的增加。然而,在LI-HR細(xì)胞類型中,年齡降低會降低炎癥分?jǐn)?shù),并且炎癥分?jǐn)?shù)不會影響衰老速率(圖4F)。這表明核糖體豐度,通常是翻譯和生長速率的代表,可能抑制HI-LR細(xì)胞的炎性細(xì)胞因子分泌;換句話說,高水平的炎性細(xì)胞因子表達(dá)可能是HI-LR細(xì)胞類型生長停滯或基礎(chǔ)低核糖體活性不足的結(jié)果,而干細(xì)胞可能受益于高細(xì)胞核糖體/翻譯/生長速率以對抗衰老引起的慢性炎癥。相比之下,基礎(chǔ)水平的炎性細(xì)胞因子可能是LI-HR細(xì)胞正常生長的結(jié)果(圖4F)。對于每種細(xì)胞類型推斷的BN模型中可以一致地觀察到類似的關(guān)系,根據(jù)這些BN中的相互作用,HI-LR細(xì)胞類型會自動聚集在一起,并通過無監(jiān)督層次聚類與其他細(xì)胞類型分離開來(圖4G)。
最后,為了確認(rèn)HI-LR細(xì)胞中核糖體活性(翻譯)對炎癥的抑制作用,作者在人類血液原代單核細(xì)胞和THP-1單核細(xì)胞系(代表HI-LR細(xì)胞類型,并且在作者先前的研究中發(fā)現(xiàn)其分泌衰老相關(guān)的細(xì)胞因子)中,使用翻譯抑制劑環(huán)己基甲酰胺(CHX)進(jìn)行時間限制的翻譯抑制。CHX能與60S核糖體亞單位結(jié)合,抑制翻譯延伸。如BN模型所預(yù)期的那樣,在原代單核細(xì)胞中,抑制翻譯引起了常見炎性細(xì)胞因子白細(xì)胞介素-6(IL-6)和IL-8的顯著上調(diào),并且這種上調(diào)呈時間依賴性(圖4H)。類似的結(jié)果也在THP-1細(xì)胞中觀察到。血液單細(xì)胞衰老和 SC 延遲衰老標(biāo)志的核糖體和炎癥平衡的示意圖(圖4I)。
圖 4. 衰老過程中核糖體與單細(xì)胞和細(xì)胞類型炎癥之間的關(guān)系
實驗方法
scRNA-seq、校正批次效應(yīng)、細(xì)胞亞型注釋、構(gòu)建時鐘模型、飽和度分析、TOSICA、GO terms、TF 富集分析、炎癥評分、細(xì)胞間通訊分析、AgeDiff校正、BN推斷、翻譯抑制測定。
參考文獻(xiàn)
Hongming Zhu et al. ,Human PBMC scRNA-seq–based aging clocks reveal ribosome to inflammation balance as a single-cell aging hallmark and super longevity.Sci. Adv.9,eabq7599(2023).DOI:10.1126/sciadv.abq7599