基于癌相關(guān)成纖維細(xì)胞激活評分系統(tǒng)的肝細(xì)胞癌人工神經(jīng)網(wǎng)絡(luò)預(yù)后模型

欄目:最新研究動態(tài) 發(fā)布時間:2023-02-09
有作者基于CAFs相關(guān)基因構(gòu)建了一種新的人工神經(jīng)網(wǎng)絡(luò)(ANN) 模型,通過功能、突變、免疫和臨床分析揭示了關(guān)于ANN模型的信息。研究于......

 


肝細(xì)胞癌(HCC)占原發(fā)性肝癌的80%以上,是全球癌癥相關(guān)死亡的第四大原因。對于HCC患者,明確其進(jìn)展機(jī)制和預(yù)測預(yù)后至關(guān)重要。先前的研究發(fā)現(xiàn),癌癥相關(guān)成纖維細(xì)胞(CAFs)促進(jìn)腫瘤增殖和免疫排斥。近日,有作者基于CAFs相關(guān)基因構(gòu)建了一種新的人工神經(jīng)網(wǎng)絡(luò)(ANN) 模型,通過功能、突變、免疫和臨床分析揭示了關(guān)于ANN模型的信息。研究于2022年7月發(fā)表在《Frontiers in immunology》,IF:8.786。


技術(shù)路線:



主要研究結(jié)果:

1. HCC單細(xì)胞轉(zhuǎn)錄組分析及CAFs相關(guān)基因功能富集

作者將單細(xì)胞的6個亞群(包括惡性細(xì)胞、B細(xì)胞和T細(xì)胞、腫瘤相關(guān)巨噬細(xì)胞(TAMs)、腫瘤相關(guān)內(nèi)皮細(xì)胞(TECs)和癌癥相關(guān)成纖維細(xì)胞(CAFs))進(jìn)行分離,并繪制UMAP圖(圖1A)。然后,使用Monocle 2進(jìn)行偽時間分析,發(fā)現(xiàn)CAFs出現(xiàn)在分化軌跡的末端(圖1B)。此外,在六個亞簇之間進(jìn)行了配體-受體相互作用網(wǎng)絡(luò)(圖1C),并提取了CAFs與其他亞簇之間配體-受體對的數(shù)量(圖1D)。作者證明了CAFs和TECs具有最多的配體-受體對,其次是CAFs和TAMs。隨后,在CAFs和其他亞簇之間進(jìn)行了配體-受體相互作用(圖1E)。選擇與CAFs顯著相關(guān)的基因進(jìn)行功能富集分析,它們主要富集在與腫瘤相關(guān)的通路,如PI3K-Akt-mTOR信號通路、血管發(fā)育、受體酪氨酸激酶信號通路以及細(xì)胞遷移的正向調(diào)控(圖1F和G)。


圖1 CAFs相關(guān)基因的單細(xì)胞轉(zhuǎn)錄組分析及功能


2. 12CAFs相關(guān)基因被確定為HCC的預(yù)測模型

單變量Cox回歸分析進(jìn)一步篩選TCGA數(shù)據(jù)集中與CAFs相關(guān)的預(yù)后基因:14個基因被選中(圖2A)。為了進(jìn)一步獲得最嚴(yán)格的模型,進(jìn)行隨機(jī)森林分析并篩選候選基因。最后,選擇12個可變重要值大于0的CAFs相關(guān)基因作為HCC患者的預(yù)后模型(圖2B)。然后,繪制12個與CAFs相關(guān)的預(yù)后基因的突變圖譜(圖2C),發(fā)現(xiàn)HGF的突變率最高(24%),其次是CD44 (12%),CSF1和NRP1(6%),最高的突變類型是錯義突變。突變分析結(jié)果中常見的變異和變異類型分別是錯義突變和單核苷酸多態(tài)性(SNPs)。單核苷酸變異數(shù)顯示,胞嘧啶(C)向腺嘌呤(A)突變最為常見(圖2D)。每個樣本的中位數(shù)變異為1。此外,作者列出了前10個突變基因供進(jìn)一步分析。隨后,在TCGA數(shù)據(jù)集中對12個與CAFs相關(guān)的預(yù)后基因進(jìn)行了CNV分析(圖2E),發(fā)現(xiàn)EFNA4具有最高的CNV增益突變,而CSF1具有最高的CNV損失突變。然后,構(gòu)建一個圓形圖來展示12個與CAFs相關(guān)的預(yù)后基因之間的相關(guān)性(圖2F),結(jié)果發(fā)現(xiàn)12個與CAFs相關(guān)的預(yù)后基因均為危險因素,且p值< 0.0001,呈強(qiáng)正相關(guān)。


圖2 12個與CAFs預(yù)后相關(guān)基因的鑒定


3. 基于12個與CAFs相關(guān)的預(yù)后基因,建立了ANN預(yù)測模型

基于TCGA數(shù)據(jù)集中12個選擇的與CAFs相關(guān)的預(yù)后基因構(gòu)建了一個神經(jīng)網(wǎng)絡(luò)模型(圖3A)。輸入層輸入12個CAFs相關(guān)基因。網(wǎng)絡(luò)超參數(shù)為:a) 3個隱層;B)每層35、27、19個節(jié)點(diǎn);C) dropout rate= 0.286;D) learning rate= 0.4621984;e) weight decay= 0.3156897。結(jié)果:輸出層包含一個神經(jīng)元,通過Cox回歸計(jì)算CAS。為了評估預(yù)測能力,引入c指數(shù)。在ANN模型中c指數(shù)高于Cox模型。此外,在ICGC和GSE76427數(shù)據(jù)集中,c指數(shù)是令人滿意的(圖3B)。通過AUC分析,ANN模型優(yōu)于Cox模型 (圖3C)。隨后,在TCGA數(shù)據(jù)集中計(jì)算每個樣本的CAS(圖3D),CAS高的患者生存狀態(tài)較差,反之亦然。通過對TCGA數(shù)據(jù)集進(jìn)行Kaplan-Meier分析,發(fā)現(xiàn)高CAS的HCC患者總生存期較短(P = 0.0065)(圖3E)。為了評估ANN模型的準(zhǔn)確性,對TCGA、ICGC和GSE76427數(shù)據(jù)集進(jìn)行了ROC分析,發(fā)現(xiàn)TCGA數(shù)據(jù)集中的1年、3年和5年AUC均大于0.6(圖3F),這表明我們的ANN模型是一個準(zhǔn)確的預(yù)后模型。


圖3建立ANN模型


4. 基于CAFs相關(guān)ANN模型構(gòu)建nomogram

為了評估ANN模型是否可以作為獨(dú)立的預(yù)后標(biāo)志物,對三個隊(duì)列(TCGA、ICGC和GSE76427)進(jìn)行了單變量和多變量Cox回歸分析(圖4A, B)。單因素和多因素Cox回歸結(jié)果顯示, ANN模型的CAS與三個隊(duì)列中較低的總生存率顯著相關(guān),這表明ANN模型可以作為HCC患者的獨(dú)立預(yù)后標(biāo)志物。因此,作者建立了一個基于CAS的nomogram圖來預(yù)測HCC患者的1年、3年和5年的總生存期(圖4C)。然后,建立評估預(yù)測風(fēng)險與觀察風(fēng)險的校準(zhǔn)曲線(圖4D)。1年、3年和5年的校準(zhǔn)曲線顯示出很大的預(yù)測能力。此外,nomogram的AUC表明nomogram與單個參數(shù)相比具有最高的AUC(圖4E)。最后,通過1年、3年和5年的DCA評估該模型是否值得使用(圖4F),結(jié)果表明nomogram檢查對HCC患者是可以接受的。


圖4肝細(xì)胞癌患者計(jì)數(shù)圖的創(chuàng)建


5. CAFs相關(guān)ANN模型的富集分析

通過分析高CAS和低CAS樣本之間的差異表達(dá)基因,并將基因輸入在線富集分析工具metscape。高CAFs組中顯著富集的terms如圖5A所示:排在前五位的是基質(zhì)金屬蛋白酶、己糖反應(yīng)、膜電位調(diào)節(jié)、含苯化合物代謝過程、甾體分解代謝過程。CAS組中顯著富集的terms如圖5B所示:前五項(xiàng)分別是核心母質(zhì)體、ECM組織、母質(zhì)體相關(guān)、蛋白多糖和細(xì)胞對生長因子刺激的反應(yīng)。GSEA分析顯示低CAS組中ABC轉(zhuǎn)運(yùn)蛋白、抗原加工和遞呈、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性、結(jié)點(diǎn)樣受體信號通路和toll樣受體信號通路富集,而高CAS組中鈣信號通路、ECM受體相互作用、Notch信號通路、核糖體和血管內(nèi)皮生長因子(VEGF)信號通路富集 (圖5C, D)。然后,根據(jù)CAS相關(guān)基因的中位表達(dá),將樣本分為兩個亞組(高組和低組),并確定高組的激活細(xì)胞串?dāng)_高于低組(圖5E)。作者總結(jié)顯著的串?dāng)_通路,結(jié)果表明高組可以激活大部分通路(圖5F)。此外,我們分析了一些關(guān)注的通路(圖5G),發(fā)現(xiàn)T細(xì)胞共抑制,血管生成和主要組織相容性復(fù)合體I類在高CAS樣本中顯著上調(diào)。然而,II型干擾素(IFN)反應(yīng)通路在低CAS樣本中顯著富集。此外,CAS和通路之間的相關(guān)性如圖2所示, T細(xì)胞共抑制與CAS有最顯著的正相關(guān)性。


圖5 ANN模型的功能分析


6. CAFs相關(guān)ANN模型的免疫分析

根據(jù)有或無顯著性的風(fēng)險或保護(hù)因素,將22例TIC分為4組,并進(jìn)行相關(guān)分析(圖6A),證明了M0巨噬細(xì)胞和活化的樹突狀細(xì)胞是危險因素,而靜息記憶CD4 T細(xì)胞是保護(hù)因素。作者發(fā)現(xiàn)22個tic之間存在正相關(guān)或負(fù)相關(guān)。然后,繪制一個熱圖來分析TME和腫瘤純度以及TICs和免疫能力的表達(dá)(圖6B)。高CAS樣本的免疫評分和ESTIMATE評分均顯著升高,且與CAS呈正相關(guān)。激活的記憶CD4 T細(xì)胞、卵泡輔助T細(xì)胞和中性粒細(xì)胞在高CAS樣本中高表達(dá),而調(diào)節(jié)性T細(xì)胞和靜息性記憶CD4 T細(xì)胞在低CAS樣本中高表達(dá),CD8 T細(xì)胞在低CAS患者中高表達(dá)。檢查點(diǎn)CTLA4、IDO1和CD274在高CAS樣本中高表達(dá),而TBX2在低CAS樣本中顯著高表達(dá)。此外,在高CAS和低CAS樣本之間對75種免疫調(diào)節(jié)劑進(jìn)行了多組學(xué)分析,發(fā)現(xiàn)包括14個抗原遞呈因子、3個共刺激因子、8個共抑制劑、22個配體、19個受體、3個細(xì)胞粘附因子和6個其他因子(圖6C)。檢測mRNA的表達(dá),突變,擴(kuò)增和缺失的頻率,以及基因表達(dá)與DNA甲基化β值在高和低CAS樣本之間的相關(guān)性。最后,在高CAS樣本和低CAS樣本之間檢測了癌癥-睪丸抗原(CTA)(圖6D)、新抗原(圖6E)和增殖(圖6F)評分。CTA評分可加快腫瘤發(fā)生速度,抑制細(xì)胞凋亡,促進(jìn)細(xì)胞增殖。高CAS樣本具有更高的CTA評分、新抗原表達(dá)和增殖能力。通過相關(guān)分析,發(fā)現(xiàn)CAS與CTA評分(P= 0.03)、新抗原(P= 0.0014)、增殖(P= 0.044)呈顯著正相關(guān)。


圖6 ANN模型的免疫分析


7. CAFs相關(guān)ANN模型的突變分析

對低CAS和高CAS樣本進(jìn)行突變分析。首先,檢測所有突變計(jì)數(shù):非同義突變和同義突變計(jì)數(shù)(圖7A)。然而沒有發(fā)現(xiàn)兩組之間有任何顯著性。此外,篩選26個突變數(shù)超過15的基因,隨后在高CAS和低CAS樣本中展示了突變景觀(圖7B)。高CAS樣本中突變頻率最高的基因是TP53(33%),其次是CTNNB1(25%)和TTN(24%)。相比之下,低CAS樣本中突變頻率最高的基因是CTNNB1(25%),其次是TTN(25%)和TP53(23%)。森林圖展示高CAS和低CAS樣本之間的差異突變基因 (圖7C):NBEA和FRAS1在高CAS樣本中突變數(shù)較高,RYR2在低CAS樣本中突變數(shù)較高。由于TP53在高CAS樣本中具有最高的突變計(jì)數(shù)百分比,因此生成TP53的lollipop圖來展示高CAS和低CAS樣本中的突變頻率和突變類型(圖7D)。柱狀圖來展示了高CAS和低CAS樣本中每個臂的擴(kuò)增和缺失頻率(圖7E)。


圖7 ANN的突變分析


8. ANN模型可指導(dǎo)臨床治療

HCC的主要治療方法之一是化療,其中包括5-氟尿嘧啶、順鉑、吉西他濱和多柔比星。因此,作者預(yù)測了TCGA數(shù)據(jù)集中高CAS和低CAS樣本之間化療藥物的敏感性(圖8A)。3種藥物(5-氟尿嘧啶、順鉑和吉西他濱)在高CAS樣本中的敏感性高于低CAS樣本(p值分別為0.00063、0.018和0.00045)。此外,利用CTRP和PRISM數(shù)據(jù)庫對小分子藥物進(jìn)行了預(yù)測(圖8B)。Brefeldin A、SR-II-138A、CR-1-31B、BRD-K97651142、KX2-391、tosedostat與CAS呈負(fù)相關(guān),高CAS樣本的AUC估計(jì)值較低。結(jié)果表明,預(yù)測的小分子藥物在高CAS患者中具有較高的敏感性。此外,通過使用TCGA數(shù)據(jù)集中的子類映射來預(yù)測針對PD1和CTLA4的免疫反應(yīng)(圖8C)。然后,通過TIDE算法檢測高CAS和低CAS樣本之間的總免疫應(yīng)答(圖8D)。


圖8預(yù)測藥物和免疫反應(yīng)


結(jié)論:

作者創(chuàng)建了一個新的與CAFs相關(guān)的ANN模型,該模型適用于單獨(dú)預(yù)測HCC患者的預(yù)后,并通過功能、突變、免疫和臨床分析指導(dǎo)臨床治療。