基于癌相關成纖維細胞激活評分系統(tǒng)的肝細胞癌人工神經(jīng)網(wǎng)絡預后模型

欄目:最新研究動態(tài) 發(fā)布時間:2023-02-09
有作者基于CAFs相關基因構建了一種新的人工神經(jīng)網(wǎng)絡(ANN) 模型,通過功能、突變、免疫和臨床分析揭示了關于ANN模型的信息。研究于......

 


肝細胞癌(HCC)占原發(fā)性肝癌的80%以上,是全球癌癥相關死亡的第四大原因。對于HCC患者,明確其進展機制和預測預后至關重要。先前的研究發(fā)現(xiàn),癌癥相關成纖維細胞(CAFs)促進腫瘤增殖和免疫排斥。近日,有作者基于CAFs相關基因構建了一種新的人工神經(jīng)網(wǎng)絡(ANN) 模型,通過功能、突變、免疫和臨床分析揭示了關于ANN模型的信息。研究于2022年7月發(fā)表在《Frontiers in immunology》,IF:8.786。


技術路線:



主要研究結果:

1. HCC單細胞轉(zhuǎn)錄組分析及CAFs相關基因功能富集

作者將單細胞的6個亞群(包括惡性細胞、B細胞和T細胞、腫瘤相關巨噬細胞(TAMs)、腫瘤相關內(nèi)皮細胞(TECs)和癌癥相關成纖維細胞(CAFs))進行分離,并繪制UMAP圖(圖1A)。然后,使用Monocle 2進行偽時間分析,發(fā)現(xiàn)CAFs出現(xiàn)在分化軌跡的末端(圖1B)。此外,在六個亞簇之間進行了配體-受體相互作用網(wǎng)絡(圖1C),并提取了CAFs與其他亞簇之間配體-受體對的數(shù)量(圖1D)。作者證明了CAFs和TECs具有最多的配體-受體對,其次是CAFs和TAMs。隨后,在CAFs和其他亞簇之間進行了配體-受體相互作用(圖1E)。選擇與CAFs顯著相關的基因進行功能富集分析,它們主要富集在與腫瘤相關的通路,如PI3K-Akt-mTOR信號通路、血管發(fā)育、受體酪氨酸激酶信號通路以及細胞遷移的正向調(diào)控(圖1F和G)。


圖1 CAFs相關基因的單細胞轉(zhuǎn)錄組分析及功能


2. 12CAFs相關基因被確定為HCC的預測模型

單變量Cox回歸分析進一步篩選TCGA數(shù)據(jù)集中與CAFs相關的預后基因:14個基因被選中(圖2A)。為了進一步獲得最嚴格的模型,進行隨機森林分析并篩選候選基因。最后,選擇12個可變重要值大于0的CAFs相關基因作為HCC患者的預后模型(圖2B)。然后,繪制12個與CAFs相關的預后基因的突變圖譜(圖2C),發(fā)現(xiàn)HGF的突變率最高(24%),其次是CD44 (12%),CSF1和NRP1(6%),最高的突變類型是錯義突變。突變分析結果中常見的變異和變異類型分別是錯義突變和單核苷酸多態(tài)性(SNPs)。單核苷酸變異數(shù)顯示,胞嘧啶(C)向腺嘌呤(A)突變最為常見(圖2D)。每個樣本的中位數(shù)變異為1。此外,作者列出了前10個突變基因供進一步分析。隨后,在TCGA數(shù)據(jù)集中對12個與CAFs相關的預后基因進行了CNV分析(圖2E),發(fā)現(xiàn)EFNA4具有最高的CNV增益突變,而CSF1具有最高的CNV損失突變。然后,構建一個圓形圖來展示12個與CAFs相關的預后基因之間的相關性(圖2F),結果發(fā)現(xiàn)12個與CAFs相關的預后基因均為危險因素,且p值< 0.0001,呈強正相關。


圖2 12個與CAFs預后相關基因的鑒定


3. 基于12個與CAFs相關的預后基因,建立了ANN預測模型

基于TCGA數(shù)據(jù)集中12個選擇的與CAFs相關的預后基因構建了一個神經(jīng)網(wǎng)絡模型(圖3A)。輸入層輸入12個CAFs相關基因。網(wǎng)絡超參數(shù)為:a) 3個隱層;B)每層35、27、19個節(jié)點;C) dropout rate= 0.286;D) learning rate= 0.4621984;e) weight decay= 0.3156897。結果:輸出層包含一個神經(jīng)元,通過Cox回歸計算CAS。為了評估預測能力,引入c指數(shù)。在ANN模型中c指數(shù)高于Cox模型。此外,在ICGC和GSE76427數(shù)據(jù)集中,c指數(shù)是令人滿意的(圖3B)。通過AUC分析,ANN模型優(yōu)于Cox模型 (圖3C)。隨后,在TCGA數(shù)據(jù)集中計算每個樣本的CAS(圖3D),CAS高的患者生存狀態(tài)較差,反之亦然。通過對TCGA數(shù)據(jù)集進行Kaplan-Meier分析,發(fā)現(xiàn)高CAS的HCC患者總生存期較短(P = 0.0065)(圖3E)。為了評估ANN模型的準確性,對TCGA、ICGC和GSE76427數(shù)據(jù)集進行了ROC分析,發(fā)現(xiàn)TCGA數(shù)據(jù)集中的1年、3年和5年AUC均大于0.6(圖3F),這表明我們的ANN模型是一個準確的預后模型。


圖3建立ANN模型


4. 基于CAFs相關ANN模型構建nomogram

為了評估ANN模型是否可以作為獨立的預后標志物,對三個隊列(TCGA、ICGC和GSE76427)進行了單變量和多變量Cox回歸分析(圖4A, B)。單因素和多因素Cox回歸結果顯示, ANN模型的CAS與三個隊列中較低的總生存率顯著相關,這表明ANN模型可以作為HCC患者的獨立預后標志物。因此,作者建立了一個基于CAS的nomogram圖來預測HCC患者的1年、3年和5年的總生存期(圖4C)。然后,建立評估預測風險與觀察風險的校準曲線(圖4D)。1年、3年和5年的校準曲線顯示出很大的預測能力。此外,nomogram的AUC表明nomogram與單個參數(shù)相比具有最高的AUC(圖4E)。最后,通過1年、3年和5年的DCA評估該模型是否值得使用(圖4F),結果表明nomogram檢查對HCC患者是可以接受的。


圖4肝細胞癌患者計數(shù)圖的創(chuàng)建


5. CAFs相關ANN模型的富集分析

通過分析高CAS和低CAS樣本之間的差異表達基因,并將基因輸入在線富集分析工具metscape。高CAFs組中顯著富集的terms如圖5A所示:排在前五位的是基質(zhì)金屬蛋白酶、己糖反應、膜電位調(diào)節(jié)、含苯化合物代謝過程、甾體分解代謝過程。CAS組中顯著富集的terms如圖5B所示:前五項分別是核心母質(zhì)體、ECM組織、母質(zhì)體相關、蛋白多糖和細胞對生長因子刺激的反應。GSEA分析顯示低CAS組中ABC轉(zhuǎn)運蛋白、抗原加工和遞呈、自然殺傷細胞介導的細胞毒性、結點樣受體信號通路和toll樣受體信號通路富集,而高CAS組中鈣信號通路、ECM受體相互作用、Notch信號通路、核糖體和血管內(nèi)皮生長因子(VEGF)信號通路富集 (圖5C, D)。然后,根據(jù)CAS相關基因的中位表達,將樣本分為兩個亞組(高組和低組),并確定高組的激活細胞串擾高于低組(圖5E)。作者總結顯著的串擾通路,結果表明高組可以激活大部分通路(圖5F)。此外,我們分析了一些關注的通路(圖5G),發(fā)現(xiàn)T細胞共抑制,血管生成和主要組織相容性復合體I類在高CAS樣本中顯著上調(diào)。然而,II型干擾素(IFN)反應通路在低CAS樣本中顯著富集。此外,CAS和通路之間的相關性如圖2所示, T細胞共抑制與CAS有最顯著的正相關性。


圖5 ANN模型的功能分析


6. CAFs相關ANN模型的免疫分析

根據(jù)有或無顯著性的風險或保護因素,將22例TIC分為4組,并進行相關分析(圖6A),證明了M0巨噬細胞和活化的樹突狀細胞是危險因素,而靜息記憶CD4 T細胞是保護因素。作者發(fā)現(xiàn)22個tic之間存在正相關或負相關。然后,繪制一個熱圖來分析TME和腫瘤純度以及TICs和免疫能力的表達(圖6B)。高CAS樣本的免疫評分和ESTIMATE評分均顯著升高,且與CAS呈正相關。激活的記憶CD4 T細胞、卵泡輔助T細胞和中性粒細胞在高CAS樣本中高表達,而調(diào)節(jié)性T細胞和靜息性記憶CD4 T細胞在低CAS樣本中高表達,CD8 T細胞在低CAS患者中高表達。檢查點CTLA4、IDO1和CD274在高CAS樣本中高表達,而TBX2在低CAS樣本中顯著高表達。此外,在高CAS和低CAS樣本之間對75種免疫調(diào)節(jié)劑進行了多組學分析,發(fā)現(xiàn)包括14個抗原遞呈因子、3個共刺激因子、8個共抑制劑、22個配體、19個受體、3個細胞粘附因子和6個其他因子(圖6C)。檢測mRNA的表達,突變,擴增和缺失的頻率,以及基因表達與DNA甲基化β值在高和低CAS樣本之間的相關性。最后,在高CAS樣本和低CAS樣本之間檢測了癌癥-睪丸抗原(CTA)(圖6D)、新抗原(圖6E)和增殖(圖6F)評分。CTA評分可加快腫瘤發(fā)生速度,抑制細胞凋亡,促進細胞增殖。高CAS樣本具有更高的CTA評分、新抗原表達和增殖能力。通過相關分析,發(fā)現(xiàn)CAS與CTA評分(P= 0.03)、新抗原(P= 0.0014)、增殖(P= 0.044)呈顯著正相關。


圖6 ANN模型的免疫分析


7. CAFs相關ANN模型的突變分析

對低CAS和高CAS樣本進行突變分析。首先,檢測所有突變計數(shù):非同義突變和同義突變計數(shù)(圖7A)。然而沒有發(fā)現(xiàn)兩組之間有任何顯著性。此外,篩選26個突變數(shù)超過15的基因,隨后在高CAS和低CAS樣本中展示了突變景觀(圖7B)。高CAS樣本中突變頻率最高的基因是TP53(33%),其次是CTNNB1(25%)和TTN(24%)。相比之下,低CAS樣本中突變頻率最高的基因是CTNNB1(25%),其次是TTN(25%)和TP53(23%)。森林圖展示高CAS和低CAS樣本之間的差異突變基因 (圖7C):NBEA和FRAS1在高CAS樣本中突變數(shù)較高,RYR2在低CAS樣本中突變數(shù)較高。由于TP53在高CAS樣本中具有最高的突變計數(shù)百分比,因此生成TP53的lollipop圖來展示高CAS和低CAS樣本中的突變頻率和突變類型(圖7D)。柱狀圖來展示了高CAS和低CAS樣本中每個臂的擴增和缺失頻率(圖7E)。


圖7 ANN的突變分析


8. ANN模型可指導臨床治療

HCC的主要治療方法之一是化療,其中包括5-氟尿嘧啶、順鉑、吉西他濱和多柔比星。因此,作者預測了TCGA數(shù)據(jù)集中高CAS和低CAS樣本之間化療藥物的敏感性(圖8A)。3種藥物(5-氟尿嘧啶、順鉑和吉西他濱)在高CAS樣本中的敏感性高于低CAS樣本(p值分別為0.00063、0.018和0.00045)。此外,利用CTRP和PRISM數(shù)據(jù)庫對小分子藥物進行了預測(圖8B)。Brefeldin A、SR-II-138A、CR-1-31B、BRD-K97651142、KX2-391、tosedostat與CAS呈負相關,高CAS樣本的AUC估計值較低。結果表明,預測的小分子藥物在高CAS患者中具有較高的敏感性。此外,通過使用TCGA數(shù)據(jù)集中的子類映射來預測針對PD1和CTLA4的免疫反應(圖8C)。然后,通過TIDE算法檢測高CAS和低CAS樣本之間的總免疫應答(圖8D)。


圖8預測藥物和免疫反應


結論:

作者創(chuàng)建了一個新的與CAFs相關的ANN模型,該模型適用于單獨預測HCC患者的預后,并通過功能、突變、免疫和臨床分析指導臨床治療。