長鏈非編碼RNA (lncRNAs)最近被認(rèn)為與結(jié)直腸癌(CRC)的免疫修飾有關(guān)。然而,與免疫相關(guān)的lncRNAs的臨床意義在很大程度上仍未被探索。目前,有研究構(gòu)建一個免疫來源的lncRNA signature(IRLS)來改善個體結(jié)直腸癌患者的臨床結(jié)果,該研究于2022年12月發(fā)表在《Nature communications》,IF:17.694。
技術(shù)路線:
主要研究結(jié)果:
1. 免疫浸潤共識簇的開發(fā)和驗證
該研究的總體設(shè)計如圖1所示。根據(jù)單樣本基因集富集分析(ssGSEA)評估的28個免疫細(xì)胞浸潤,進行了共識聚類分析,其中所有CRC樣本最初被分為k (k = 2.9)個聚類。一致性得分矩陣和模糊聚類(PAC)統(tǒng)計量的累積分布函數(shù)(CDF)曲線表明,當(dāng)k = 2時,得到最優(yōu)數(shù)量(圖1A、B)。兩個共識簇(C1和C2)顯示了免疫浸潤的顯著差異,C2的總體浸潤度明顯高于C1(圖1C、D)。因此,將C1定義為免疫冷腫瘤,C2定義為免疫熱腫瘤。為了確保分析算法不影響兩個共識聚類,使用TIMER、quanTIseq、MCP-counter、xCell、EPIC和ESTIMATE等6種算法來驗證ssGSEA結(jié)果的穩(wěn)定性和穩(wěn)定性(圖1E)。
圖1兩種算法識別免疫相關(guān)lncRNA
2. 鑒定來自免疫浸潤模式的lncRNA模塊
加權(quán)相關(guān)網(wǎng)絡(luò)分析(WGCNA)過程中,將軟閾值β設(shè)為9(no scale R2 R2 = 0.910),然后,12個模塊被識別,以不同的顏色表示。在模塊-性狀關(guān)系中,黃色模塊與免疫簇之間的相關(guān)性最高(圖1F)。在黃色模塊中,基因顯著性(GS)與模塊隸屬度(MM)的相關(guān)系數(shù)達(dá)到0.96,說明lncRNA模塊構(gòu)建質(zhì)量較優(yōu)(圖1G)。為了鑒定來自黃色模塊內(nèi)免疫浸潤模式的hub lncRNA, 526個lncRNAs GS > 0.5和MM > 0.6被認(rèn)為是hub免疫相關(guān)lncRNA (圖1 G)。
3. 免疫相關(guān)lncRNA產(chǎn)生于ImmLnc途徑
ImmLnc系統(tǒng)地從lncRNA和基因表達(dá)譜中推斷出免疫相關(guān)通路活性的候選lncRNA調(diào)控因子。一種假設(shè)是,如果一個特定的lncRNA在免疫調(diào)節(jié)中發(fā)揮關(guān)鍵作用,那么其相關(guān)基因應(yīng)該富集在免疫相關(guān)通路的頂部或底部。通過ImmLnc管道,鑒定出了791個與免疫相關(guān)的lncRNA (補充數(shù)據(jù)1)。大量的lncRNA與細(xì)胞因子受體、TCR信號通路、趨化因子受體、自然殺傷細(xì)胞的細(xì)胞毒性以及抗原加工遞呈通路相關(guān)(圖1H)。將WGCNA結(jié)果進行交集,共提取出235個重疊lncRNA進行后續(xù)分析(圖1I)。
4.綜合構(gòu)建一種共識特征
基于235個免疫相關(guān)lncRNA的表達(dá)譜,單因素Cox分析鑒定出43個預(yù)后相關(guān)lncRNA。對這43個lncRNA進行了基于機器學(xué)習(xí)的整合程序,以形成一致的免疫相關(guān)lncRNA特征(IRLS)。在TCGA-CRC數(shù)據(jù)集中,通過LOOCV框架擬合了101種預(yù)測模型,并進一步計算了所有驗證數(shù)據(jù)集中每個模型的C-index(圖2A)。最優(yōu)模型是Lasso和stepwise Cox (direction = both)的組合,平均c指數(shù)最高(0.696),該組合模型在所有驗證數(shù)據(jù)集中c指數(shù)領(lǐng)先(圖2A)。在Lasso回歸中,當(dāng)基于LOOCV框架的偏似然偏差達(dá)到最小值時獲得最佳λ(圖2B)。對Lasso系數(shù)不為零的30個lncRNA進行了stepwise Cox比例風(fēng)險回歸,最終確定了16個lncRNA (圖2C)。
接下來,通過Cox模型中16個lncRNA的回歸系數(shù)加權(quán),計算每個患者的風(fēng)險評分(圖2C)。所有患者根據(jù)調(diào)查包確定的最佳臨界值被分為高危組和低危組。如圖2D-J所示,在TCGA-CRC訓(xùn)練數(shù)據(jù)集和6個驗證數(shù)據(jù)集中,相對于低風(fēng)險組,高危組患者的總生存期(OS)明顯較低(均P < 0.05)。合并所有樣本的元隊列也顯示出同樣的趨勢(P < 0.05)(圖2K)。
圖2通過基于機器學(xué)習(xí)的集成程序開發(fā)并驗證了一個共識IRLS
5. IRLS模型的評估
ROC分析測定了IRLS的鑒別度 (圖3A,B)。比較IRLS與其他臨床和分子變量在預(yù)測預(yù)后方面的表現(xiàn)。如圖3C所示,IRLS的準(zhǔn)確性明顯優(yōu)于年齡等其他變量:性別、T、N、M、TMB;NAL;microsatellite state;ACT;TP53、KRAS或BRAF突變(P < 0.05,除GSE29621中IRLS與AJCC期比較外)。這些結(jié)果推測出IRLS和AJCC分期的結(jié)合可能會進一步提高該模型的預(yù)測能力。
圖3 IRLS模型的評估
6. 基于基因表達(dá)的CRC預(yù)后標(biāo)志的比較
為了比較IRLS與其他預(yù)后特征的性能,作者全面檢索了已發(fā)布的預(yù)后特征。由于GPL570注釋的驗證數(shù)據(jù)集中嚴(yán)重缺乏miRNA信息,miRNA簽名被排除。最終,納入了109個signatures (包括mRNA和lncRNA signatures)。這些signatures與各種生物學(xué)過程相關(guān),如免疫應(yīng)答、自噬、ferroptosis、干性、上皮間充質(zhì)轉(zhuǎn)化、toll樣受體信號轉(zhuǎn)導(dǎo)、缺氧、糖酵解、脂肪生成、維生素D、表觀遺傳學(xué)、n6 -甲基腺苷、衰老、WNT和藥物敏感性。在所有數(shù)據(jù)集上對每個signatures進行單變量Cox回歸,觀察到在所有隊列中只有作者的模型與預(yù)后顯著相關(guān)(圖4A),這證明了IRLS的穩(wěn)定性。此外,將IRLS的c指數(shù)與其他signature進行比較:IRLS在每個數(shù)據(jù)集上的表現(xiàn)都優(yōu)于幾乎所有模型(圖4B)。大多數(shù)模型在自己的訓(xùn)練數(shù)據(jù)集和少數(shù)外部數(shù)據(jù)集(如Chen-Gene, Dai-FIG)中表現(xiàn)良好,但在其他數(shù)據(jù)集中表現(xiàn)較弱(圖4B)。這可能是由于過擬合所得模型的泛化性較差所致。我們的signature通過兩種機器學(xué)習(xí)算法進行了降維,因此具有更好的外推潛力。
圖4 CRC中基于基因表達(dá)的預(yù)后標(biāo)志比較
7. 在臨床內(nèi)部隊列中驗證
為了進一步驗證IRLS模型在臨床中的性能,下一步通過qRT-PCR分析評估了232例CRC患者的臨床隊列中這些lncRNAs的表達(dá)。Kaplan-Meier分析一致表明,高IRLS患者的OS和RFS顯著較差(P < 0.0001)(圖5A, B)。在對混雜變量(包括年齡、性別、T分期、N分期、M分期、AJCC分期、microsatellite state、化療、ICI治療)進行控制后,IRLS模型對OS而非RFS仍具有統(tǒng)計學(xué)意義(圖5C、D),這與上述結(jié)果一致。ROC分析顯示IRLS具有更高的準(zhǔn)確性:預(yù)測1、3和5年OS的AUC分別為0.840、0.776和0.818(圖5E)。同樣,c指數(shù)達(dá)到0.765 (95% CI = 0.691 0.839)。此外,比較了IRLS與其他臨床特征的預(yù)測優(yōu)勢,觀察到IRLS保持最佳性能(圖5F)??傊豁椗R床內(nèi)部隊列研究的結(jié)果支持我們的發(fā)現(xiàn),驗證并證實了IRLS模型是相當(dāng)穩(wěn)健的,可以作為CRC預(yù)后的獨立預(yù)測因素。
圖5臨床內(nèi)部隊列驗證
8. 基于氟尿嘧啶的ACT和貝伐珠單抗受益的預(yù)測價值
越來越多的證據(jù)表明,lncRNAs與基于氟尿嘧啶的ACT和貝伐珠單抗的敏感性和耐藥性有關(guān)。在此,進一步評估了IRLS對量化基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測價值。作者發(fā)現(xiàn),在GSE19860、GSE28702、GSE45404、GSE69657和GSE72970中,有應(yīng)答者的IRLS評分明顯高于無應(yīng)答者(P均< 0.05)(圖6A-E)。應(yīng)答者在GSE62080中有更高的IRLS趨勢,但這并不顯著(圖6F),這可能與樣本量小有關(guān)(n = 21)。ROC分析顯示,IRLS可以準(zhǔn)確預(yù)測基于氟尿嘧啶的ACT的療效,其AUC值較高的有GSE19860(0.843)、GSE28702(0.778)、GSE45404(0.693)、GSE69657(0.765)、GSE72970(0.709)和GSE62080(0.722)(圖6G-L)。同樣,應(yīng)答組的IRLS也更高(圖6M),RLS也可以明顯區(qū)分氟尿嘧啶ACT的應(yīng)答者和無應(yīng)答者(AUC = 0.854)(圖6N)。
與單獨使用基于氟尿嘧啶的ACT相比,對貝伐珠單抗敏感的患者在GSE19860 (P = 0.075)、GSE19862 (P = 0.112)和GSE72970 (P = 0.011)中表現(xiàn)出較低的IRLS水平(圖6O-Q)。在三個獨立數(shù)據(jù)集中,預(yù)測貝伐珠單抗療效的IRLS的AUC分別為0.771、0.694和0.781(圖6R-T)。這表明IRLS在貝伐珠單抗中也有良好的表現(xiàn)。綜合來看,IRLS高的患者往往對氟尿嘧啶ACT敏感,對貝伐珠單抗耐藥,而IRLS低的患者往往對貝伐珠單抗敏感,對氟尿嘧啶ACT耐藥。
圖6基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測價值
9. IRLS對ICI治療的意義
細(xì)胞浸潤分析顯示,在TCGA-CRC和Meta-GEO隊列中,IRLS與免疫浸潤豐度呈顯著負(fù)相關(guān)(圖7A、B)。同樣,IRLS和CD8A散點圖在隊列(r = 0.674,圖7D)中顯示出負(fù)相關(guān)。為了進一步驗證CD8A蛋白在IRLS不同水平的表達(dá),對石蠟切片進行了免疫組化。免疫組化圖像和評分顯示,低危組CD8A表達(dá)顯著增高(圖7E, F)。這表明低IRLS的患者可能擁有更多的ICI治療后備資源。此外,IRLS也與TCGA-CRC中PD-L1的表達(dá)呈負(fù)相關(guān)(r = 0.612,圖7G)和隊列(r = 0.548,圖7H)。在蛋白質(zhì)水平上也發(fā)現(xiàn)了這一一致的發(fā)現(xiàn)(圖7I, J)。IRLS能夠準(zhǔn)確預(yù)測TCGC-CRC中dMMR/M SI-H表型(AUC = 0.883)、Meta-GEO (AUC = 0.778)和內(nèi)部隊列(AUC = 0.794)(圖7K M),這表明IRLS是microsatellite state評估的良好替代。ROC分析顯示,IRLS也能明顯區(qū)分派姆單抗的應(yīng)答者和無應(yīng)答者(AUC = 0.897),且明顯優(yōu)于PDL1 (AUC = 0.686, P<0.001)和CD8A (AUC = 0.725, P <0.01)表達(dá)(圖7N)。
圖7 IRLS對ICI治療的意義
結(jié)論:
基于大量生物信息學(xué)和機器學(xué)習(xí)算法,作者開發(fā)了一個穩(wěn)定而強大的signature,用于評估基于氟尿嘧啶的ACT、貝伐珠單抗和派姆單抗的預(yù)后、復(fù)發(fā)和益處。該IRLS模型是一個有前景的工具,可以優(yōu)化單個CRC患者的決策和監(jiān)測方案。
參考文獻:
Liu Z, Liu L, Weng S, Guo C, Dang Q, Xu H, Wang L, Lu T, Zhang Y, Sun Z, Han X. Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer. Nat Commun. 2022;13(1):816. doi: 10.1038/s41467-022-28421-6