17分生信-免疫來源的lncRNA signature

欄目:最新研究動(dòng)態(tài) 發(fā)布時(shí)間:2022-08-08
有研究構(gòu)建一個(gè)免疫來源的lncRNA signature(IRLS)來改善個(gè)體結(jié)直腸癌患者的臨床結(jié)果,該研究于2022年12月發(fā)表在......


長(zhǎng)鏈非編碼RNA lncRNAs)最近被認(rèn)為與結(jié)直腸癌(CRC)的免疫修飾有關(guān)。然而,與免疫相關(guān)的lncRNAs的臨床意義在很大程度上仍未被探索。目前,有研究構(gòu)建一個(gè)免疫來源的lncRNA signatureIRLS)來改善個(gè)體結(jié)直腸癌患者的臨床結(jié)果,該研究于202212月發(fā)表在《Nature communications》,IF17.694。


技術(shù)路線:



主要研究結(jié)果:

1. 免疫浸潤(rùn)共識(shí)簇的開發(fā)和驗(yàn)證

該研究的總體設(shè)計(jì)如圖1所示。根據(jù)單樣本基因集富集分析(ssGSEA)評(píng)估的28個(gè)免疫細(xì)胞浸潤(rùn),進(jìn)行了共識(shí)聚類分析,其中所有CRC樣本最初被分為k k = 2.9)個(gè)聚類。一致性得分矩陣和模糊聚類(PAC)統(tǒng)計(jì)量的累積分布函數(shù)(CDF)曲線表明,當(dāng)k = 2時(shí),得到最優(yōu)數(shù)量(圖1A、B)。兩個(gè)共識(shí)簇(C1C2)顯示了免疫浸潤(rùn)的顯著差異,C2的總體浸潤(rùn)度明顯高于C1(圖1C、D)。因此,將C1定義為免疫冷腫瘤,C2定義為免疫熱腫瘤。為了確保分析算法不影響兩個(gè)共識(shí)聚類,使用TIMER、quanTIseqMCP-counter、xCell、EPICESTIMATE6種算法來驗(yàn)證ssGSEA結(jié)果的穩(wěn)定性和穩(wěn)定性(圖1E)。


1兩種算法識(shí)別免疫相關(guān)lncRNA


2. 鑒定來自免疫浸潤(rùn)模式的lncRNA模塊

加權(quán)相關(guān)網(wǎng)絡(luò)分析(WGCNA)過程中,將軟閾值β設(shè)為9no scale R2 R2 = 0.910),然后,12個(gè)模塊被識(shí)別,以不同的顏色表示。在模塊-性狀關(guān)系中,黃色模塊與免疫簇之間的相關(guān)性最高(圖1F)。在黃色模塊中,基因顯著性(GS)與模塊隸屬度(MM)的相關(guān)系數(shù)達(dá)到0.96,說明lncRNA模塊構(gòu)建質(zhì)量較優(yōu)(圖1G)。為了鑒定來自黃色模塊內(nèi)免疫浸潤(rùn)模式的hub lncRNA, 526個(gè)lncRNAs GS > 0.5MM > 0.6被認(rèn)為是hub免疫相關(guān)lncRNA (圖1 G)。


3. 免疫相關(guān)lncRNA產(chǎn)生于ImmLnc途徑

ImmLnc系統(tǒng)地從lncRNA和基因表達(dá)譜中推斷出免疫相關(guān)通路活性的候選lncRNA調(diào)控因子。一種假設(shè)是,如果一個(gè)特定的lncRNA在免疫調(diào)節(jié)中發(fā)揮關(guān)鍵作用,那么其相關(guān)基因應(yīng)該富集在免疫相關(guān)通路的頂部或底部。通過ImmLnc管道,鑒定出了791個(gè)與免疫相關(guān)的lncRNA (補(bǔ)充數(shù)據(jù)1)。大量的lncRNA與細(xì)胞因子受體、TCR信號(hào)通路、趨化因子受體、自然殺傷細(xì)胞的細(xì)胞毒性以及抗原加工遞呈通路相關(guān)(圖1H)。將WGCNA結(jié)果進(jìn)行交集,共提取出235個(gè)重疊lncRNA進(jìn)行后續(xù)分析(圖1I)。


4.綜合構(gòu)建一種共識(shí)特征

基于235個(gè)免疫相關(guān)lncRNA的表達(dá)譜,單因素Cox分析鑒定出43個(gè)預(yù)后相關(guān)lncRNA。對(duì)這43個(gè)lncRNA進(jìn)行了基于機(jī)器學(xué)習(xí)的整合程序,以形成一致的免疫相關(guān)lncRNA特征(IRLS)。在TCGA-CRC數(shù)據(jù)集中,通過LOOCV框架擬合了101種預(yù)測(cè)模型,并進(jìn)一步計(jì)算了所有驗(yàn)證數(shù)據(jù)集中每個(gè)模型的C-index(圖2A)。最優(yōu)模型是Lassostepwise Cox direction = both)的組合,平均c指數(shù)最高(0.696),該組合模型在所有驗(yàn)證數(shù)據(jù)集中c指數(shù)領(lǐng)先(圖2A)。在Lasso回歸中,當(dāng)基于LOOCV框架的偏似然偏差達(dá)到最小值時(shí)獲得最佳λ(圖2B)。對(duì)Lasso系數(shù)不為零的30個(gè)lncRNA進(jìn)行了stepwise Cox比例風(fēng)險(xiǎn)回歸,最終確定了16個(gè)lncRNA (圖2C)。

接下來,通過Cox模型中16個(gè)lncRNA的回歸系數(shù)加權(quán),計(jì)算每個(gè)患者的風(fēng)險(xiǎn)評(píng)分(圖2C)。所有患者根據(jù)調(diào)查包確定的最佳臨界值被分為高危組和低危組。如圖2D-J所示,在TCGA-CRC訓(xùn)練數(shù)據(jù)集和6個(gè)驗(yàn)證數(shù)據(jù)集中,相對(duì)于低風(fēng)險(xiǎn)組,高危組患者的總生存期(OS)明顯較低(均P < 0.05)。合并所有樣本的元隊(duì)列也顯示出同樣的趨勢(shì)(P < 0.05)(圖2K)。


2通過基于機(jī)器學(xué)習(xí)的集成程序開發(fā)并驗(yàn)證了一個(gè)共識(shí)IRLS


5. IRLS模型的評(píng)估

ROC分析測(cè)定了IRLS的鑒別度 (圖3A,B)。比較IRLS與其他臨床和分子變量在預(yù)測(cè)預(yù)后方面的表現(xiàn)。如圖3C所示,IRLS的準(zhǔn)確性明顯優(yōu)于年齡等其他變量:性別、TN、MTMB;NAL;microsatellite state;ACTTP53、KRASBRAF突變(P < 0.05,除GSE29621IRLSAJCC期比較外)。這些結(jié)果推測(cè)出IRLSAJCC分期的結(jié)合可能會(huì)進(jìn)一步提高該模型的預(yù)測(cè)能力。


3 IRLS模型的評(píng)估


6. 基于基因表達(dá)的CRC預(yù)后標(biāo)志的比較

為了比較IRLS與其他預(yù)后特征的性能,作者全面檢索了已發(fā)布的預(yù)后特征。由于GPL570注釋的驗(yàn)證數(shù)據(jù)集中嚴(yán)重缺乏miRNA信息,miRNA簽名被排除。最終,納入了109個(gè)signatures (包括mRNAlncRNA signatures)。這些signatures與各種生物學(xué)過程相關(guān),如免疫應(yīng)答、自噬、ferroptosis、干性、上皮間充質(zhì)轉(zhuǎn)化、toll樣受體信號(hào)轉(zhuǎn)導(dǎo)、缺氧、糖酵解、脂肪生成、維生素D、表觀遺傳學(xué)、n6 -甲基腺苷、衰老、WNT和藥物敏感性。在所有數(shù)據(jù)集上對(duì)每個(gè)signatures進(jìn)行單變量Cox回歸,觀察到在所有隊(duì)列中只有作者的模型與預(yù)后顯著相關(guān)(圖4A),這證明了IRLS的穩(wěn)定性。此外,將IRLSc指數(shù)與其他signature進(jìn)行比較:IRLS在每個(gè)數(shù)據(jù)集上的表現(xiàn)都優(yōu)于幾乎所有模型(圖4B)。大多數(shù)模型在自己的訓(xùn)練數(shù)據(jù)集和少數(shù)外部數(shù)據(jù)集(如Chen-Gene, Dai-FIG)中表現(xiàn)良好,但在其他數(shù)據(jù)集中表現(xiàn)較弱(圖4B)。這可能是由于過擬合所得模型的泛化性較差所致。我們的signature通過兩種機(jī)器學(xué)習(xí)算法進(jìn)行了降維,因此具有更好的外推潛力。


4 CRC中基于基因表達(dá)的預(yù)后標(biāo)志比較


7. 在臨床內(nèi)部隊(duì)列中驗(yàn)證

為了進(jìn)一步驗(yàn)證IRLS模型在臨床中的性能,下一步通過qRT-PCR分析評(píng)估了232CRC患者的臨床隊(duì)列中這些lncRNAs的表達(dá)。Kaplan-Meier分析一致表明,高IRLS患者的OSRFS顯著較差(P < 0.0001)(圖5A, B)。在對(duì)混雜變量(包括年齡、性別、T分期、N分期、M分期、AJCC分期、microsatellite state、化療、ICI治療)進(jìn)行控制后,IRLS模型對(duì)OS而非RFS仍具有統(tǒng)計(jì)學(xué)意義(圖5C、D),這與上述結(jié)果一致。ROC分析顯示IRLS具有更高的準(zhǔn)確性:預(yù)測(cè)1、35OSAUC分別為0.840、0.7760.818(圖5E)。同樣,c指數(shù)達(dá)到0.765 95% CI = 0.691 0.839)。此外,比較了IRLS與其他臨床特征的預(yù)測(cè)優(yōu)勢(shì),觀察到IRLS保持最佳性能(圖5F)??傊豁?xiàng)臨床內(nèi)部隊(duì)列研究的結(jié)果支持我們的發(fā)現(xiàn),驗(yàn)證并證實(shí)了IRLS模型是相當(dāng)穩(wěn)健的,可以作為CRC預(yù)后的獨(dú)立預(yù)測(cè)因素。


5臨床內(nèi)部隊(duì)列驗(yàn)證


8. 基于氟尿嘧啶的ACT和貝伐珠單抗受益的預(yù)測(cè)價(jià)值

越來越多的證據(jù)表明,lncRNAs與基于氟尿嘧啶的ACT和貝伐珠單抗的敏感性和耐藥性有關(guān)。在此,進(jìn)一步評(píng)估了IRLS對(duì)量化基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測(cè)價(jià)值。作者發(fā)現(xiàn),在GSE19860GSE28702、GSE45404GSE69657GSE72970中,有應(yīng)答者的IRLS評(píng)分明顯高于無應(yīng)答者(P< 0.05)(圖6A-E)。應(yīng)答者在GSE62080中有更高的IRLS趨勢(shì),但這并不顯著(圖6F),這可能與樣本量小有關(guān)(n = 21)。ROC分析顯示,IRLS可以準(zhǔn)確預(yù)測(cè)基于氟尿嘧啶的ACT的療效,其AUC值較高的有GSE198600.843)、GSE287020.778)、GSE454040.693)、GSE696570.765)、GSE729700.709)和GSE620800.722)(圖6G-L)。同樣,應(yīng)答組的IRLS也更高(圖6M),RLS也可以明顯區(qū)分氟尿嘧啶ACT的應(yīng)答者和無應(yīng)答者(AUC = 0.854)(圖6N)。

與單獨(dú)使用基于氟尿嘧啶的ACT相比,對(duì)貝伐珠單抗敏感的患者在GSE19860 P = 0.075)、GSE19862 P = 0.112)和GSE72970 P = 0.011)中表現(xiàn)出較低的IRLS水平(圖6O-Q)。在三個(gè)獨(dú)立數(shù)據(jù)集中,預(yù)測(cè)貝伐珠單抗療效的IRLSAUC分別為0.771、0.6940.781(圖6R-T)。這表明IRLS在貝伐珠單抗中也有良好的表現(xiàn)。綜合來看,IRLS高的患者往往對(duì)氟尿嘧啶ACT敏感,對(duì)貝伐珠單抗耐藥,而IRLS低的患者往往對(duì)貝伐珠單抗敏感,對(duì)氟尿嘧啶ACT耐藥。


6基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測(cè)價(jià)值


9. IRLS對(duì)ICI治療的意義

細(xì)胞浸潤(rùn)分析顯示,在TCGA-CRCMeta-GEO隊(duì)列中,IRLS與免疫浸潤(rùn)豐度呈顯著負(fù)相關(guān)(圖7A、B)。同樣,IRLSCD8A散點(diǎn)圖在隊(duì)列(r = 0.674,圖7D)中顯示出負(fù)相關(guān)。為了進(jìn)一步驗(yàn)證CD8A蛋白在IRLS不同水平的表達(dá),對(duì)石蠟切片進(jìn)行了免疫組化。免疫組化圖像和評(píng)分顯示,低危組CD8A表達(dá)顯著增高(圖7E F)。這表明低IRLS的患者可能擁有更多的ICI治療后備資源。此外,IRLS也與TCGA-CRCPD-L1的表達(dá)呈負(fù)相關(guān)(r = 0.612,圖7G)和隊(duì)列(r = 0.548,圖7H)。在蛋白質(zhì)水平上也發(fā)現(xiàn)了這一一致的發(fā)現(xiàn)(圖7I, J)。IRLS能夠準(zhǔn)確預(yù)測(cè)TCGC-CRCdMMR/M SI-H表型(AUC = 0.883)、Meta-GEO AUC = 0.778)和內(nèi)部隊(duì)列(AUC = 0.794)(圖7K M),這表明IRLSmicrosatellite state評(píng)估的良好替代。ROC分析顯示,IRLS也能明顯區(qū)分派姆單抗的應(yīng)答者和無應(yīng)答者(AUC = 0.897),且明顯優(yōu)于PDL1 AUC = 0.686 P<0.001)和CD8A AUC = 0.725, P <0.01)表達(dá)(圖7N)。


7 IRLS對(duì)ICI治療的意義


結(jié)論:

基于大量生物信息學(xué)和機(jī)器學(xué)習(xí)算法,作者開發(fā)了一個(gè)穩(wěn)定而強(qiáng)大的signature,用于評(píng)估基于氟尿嘧啶的ACT、貝伐珠單抗和派姆單抗的預(yù)后、復(fù)發(fā)和益處。該IRLS模型是一個(gè)有前景的工具,可以優(yōu)化單個(gè)CRC患者的決策和監(jiān)測(cè)方案。


參考文獻(xiàn):

Liu Z, Liu L, Weng S, Guo C, Dang Q, Xu H, Wang L, Lu T, Zhang Y, Sun Z, Han X. Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer. Nat Commun. 2022;13(1):816. doi: 10.1038/s41467-022-28421-6