17分生信-免疫來源的lncRNA signature

欄目：最新研究動態(tài) 發(fā)布時間：2022-08-08

有研究構(gòu)建一個免疫來源的lncRNA signature（IRLS）來改善個體結(jié)直腸癌患者的臨床結(jié)果，該研究于2022年12月發(fā)表在......

長鏈非編碼RNA （lncRNAs）最近被認(rèn)為與結(jié)直腸癌（CRC）的免疫修飾有關(guān)。然而，與免疫相關(guān)的lncRNAs的臨床意義在很大程度上仍未被探索。目前，有研究構(gòu)建一個免疫來源的lncRNA signature（IRLS）來改善個體結(jié)直腸癌患者的臨床結(jié)果，該研究于2022年12月發(fā)表在《Nature communications》，IF：17.694。

技術(shù)路線：

主要研究結(jié)果：

1. 免疫浸潤共識簇的開發(fā)和驗證

該研究的總體設(shè)計如圖1所示。根據(jù)單樣本基因集富集分析（ssGSEA）評估的28個免疫細(xì)胞浸潤，進行了共識聚類分析，其中所有CRC樣本最初被分為k （k = 2.9）個聚類。一致性得分矩陣和模糊聚類（PAC）統(tǒng)計量的累積分布函數(shù)（CDF）曲線表明，當(dāng)k = 2時，得到最優(yōu)數(shù)量（圖1A、B）。兩個共識簇（C1和C2）顯示了免疫浸潤的顯著差異，C2的總體浸潤度明顯高于C1（圖1C、D）。因此，將C1定義為免疫冷腫瘤，C2定義為免疫熱腫瘤。為了確保分析算法不影響兩個共識聚類，使用TIMER、quanTIseq、MCP-counter、xCell、EPIC和ESTIMATE等6種算法來驗證ssGSEA結(jié)果的穩(wěn)定性和穩(wěn)定性（圖1E）。

圖1兩種算法識別免疫相關(guān)lncRNA

2. 鑒定來自免疫浸潤模式的lncRNA模塊

加權(quán)相關(guān)網(wǎng)絡(luò)分析（WGCNA）過程中，將軟閾值β設(shè)為9（no scale R2 R2 = 0.910），然后，12個模塊被識別，以不同的顏色表示。在模塊-性狀關(guān)系中，黃色模塊與免疫簇之間的相關(guān)性最高（圖1F）。在黃色模塊中，基因顯著性（GS）與模塊隸屬度（MM）的相關(guān)系數(shù)達(dá)到0.96，說明lncRNA模塊構(gòu)建質(zhì)量較優(yōu)（圖1G）。為了鑒定來自黃色模塊內(nèi)免疫浸潤模式的hub lncRNA， 526個lncRNAs GS > 0.5和MM > 0.6被認(rèn)為是hub免疫相關(guān)lncRNA （圖1 G）。

3. 免疫相關(guān)lncRNA產(chǎn)生于ImmLnc途徑

ImmLnc系統(tǒng)地從lncRNA和基因表達(dá)譜中推斷出免疫相關(guān)通路活性的候選lncRNA調(diào)控因子。一種假設(shè)是，如果一個特定的 lncRNA在免疫調(diào)節(jié)中發(fā)揮關(guān)鍵作用，那么其相關(guān)基因應(yīng)該富集在免疫相關(guān)通路的頂部或底部。通過ImmLnc管道，鑒定出了791個與免疫相關(guān)的lncRNA （補充數(shù)據(jù)1）。大量的lncRNA與細(xì)胞因子受體、TCR信號通路、趨化因子受體、自然殺傷細(xì)胞的細(xì)胞毒性以及抗原加工遞呈通路相關(guān)（圖1H）。將WGCNA結(jié)果進行交集，共提取出235個重疊lncRNA進行后續(xù)分析（圖1I）。

4.綜合構(gòu)建一種共識特征

基于235個免疫相關(guān)lncRNA的表達(dá)譜，單因素Cox分析鑒定出43個預(yù)后相關(guān)lncRNA。對這43個lncRNA進行了基于機器學(xué)習(xí)的整合程序，以形成一致的免疫相關(guān)lncRNA特征（IRLS）。在TCGA-CRC數(shù)據(jù)集中，通過LOOCV框架擬合了101種預(yù)測模型，并進一步計算了所有驗證數(shù)據(jù)集中每個模型的C-index（圖2A）。最優(yōu)模型是Lasso和stepwise Cox （direction = both）的組合，平均c指數(shù)最高（0.696），該組合模型在所有驗證數(shù)據(jù)集中c指數(shù)領(lǐng)先（圖2A）。在Lasso回歸中，當(dāng)基于LOOCV框架的偏似然偏差達(dá)到最小值時獲得最佳λ（圖2B）。對Lasso系數(shù)不為零的30個lncRNA進行了stepwise Cox比例風(fēng)險回歸，最終確定了16個lncRNA （圖2C）。

接下來，通過Cox模型中16個lncRNA的回歸系數(shù)加權(quán)，計算每個患者的風(fēng)險評分（圖2C）。所有患者根據(jù)調(diào)查包確定的最佳臨界值被分為高危組和低危組。如圖2D-J所示，在TCGA-CRC訓(xùn)練數(shù)據(jù)集和6個驗證數(shù)據(jù)集中，相對于低風(fēng)險組，高危組患者的總生存期（OS）明顯較低（均P < 0.05）。合并所有樣本的元隊列也顯示出同樣的趨勢（P < 0.05）（圖2K）。

圖2通過基于機器學(xué)習(xí)的集成程序開發(fā)并驗證了一個共識IRLS

5. IRLS模型的評估

ROC分析測定了IRLS的鑒別度（圖3A，B）。比較IRLS與其他臨床和分子變量在預(yù)測預(yù)后方面的表現(xiàn)。如圖3C所示，IRLS的準(zhǔn)確性明顯優(yōu)于年齡等其他變量：性別、T、N、M、TMB；NAL；microsatellite state；ACT；TP53、KRAS或BRAF突變（P < 0.05，除GSE29621中IRLS與AJCC期比較外）。這些結(jié)果推測出IRLS和AJCC分期的結(jié)合可能會進一步提高該模型的預(yù)測能力。

圖3 IRLS模型的評估

6. 基于基因表達(dá)的CRC預(yù)后標(biāo)志的比較

為了比較IRLS與其他預(yù)后特征的性能，作者全面檢索了已發(fā)布的預(yù)后特征。由于GPL570注釋的驗證數(shù)據(jù)集中嚴(yán)重缺乏miRNA信息，miRNA簽名被排除。最終，納入了109個signatures （包括mRNA和lncRNA signatures）。這些signatures與各種生物學(xué)過程相關(guān)，如免疫應(yīng)答、自噬、ferroptosis、干性、上皮間充質(zhì)轉(zhuǎn)化、toll樣受體信號轉(zhuǎn)導(dǎo)、缺氧、糖酵解、脂肪生成、維生素D、表觀遺傳學(xué)、n6 -甲基腺苷、衰老、WNT和藥物敏感性。在所有數(shù)據(jù)集上對每個signatures進行單變量Cox回歸，觀察到在所有隊列中只有作者的模型與預(yù)后顯著相關(guān)（圖4A），這證明了IRLS的穩(wěn)定性。此外，將IRLS的c指數(shù)與其他 signature進行比較：IRLS在每個數(shù)據(jù)集上的表現(xiàn)都優(yōu)于幾乎所有模型（圖4B）。大多數(shù)模型在自己的訓(xùn)練數(shù)據(jù)集和少數(shù)外部數(shù)據(jù)集（如Chen-Gene， Dai-FIG）中表現(xiàn)良好，但在其他數(shù)據(jù)集中表現(xiàn)較弱（圖4B）。這可能是由于過擬合所得模型的泛化性較差所致。我們的signature通過兩種機器學(xué)習(xí)算法進行了降維，因此具有更好的外推潛力。

圖4 CRC中基于基因表達(dá)的預(yù)后標(biāo)志比較

7. 在臨床內(nèi)部隊列中驗證

為了進一步驗證IRLS模型在臨床中的性能，下一步通過qRT-PCR分析評估了232例CRC患者的臨床隊列中這些lncRNAs的表達(dá)。Kaplan-Meier分析一致表明，高IRLS患者的OS和RFS顯著較差（P < 0.0001）（圖5A， B）。在對混雜變量（包括年齡、性別、T分期、N分期、M分期、AJCC分期、microsatellite state、化療、ICI治療）進行控制后，IRLS模型對OS而非RFS仍具有統(tǒng)計學(xué)意義（圖5C、D），這與上述結(jié)果一致。ROC分析顯示IRLS具有更高的準(zhǔn)確性：預(yù)測1、3和5年OS的AUC分別為0.840、0.776和0.818（圖5E）。同樣，c指數(shù)達(dá)到0.765 （95% CI = 0.691 0.839）。此外，比較了IRLS與其他臨床特征的預(yù)測優(yōu)勢，觀察到IRLS保持最佳性能（圖5F）?？傊豁椗R床內(nèi)部隊列研究的結(jié)果支持我們的發(fā)現(xiàn)，驗證并證實了IRLS模型是相當(dāng)穩(wěn)健的，可以作為CRC預(yù)后的獨立預(yù)測因素。

圖5臨床內(nèi)部隊列驗證

8. 基于氟尿嘧啶的ACT和貝伐珠單抗受益的預(yù)測價值

越來越多的證據(jù)表明，lncRNAs與基于氟尿嘧啶的ACT和貝伐珠單抗的敏感性和耐藥性有關(guān)。在此，進一步評估了IRLS對量化基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測價值。作者發(fā)現(xiàn)，在GSE19860、GSE28702、GSE45404、GSE69657和GSE72970中，有應(yīng)答者的IRLS評分明顯高于無應(yīng)答者（P均< 0.05）（圖6A-E）。應(yīng)答者在GSE62080中有更高的IRLS趨勢，但這并不顯著（圖6F），這可能與樣本量小有關(guān)（n = 21）。ROC分析顯示，IRLS可以準(zhǔn)確預(yù)測基于氟尿嘧啶的ACT的療效，其AUC值較高的有GSE19860（0.843）、GSE28702（0.778）、GSE45404（0.693）、GSE69657（0.765）、GSE72970（0.709）和GSE62080（0.722）（圖6G-L）。同樣，應(yīng)答組的IRLS也更高（圖6M），RLS也可以明顯區(qū)分氟尿嘧啶ACT的應(yīng)答者和無應(yīng)答者（AUC = 0.854）（圖6N）。

與單獨使用基于氟尿嘧啶的ACT相比，對貝伐珠單抗敏感的患者在GSE19860 （P = 0.075）、GSE19862 （P = 0.112）和GSE72970 （P = 0.011）中表現(xiàn)出較低的IRLS水平（圖6O-Q）。在三個獨立數(shù)據(jù)集中，預(yù)測貝伐珠單抗療效的IRLS的AUC分別為0.771、0.694和0.781（圖6R-T）。這表明IRLS在貝伐珠單抗中也有良好的表現(xiàn)。綜合來看，IRLS高的患者往往對氟尿嘧啶ACT敏感，對貝伐珠單抗耐藥，而IRLS低的患者往往對貝伐珠單抗敏感，對氟尿嘧啶ACT耐藥。

圖6基于氟尿嘧啶的ACT和貝伐珠單抗療效的預(yù)測價值

9. IRLS對ICI治療的意義

細(xì)胞浸潤分析顯示，在TCGA-CRC和Meta-GEO隊列中，IRLS與免疫浸潤豐度呈顯著負(fù)相關(guān)（圖7A、B）。同樣，IRLS和CD8A散點圖在隊列（r = 0.674，圖7D）中顯示出負(fù)相關(guān)。為了進一步驗證CD8A蛋白在IRLS不同水平的表達(dá)，對石蠟切片進行了免疫組化。免疫組化圖像和評分顯示，低危組CD8A表達(dá)顯著增高（圖7E， F）。這表明低IRLS的患者可能擁有更多的ICI治療后備資源。此外，IRLS也與TCGA-CRC中PD-L1的表達(dá)呈負(fù)相關(guān)（r = 0.612，圖7G）和隊列（r = 0.548，圖7H）。在蛋白質(zhì)水平上也發(fā)現(xiàn)了這一一致的發(fā)現(xiàn)（圖7I， J）。IRLS能夠準(zhǔn)確預(yù)測TCGC-CRC中dMMR/M SI-H表型（AUC = 0.883）、Meta-GEO （AUC = 0.778）和內(nèi)部隊列（AUC = 0.794）（圖7K M），這表明IRLS是microsatellite state評估的良好替代。ROC分析顯示，IRLS也能明顯區(qū)分派姆單抗的應(yīng)答者和無應(yīng)答者（AUC = 0.897），且明顯優(yōu)于PDL1 （AUC = 0.686， P<0.001）和CD8A （AUC = 0.725， P <0.01）表達(dá)（圖7N）。

圖7 IRLS對ICI治療的意義

結(jié)論：

基于大量生物信息學(xué)和機器學(xué)習(xí)算法，作者開發(fā)了一個穩(wěn)定而強大的signature，用于評估基于氟尿嘧啶的ACT、貝伐珠單抗和派姆單抗的預(yù)后、復(fù)發(fā)和益處。該IRLS模型是一個有前景的工具，可以優(yōu)化單個CRC患者的決策和監(jiān)測方案。

參考文獻：

Liu Z, Liu L, Weng S, Guo C, Dang Q, Xu H, Wang L, Lu T, Zhang Y, Sun Z, Han X. Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer. Nat Commun. 2022;13(1):816. doi: 10.1038/s41467-022-28421-6

上一篇：核仁小 RNA（snoRNAs）研究

下一篇： 3DSNP：非編碼RNA的SNP數(shù)據(jù)庫

TOP

谷小姐

戴小姐

4006966643

daihp@yingbio.com