肺癌是全球范圍內與癌癥相關的死亡率的主要原因。腺癌是肺癌的主要組織學亞型,占肺癌病例大約40%。盡管最近多模式療法方面取得了進展,但肺腺癌的總體5年生存率仍約為15%。這主要是由于晚期診斷和缺乏有效的治療靶點。肺腺癌的發(fā)展是一個多步驟的,不斷發(fā)展過程,其中涉及環(huán)境暴露和分子改變,包括種系變異,體細胞變異,轉錄和外遺傳改變的多樣性之間的相互作用。
最近,通過整合多維組學數據,癌癥基因組圖譜(TCGA)小組對肺腺癌進行了分析,并確定了幾種致癌途徑中具有可靶向候選物的分子亞型。但是,由于腫瘤內異質性,肺腺癌發(fā)生和發(fā)展的生物學機制仍然難以捉摸。盡管一些肺腺癌相關增強子RNA(eRNAs)已經TCGA樣本中描述了,但它們的轉錄表觀、分子特征以及中國肺腺癌中的臨床應用在很大程度上仍然未知。
近日,南京醫(yī)科大學公共衛(wèi)生學院全球衛(wèi)生中心流行病學教研室的馬紅霞教授及其團隊通過整合來自南京肺癌隊列(NJLCC)的80例肺腺癌患者的全基因組測序(WGS)和RNA-seq,提出肺腺癌中eRNA的全基因組檢測和表征,并在481例TCGA肺腺癌患者中進一步評估了基于eRNA的分子亞型的分子特征和預后價值。相關研究以“Comprehensive characterization of functional eRNAs in lung adenocarcinoma reveals novel regulators and a prognosis-related molecular subtype”為題發(fā)表在Theranostics雜志上,雜志影響因子為8.579。
技術路線:
結果:
1、 肺腺癌中的eRNA
作者用80個NJLCC肺腺癌腫瘤旁正常對的RNA-seq數據,全面分析了48453個先前注釋的增強子(FANTOM5和ENCODE)的表達信號(圖A),共檢測到11937個eRNAs,在超過10%的樣本中有表達,包括1552個外顯子,3297個基因間和7088個內含子eRNAs(圖B)。此外,將3297個中位長度為699 bp(75 ~ 6598 bp)的基因間eRNA納入以下分析,以避免轉錄基因的影響。腫瘤樣本在整體水平(所有eRNA的表達組合)(圖C)和個體水平(每個eRNA的表達)的eRNA表達均顯著高于癌旁正常樣本,其中15.68%的eRNA在腫瘤樣本中高表達,7.19%在癌旁樣本中高表達(圖D)。
2、 吸煙暴露影響eRNA表達的表觀遺傳調控
當評估按年齡、性別或吸煙史劃分的亞組間eRNA的表達差異時,發(fā)現eRNA表達與年齡或性別無相關性(圖A)。然而,吸煙者的正常組織中eRNA表達比不吸煙者顯著升高,正常吸煙者的表達水平與腫瘤樣本中的表達水平相當(圖B)。這些發(fā)現表明,吸煙暴露和腫瘤發(fā)生的過程都會影響eRNAs的表觀遺傳修飾。共表達和GSEA分析闡明了4組樣本(吸煙者和非吸煙者的腫瘤樣本以及正常癌旁樣本)中3297個eRNAs的生物學功能(圖C)。在腫瘤(吸煙者和非吸煙者)樣本中發(fā)現的eRNA相關基因主要參與免疫系統(tǒng)相關通路,即適應性免疫應答通路,在腫瘤非吸煙者中鑒定出的eRNA相關基因也參與細胞周期相關通路,即染色體分離通路。在正常(吸煙者和非吸煙者)樣本中鑒定出的基因主要參與修飾和mRNA代謝過程相關途徑。當使用Reactome和KEGG數據集時,在不吸煙者的腫瘤樣本中復制細胞周期和免疫系統(tǒng)相關通路中eRNA相關基因的特異性富集(圖D-E)。
3、 癌癥驅動基因和臨床可操作基因在eRNA相關基因中過度表達
為了確定肺腫瘤發(fā)生過程中的eRNAs相關基因,我們在腫瘤樣本中建立了一個整體的eRNA-基因調控網絡,并確定了14267個與3204個eRNAs有顯著表達相關性的PCGs,其中9239個位于2471個共表達eRNAs的同一染色體。eRNAs和相關基因之間的距離直方圖隨著距離的增加而急劇衰減,并在一個Mbp距離內表現出顯著的富集(圖A)。52.56% PCGs被定位到少于3個不同的eRNAs(圖B),而55.00%的eRNAs被預測與少于10個相關PCGs相互作用(圖C)。然后,從癌癥基因普查(CGC)中收集了615個候選癌癥驅動基因和135個癌癥臨床可操作基因(CAGs),并確定81.46%的CGC基因和82.96%的CAGs與eRNA相關。這兩組癌癥相關基因在eRNA相關基因中明顯過度表達,應用GSEA方法時也觀察到相似的結果(圖D-E)。
4、 基于eRNAs的功能性聚類與基因組畸變相關
基于共表達的eRNA-PCG對,作者將188個(129個上調,59個下調)共表達上調或下調PCGs的eRNAs定義為進行一系列過濾過程后肺腺癌的功能性eRNA-PCG對,基于這188個eRNA的共有聚類分析得到了3個穩(wěn)健的簇(簇1、簇2和簇3)(圖A),盡管三個簇中的患者具有相似的表達水平,但兩種最常見的癌癥基因組事件類型(體細胞突變和拷貝數改變)差異很大(圖B)。簇1中的患者表現出正常樣基因組模式,基因組改變水平最低;然而,SETD2(一種已確定的肺腺癌突變驅動基因)僅在這些患者中發(fā)生突變;集群2中的患者富集了吸煙者和具有中位突變率水平和拷貝數改變水平;由于簇3中的患者具有最高水平的基因組改變,許多基因的拷貝數改變被過度表達,如TERC、PTPRD和MYC。由于簇3中的患者表現出最高的基因組不穩(wěn)定性水平,我們確定與其他兩組患者相比,該組患者中下調的基因主要參與來自NJLCC和TCGA項目的免疫相關通路(圖 C)。然后,作者評估了簇3中患者的臨床結局,并確定與簇1中的患者相比,該組患者的生存狀態(tài)相對較差,以OS和PFI作為終點,而DFI不是終點(圖D)。
5、 拷貝數擴增激活肺腺癌中eRNA的表達
當評估基因組改變對eRNA表達的影響時,我們觀察到與擴增基因組部分呈正相關(圖A),其中未發(fā)現體細胞突變率的顯著相關性(圖B)。通過整合拷貝數信息(圖C),我們確定了上述129個上調的eRNAs中的4個在肺腺癌樣本中被CNA激活,這些eRNAs靶向FOXO6、TERT和PAX9。一個有趣的發(fā)現是FOXO6作為肺腺癌的一個新的驅動基因的鑒定,觀察到兩個NJLCC中EGFR突變樣本中FOXO6-eRNA和FOXO6的表達顯著升高,表明FOXO6-eRNA的激活可能是EGFR依賴性的。
結論:
本研究鑒定的eRNA相關基因主要參與細胞周期和免疫系統(tǒng)相關途徑,基于eRNA的共識聚類進一步確定了一種具有免疫缺陷和高水平基因組改變的新型分子亞型,其與肺腺癌患者的不良臨床結局相關。eRNAs的全基因組鑒定和表征揭示了肺癌發(fā)生的新調控因子,這為理解肺癌發(fā)生過程中的eRNAs提供了一個新的生物學維度,并強調了基于eRNAs的分子亞型在肺腺癌治療中的臨床實用性。
參考文獻:
Na Qin1, Zijian Ma, Cheng Wang, et al. Comprehensive characterization of functional eRNAs in lung adenocarcinoma reveals novel regulators and a prognosis-related molecular subtype. Theranostics. 2020; 10(24): 11264-11277.