一種常見的mRNA修飾是5-甲基胞嘧啶(m5C),其在基因轉錄加工和癌癥中的作用尚不清楚。在本研究中,作者確定了富含絲氨酸/精氨酸的剪接因子2 (SRSF2)是m5C的讀者,而受損的SRSF2與m5C的結合是白血病發(fā)生的潛在因素。在結構上,作者鑒定了參與m5C識別的殘基,以及流行的白血病相關突變SRSF2P95H的影響。作者發(fā)現(xiàn)SRSF2結合和m5C在轉錄本內共定位。此外,敲低m5C的作者NSUN2會降低mRNA m5C,減少SRSF2的結合,并改變RNA的剪接。作者還表明,SRSF2P95H突變損害了該蛋白讀取m5C標記mRNA的能力,顯著降低了其與白血病細胞中關鍵白血病相關轉錄本的結合。在白血病患者中,NSUN2低表達導致mRNA m5C低甲基化,聯(lián)合SRSF2P95H預測不良預后??傊?,作者強調了表觀轉錄組學和一個關鍵的腫瘤發(fā)生驅動因素之間尚未認識到的機制聯(lián)系。本文于2023年7月發(fā)表于《Molecular Cell》,IF:14.5。
摘要圖
技術路線:
主要研究結果:
1. SRSF2優(yōu)先結合m5C修飾的RNA
鑒定m5C結合蛋白是更好地理解m5C對RNA的生物學影響的重要一步。為了找到m5C結合蛋白,作者進行了RNA下拉分析,然后進行了質譜分析。作者發(fā)現(xiàn)只有一種蛋白對生物素化的m5CRNA寡核苷酸表現(xiàn)出顯著的結合偏好: SRSF2(圖1A)。然而,盡管SRSF2與m5CRNA寡核苷酸的結合明顯增加,但其他SR蛋白沒有明顯變化(圖1)。這證實了實驗的可靠性和在C(m5C)GG背景下SRSF2對m5C的特異性。此外,與對照相比,m5C對內源性和過表達的SRSF2的下拉混合物的富集程度更高(圖1C)。與此一致,重組SRSF2在無細胞環(huán)境中對m5C探針表現(xiàn)出強烈的偏好,表明直接結合(圖1D)。
圖1 SRSF2優(yōu)先與m5C修飾的RNAs結合
為了在活細胞上證實上述SRSF2-m5C相互作用并定量監(jiān)測這種相互作用,作者進行了基于納米熒光素的生物發(fā)光共振能量轉移(NanoBRET)實驗。首先,作者測試了m5C標記和未標記的RNA示蹤探針(稱為示蹤- m5C和示蹤-C)對NanoBRET的適用性。在所有濃度下,示蹤劑m5C都比示蹤劑C產(chǎn)生更強的BRET信號(圖1E)。然后,作者使用冷(未標記)RNA進行競爭性結合,發(fā)現(xiàn)冷RNA以濃度依賴的方式減弱BRET信號,這表明BRET信號是由示蹤劑與納米熒光素酶(NLUC)融合的SRSF2特異性可逆相互作用產(chǎn)生的(圖1F)。用冷RNA取代示蹤RNA,可以確定SRSF2與不同RNA序列結合的相對親和力利用SRSF2-N進行的競爭實驗表明,cold-m5C對示蹤劑C的競爭能力顯著高于cold-C(圖1G)。綜上所述,這些結果支持SRSF2在體外和活細胞中優(yōu)先結合攜帶m5C的RNA的觀點。
圖2 轉錄組SRSF2結合譜,mRNA m5C圖譜,以及SRSF2結合和m5C的共存
2. 轉錄組SRSF2結合譜
在6844個轉錄本中共鑒定出10928個SRSF2結合位點(圖2A)。SRSF2主要富集于外顯子區(qū)域(圖2B),這與已知的蛋白質優(yōu)先結合一致。隨后的基序分析顯示,在峰中心存在CAG(C/G)CUGR基序(圖2C)和其他含有SSNG的基序,包含SSNG序列的典型SRSF2結合位點如圖2D所示,并通過RNA免疫沉淀- qPCR (RIP-qPCR)進行驗證(圖2E)。總的來說,作者發(fā)現(xiàn)SRSF2主要結合外顯子的CDS區(qū)域,優(yōu)先結合胞嘧-鳥嘌呤(CG)豐富的SSNG基序。
圖3 NSUN2的缺失降低了m5C水平,改變了SRSF2的mRNA結合親和力,并導致與SRSF2缺失相似的RNA剪接變化
3. 在轉錄組中,SRSF2結合攜帶m5C的mRNA
然后,作者評估了轉錄組范圍內的m5C景觀。在4,684個轉錄本中共鑒定出6,913個m5C峰(圖2F)。在mRNA中,最豐富的m5C峰出現(xiàn)在CDSs中,聚集在翻譯起始位點的下游區(qū)域(圖2G)。有趣的是,通過整合內部SRSF2 PAR-CLIP-seq和RNA m5C MeRIP-seq數(shù)據(jù),作者發(fā)現(xiàn)SRSF2結合位點非常頻繁地出現(xiàn)在m5C峰中心(圖2H)??傊?,這些結果提供了SRSF2直接結合轉錄組中m5C標記序列子集的證據(jù)。
4. NSUN2缺失會降低m5C水平并改變SRSF2的RNA結合親和力
由于SRSF2優(yōu)先結合m5C修飾的RNA,作者接下來想知道減少m5C標記如何影響轉錄組范圍內的SRSF2結合。為了研究這一點,作者首先通過m5C質譜和m5C MeRIP-seq驗證了NSUN2敲低(KD) HeLa細胞中mRNA m5C水平顯著降低(圖3A、3B)。然后,作者在對照和NSUN2 KD細胞上進行SRSF2 PAR-CLIP,然后進行RNA生物素標記試驗或高通量測序NSUN2 KD與對照組的差異結合分析顯示,共有3,426個SRSF2差異結合位點,其中約65%顯示NSUN2 KD后的結合喪失,35%顯示結合增強(圖3C)。因此,這并不支持SRSF2結合的增加是由于NSUN2低時其他m5C調節(jié)因子表達的代償性改變的假設。接下來,作者想知道當m5C水平較低時,SRSF2與SSNG基序的結合如何改變。雖然觀察到相同基序的富集,但作者發(fā)現(xiàn)含C基序(GCAG)在增益位點的排名低于損失位點,而不含C基序(GGGG)的排名更高(圖3)。這一發(fā)現(xiàn)表明,當NSUN2減少時,SRSF2向不含C的結合位點重定向。
圖3E顯示了失去SRSF2結合和在NSUN2 KD上顯示較低m5C水平的位點的代表性覆蓋軌跡。含有siNSUN2缺失位點的轉錄本在細胞生物學類別(如RNA剪接)和腫瘤發(fā)生相關類別(如“AML”)中富集。這表明在NSUN2缺失的細胞中觀察到的SRSF2結合譜的改變不影響翻譯。
5. NSUN2和SRSF2的缺失同樣會改變RNA剪接,剪接事件附近的m5C位點和SRSF2結合位點富集
考慮到SRSF2在RNA剪接中的眾所周知的功能,以及在顯示siNSUN2相關的結合缺失的SRSF2結合靶標中,RNA剪接類別被過度代表,作者假設NSUN2通過在RNA中添加m5C標記,影響SRSF2驅動的選擇性剪接。如果是這樣的話,NSUN2缺失應該會導致類似于SRSF2缺失所導致的剪接模式改變。為了驗證這一假設,作者進行了RNA測序(RNA-seq)并分析了RNA剪接(圖3F)同樣,在NSUN2 KD中鑒定的73.3%的DS基因也在SRSF2 KD細胞中鑒定出來(圖3G),典型的剪接事件如圖3H所示??偟膩碚f,這些數(shù)據(jù)表明NSUN2缺失對選擇性剪接的影響類似于SRSF2缺失。
圖4 SRSF2P95H突變降低了SRSF2的m5C結合親和力
鑒于這一觀察結果,作者接下來研究了m5C修飾和SRSF2結合是否可能發(fā)生在NSUN2-和SRSF2相關的剪接事件中。作者使用內部m5C MeRIP-seq數(shù)據(jù)和公開的RNA-BisSeq數(shù)據(jù)進行分析,一致顯示SRSF2結合位點和m5C位點與剪接事件非常接近(圖3I)。這有力地支持了作者的發(fā)現(xiàn),即SRSF2作為m5C結合蛋白,并提示m5C、SRSF2和RNA剪接之間存在關聯(lián)。
作者進一步將共發(fā)生的差異剪接基因(2367個基因)與SRSF2結合靶點重疊。1058個SRSF2結合靶點的一個重要子集也被差異拼接(圖3J)。這些觀察結果,以及作者關于SRSF2結合m5C標記的發(fā)現(xiàn),表明SRSF2通過其讀取器功能參與了NSUN2介導的m5C的選擇性剪接作用。
6. 流行疾病相關的P95H突變降低了SRSF2對RNA m5C的結合親和力
白血病中經(jīng)常報道各種體細胞SRSF2突變,這些突變對發(fā)病機制至關重要。發(fā)現(xiàn)SRSF2結合含有m5C的RNA促使作者研究這些疾病相關突變是否改變了SRSF2與m5C的優(yōu)先結合。為了回答這個問題,作者測試了SRSF2 N端區(qū)域的幾個突變:T51A、K52A、P95H、H99A和P107H.28有趣的是,作者發(fā)現(xiàn)與P95H變體相比,其他SRSF2突變形式評估保持對m5C的偏好(圖4A)。
利用NanoBRET,作者發(fā)現(xiàn)與SRSF2WT相比(Ki,app = 22.9 nM;圖1G), SRSF2P95H (Ki,app = 43.4 nM;圖4B)顯示了較高的Ki,app值,即對甲基化RNA的親和力較低。這些結果一致表明,P95H突變降低了SRSF2與RNA m5C結合的親和力。
7. m5C與WT或突變體SRSF2相互作用的結構建模,并通過平衡結合親和測量驗證
先前的核磁共振結構揭示了SRSF2 N端結構域和RNA相互作用的模式(PDB: 2LEB)單鏈己核苷酸RNA (5 ' -U1C2C3A4G5U6-3 ')適合于由SRSF2的中心β片和鉸鏈區(qū)域(Lys91-His99)發(fā)出的帶正電的芳香氨基酸形成的凹槽(圖4C,左)。在C3堿基的沃森克里克邊緣和Arg61側鏈之間的兩個直接氫鍵賦予了第二胞嘧啶(C3)的堿基特異性29有趣的是,C3堿的另一面通過與Pro95的范德瓦爾斯(vdW)接觸而穩(wěn)定。作者在這個位置(C3)建模了m5C(圖4C,中間)。有趣的是,m5C的甲基部分似乎通過額外的vdW與Arg94和Pro95的蛋白主鏈原子從一側接觸,以及與RNA的第一胞嘧啶(C2)的核糖部分從另一側接觸而穩(wěn)定下來(圖4C,右上)。模型組氨酸的側鏈始終與RNA的磷酸主鏈發(fā)生空間沖突(圖4C,右下)。此外,作者對其他SRSF2突變體的相互作用進行了建模(圖S4B)。Arg95 (R95)在AML/CMML患者中的突變頻率低于H95也可能與m5C發(fā)生立體沖突。Ala95 (A95)是AML/CMML患者中的一種罕見突變,可能危害較小,并且似乎不會與m5C堿基或RNA主干發(fā)生沖突??傊?,這些數(shù)據(jù)強調了Pro95在SRSF2-m5C相互作用中的關鍵作用。最后,基于熒光偏振(FP)的實驗分析證實了野生型(WT) SRSF2 RRM與含有m5C的RNA結合更緊密,而P95H突變體更傾向于未甲基化的RNA序列(圖4D)。
因此,作者的結構研究和FP分析表明,SRSF2特異性識別m5C修飾RNA的分子機制,從而可能解釋WT SRSF2如何更緊密地與含有m5C的RNA結合,而白血病相關的Pro95突變體,如P95H突變體,更傾向于未甲基化的RNA序列。
圖5 mRNA m5C調控轉錄物在白血病中的參與
8. SRSF2在NSUN2 KD和P95H突變白血病細胞中的RNA結合譜
然后,作者在白血病細胞模型中探索了P95H突變和RNA低甲基化如何影響SRSF2與mRNA的結合。關注顯示SRSF2差異結合的位點,作者發(fā)現(xiàn)在對照細胞中鑒定的共有1933個SRSF2結合位點在shNSUN2細胞中丟失,在SRSF2P95H突變細胞中丟失了2280個結合位點(圖5A)。接下來,作者比較了以下位點子集的分布:shNSUN2 -缺失或獲得位點(NSUN2缺失或獲得)和p95h -缺失或獲得位點(SRSF2P95H細胞中的缺失或獲得)。
當作者比較這兩種情況下顯示結合缺失的位點時,作者觀察到1203個結合位點重疊,對應于62.3%的shNSUN2缺失位點(圖5B)。這一結果表明,NSUN2缺失和SRSF2P95H突變可能類似地影響SRSF2與某些靶標的結合。引人注目的是,已知重疊區(qū)有104個結合位點編碼白血病相關基因,例如ZESTE同源物增強子2 (EZH2)、溴結構域蛋白4 (BRD4)、剪接因子3B亞基1 (SF3B1)和原肌球蛋白3 (TPM3)(圖5B和5C)。NSUN2 KD和SRSF2P95H突變都改變了SRSF2與mRNA的結合,特別是與白血病相關靶點的結合,這一事實強調了m5C識別在白血病發(fā)生中的潛在參與。
9. NSUN2缺失導致與SRSF2突變相當?shù)娜?span>RNA剪接改變
作者首先研究了在NSUN2缺失或SRSF2P95H突變細胞中觀察到的SRSF2結合譜的改變是否與翻譯有關。研究表明,SRSF2P95H突變體改變了與癌癥發(fā)展有關的大量基因的RNA剪接譜。因此,作者對NSUN2 KD和SRSF2P95H K562細胞進行了RNA測序,分析RNA剪接模式(圖5D),這表明NSUN2缺失和SRSF2突變介導的rna剪接改變共同影響許多下游生物功能。
接下來,作者研究了SRSF2結合位點與其他剪接事件位點的距離。與HeLa細胞的研究結果一致(圖3I),作者發(fā)現(xiàn)在對照細胞中發(fā)現(xiàn)的SRSF2結合位點,而不是隨機選擇的位點,優(yōu)先位于NSUN2缺失或SRSF2P95H突變細胞中發(fā)現(xiàn)的剪接事件周圍(圖5E)。此外,作者發(fā)現(xiàn)大約26%-32%的差異剪接基因是SRSF2結合靶點,在NSUN2缺失或SRSF2突變時發(fā)生改變(圖5F)。有趣的是,這些差異剪接的SRSF2結合靶點在RNA剪接類別中顯著豐富(圖5G)。這些結果表明,NSUN2缺失和SRSF2突變通過影響其他RNA剪接因子的結合和剪接,導致SRSF2直接結合靶點和間接靶點的選擇性剪接。
10. NSUN2高、低水平CMML患者單核細胞中RNA m5C的分布
為了在單堿基分辨率下分析白血病患者轉錄組范圍內的m5C甲基化,作者分離了8名CMML患者的外周血單核細胞,并對核糖缺失的RNA進行了RNA-BisSeq檢測(圖6A)。作者發(fā)現(xiàn)NSUN2-low患者的m5C位點數(shù)量明顯低于NSUN2-high患者(圖6B)。然后檢查mRNA中m5C位點的分布概況,發(fā)現(xiàn)與m5C相關程度最高的區(qū)域是CDS,特別是翻譯起始位點的下游區(qū)域(圖6C)。這些模式與作者對HeLa細胞的m5C MeRIP-seq數(shù)據(jù)以及先前對小鼠組織和正常和腫瘤來源的人類組織的報道一致值得注意的是,與NSUN2高的患者相比,NSUN2低的患者在mRNA外顯子區(qū)域(尤其是CDSs)出現(xiàn)m5C位點的頻率更低(圖6C)。
圖6 NSUN2高或低水平CMML患者單核細胞中RNA m5C的轉錄組全分布
鑒于上述觀察結果,NSUN2 -低患者的m5C位點計數(shù)較低,作者進一步比較了m5C標記mRNA轉錄物的甲基化水平。作者觀察到NSUN2低患者的m5C水平顯著降低(圖6D)。與此一致的是,熱圖顯示大多數(shù)m5C修飾的轉錄本在NSUN2 -低患者中低甲基化(圖6E)。這些結果表明,低NSUN2水平導致CMML患者單核細胞中低m5C水平。基因集富集分析(Gene set enrichment analysis, GSEA)顯示炎癥反應途徑明顯被過度代表,并且與NSUN2-高患者相比,NSUN2-低患者的m5C差異呈強負相關(圖6F)。值得注意的是,CMML單核細胞的轉錄特征已被報道為高度炎癥,有助于惡性擴張,并反映白血病特異性和年齡相關的改變
11. 在SRSF2P95H突變的AML患者中,NSUN2而非NSUN6的低表達與預后不良顯著相關
接下來,作者探索了NSUN2在大量白血病患者中的表達水平,發(fā)現(xiàn)NSUN2在CMML和AML患者中的表達顯著下調(圖7A)。NSUN2在患者中的整體低表達促使作者研究NSUN2的臨床作用。
圖7 在SRSF2P95H突變的AML患者中,NSUN2低表達與預后不良相關
為了探索m5C相關基因在白血病中的臨床相關性,作者首先對246名AML患者(標記為“Bamopoulos等人”)組成的公共數(shù)據(jù)集進行了生存分析如先前報道,SRSF2P95H患者的總生存期(OS)比非P95H突變(稱為“WT”)患者短。然后,作者研究了m5C撰寫者NSUN2的豐度與患者預后之間的關系。NSUN2高、低WT患者的OS無顯著差異。然而,引人注目的是,NSUN2 -低SRSF2P95H組的預后明顯較差,1年生存率僅為20%(圖7B)。與此一致的是,單Cox比例風險回歸分析顯示,對于NSUN2低的SRSF2P95H突變患者,平均死亡風險比NSUN2高的患者高出約251%(圖7C)。這些發(fā)現(xiàn)通過另一個隊列(Beat AML隊列,36包含451個樣本)的分析得到驗證(圖7D, 7E)。接下來,作者評估了兩個AML隊列中四組患者中關鍵白血病相關基因的表達。在SRSF2P95H突變的NSUN2-低患者中,重要的是, ORM1和LCN2,37,38個已知與白血病發(fā)生和進展相關的癌基因的表達顯著升高(圖7F和7G)。
綜上所述,這些結果表明,在SRSF2P95H突變患者中,低表達NSUN2而非NSUN6與預后不良和部分癌基因低表達具有可重復性相關。這表明NSUN2作為SRSF2P95H突變AML患者預后標志物的潛在作用,并突出了NSUN2、SRSF2P95H和腫瘤發(fā)生之間未被認識的聯(lián)系。
總之,作者發(fā)現(xiàn)了一個以前未被識別的mRNA上m5C的讀者:SRSF2蛋白,它以參與剪接而為人所知,其殘基95 (P95H)突變與血液系統(tǒng)惡性腫瘤密切相關。此外,作者還發(fā)現(xiàn)了以前未知的NSUN2/m5C與SRSF2介導的RNA剪接之間的關聯(lián)。引人注目的是,在白血病患者中,NSUN2低表達,這與低m5C甲基化水平相關。低NSUN2與SRSF2突變同時發(fā)生預示預后不良。雖然從突變到疾病的途徑仍有待完全闡明,但作者的研究表明,SRSF2 m5C讀取器功能的損傷可能有助于白血病的進展??偟膩碚f,作者的數(shù)據(jù)確定了RNA修飾和一個重要的突變依賴因子之間未被識別的機制串擾。
實驗方法:
RNA干擾和轉染表達質粒,定點突變組氨酸標記,蛋白純化,m5C印跡質譜分析,逆轉錄酶定量PCR,RNA免疫沉淀,PAR-CLIP,MeRIP-seq,RNA- bis-seq。
參考文獻:
Ma HL, Bizet M, Soares Da Costa C, Murisier F, de Bony EJ, Wang MK, Yoshimi A, Lin KT, Riching KM, Wang X, Beckman JI, Arya S, Droin N, Calonne E, Hassabi B, Zhang QY, Li A, Putmans P, Malbec L, Hubert C, Lan J, Mies F, Yang Y, Solary E, Daniels DL, Gupta YK, Deplus R, Abdel-Wahab O, Yang YG, Fuks F. SRSF2 plays an unexpected role as reader of m5C on mRNA, linking epitranscriptomics to cancer. Mol Cell. 2023 Dec 7;83(23):4239-4254.e10. doi: 10.1016/j.molcel.2023.11.003. PMID: 38065062.