大約 1% 的人類基因組能夠折疊成 G 四鏈體 (G quadruplexes,G4s)——在富含 G 的基序上形成的非經(jīng)典鏈特異性 DNA 結(jié)構(gòu)。G4 的熱穩(wěn)定性不同,這可能會(huì)影響它們的功能。然而,G4s 也可能阻礙復(fù)制、轉(zhuǎn)錄和翻譯,并可能增加基因組的不穩(wěn)定性和突變率。因此,根據(jù)其基因組位置、熱穩(wěn)定性和功能性,G4 基因座可能會(huì)在不同的選擇壓力下進(jìn)化,而這一點(diǎn)從未被研究過。
一、基因組中 G4 基因座的密度不均勻
與全基因組平均值相比,CpG 島、上游區(qū)域和轉(zhuǎn)錄鏈的 G4 密度的倍數(shù)差異特別高:分別為 12.3、4.98 和 4.11。相比之下,內(nèi)含子的非轉(zhuǎn)錄和轉(zhuǎn)錄鏈、非轉(zhuǎn)錄外顯子鏈和 3' UTR 的非轉(zhuǎn)錄鏈具有 G4密度接近全基因組平均值;校正 G 含量總體趨勢不變,復(fù)制起點(diǎn)和增強(qiáng)子具有特別高的 G4 密度:分別比全基因組平均值高 6.88 倍和 3.03 倍。
二、G4 穩(wěn)定性在基因區(qū)和非基因功能區(qū)之間存在差異
根據(jù)穩(wěn)定性得分將G4基因座分為2組,高于19分的為“穩(wěn)定G4基因座”(342778個(gè)),低于19分的為“不穩(wěn)定G4基因座”(327298個(gè)),繪制穩(wěn)定性得分分布圖:
三、G4功能受到不同基因區(qū)域的限制
HKT檢驗(yàn)顯示,G4 基因座的進(jìn)化取決于它們位于哪個(gè)基因組件內(nèi)。 G4基因座在上游、下游基因區(qū)域、5' UTR、3' UTR的優(yōu)勢比顯著大于1。位于增強(qiáng)子、復(fù)制起點(diǎn)以及在TAD邊界區(qū)域的G4 基因座優(yōu)勢比都很高,這一發(fā)現(xiàn)表明這三種區(qū)域的G4基因座是有功能的。
這項(xiàng)工作表明, G4 的覆蓋率、密度、預(yù)測穩(wěn)定性和選擇壓力取決于它們所在的基因成分和非基因功能區(qū)域。自然選擇在基因組的某些功能區(qū)域中保持了高密度的 G4 位點(diǎn)和高穩(wěn)定性的 G4 結(jié)構(gòu),以及在其他功能區(qū)中保持低密度和低穩(wěn)定性。每個(gè)特定區(qū)域組的情況可能取決于維持功能性 G4 的選擇壓力與容納此類結(jié)構(gòu)的成本之間的平衡。