piRNAclusterDB 2.0:一個(gè)piRNA簇?cái)?shù)據(jù)庫(kù)

欄目:最新研究動(dòng)態(tài) 發(fā)布時(shí)間:2022-04-24
該數(shù)據(jù)庫(kù)收集了51 個(gè)物種的 >350 個(gè)SRA數(shù)據(jù)集,總共包含 >15 000 個(gè) piRNA 簇。其中包括軟體動(dòng)物、節(jié)肢動(dòng)物、魚(yú)類......


PIWI 相互作用的 RNA (piRNA) 及其伙伴 PIWI 蛋白保護(hù)動(dòng)物種系免受轉(zhuǎn)座因子的侵害,并在生育能力中發(fā)揮關(guān)鍵作用。過(guò)去的大量研究揭示了 piRNA 通路的許多附加功能,主要用于調(diào)節(jié)一系列靶序列,包括轉(zhuǎn)座因子、蛋白質(zhì)編碼基因和長(zhǎng)鏈非編碼 RNA。這些靶標(biāo)可以在轉(zhuǎn)錄水平和轉(zhuǎn)錄后進(jìn)行調(diào)節(jié),并且通過(guò) piRNAs 的序列互補(bǔ)性來(lái)識(shí)別,piRNAs 將其相關(guān)的 PIWI 蛋白引導(dǎo)至其目的地。雖然在脊椎動(dòng)物中 PIWI/piRNA 途徑主要局限于生殖系,但在節(jié)肢動(dòng)物和軟體動(dòng)物等無(wú)脊椎動(dòng)物群中,piRNA 還普遍存在于體細(xì)胞組織中。

產(chǎn)生 piRNA 的基因座,稱為 piRNA 簇,被認(rèn)為位于 PIWI 通路的中心。這些基因座從一條或兩條 DNA 鏈轉(zhuǎn)錄成大的前體 RNA,當(dāng)它們加載到 PIWI 蛋白上時(shí),它們又被加工成 23-31 nt的成熟 piRNA。在迄今為止研究的所有物種中,piRNA 簇進(jìn)化迅速,在進(jìn)化時(shí)間尺度上出現(xiàn)和消失的速度相當(dāng)快,在序列水平上呈中性進(jìn)化。因此,每個(gè)物種都有一組獨(dú)特的 piRNA 簇,在譜系之間共享不同數(shù)量的同源簇。piRNA 簇在物種內(nèi)高度分化,在體細(xì)胞piRNA 簇在不同組織中表現(xiàn)出不同的表達(dá)水平。

近期,德國(guó)研究團(tuán)隊(duì)建了一個(gè)piRNA 簇?cái)?shù)據(jù)庫(kù):piRNAclusterDB 2.0https://www.smallrnagroup.uni-mainz.de/piRNAclusterDB),該數(shù)據(jù)庫(kù)相關(guān)文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為piRNAclusterDB 2.0: update and expansion of the piRNA cluster database。該數(shù)據(jù)庫(kù)收集了51 個(gè)物種的 >350 個(gè)SRA數(shù)據(jù)集,總共包含 >15 000 個(gè) piRNA 簇。其中包括軟體動(dòng)物、節(jié)肢動(dòng)物、魚(yú)類、兩棲動(dòng)物、爬行動(dòng)物、鳥(niǎo)類和哺乳動(dòng)物。

界面的主要入口點(diǎn)是物種選擇器,它表示為一個(gè)交互式系統(tǒng)發(fā)育樹(shù),包含有關(guān)分類學(xué)、piRNA 簇?cái)?shù)和簇 piRNA 序列總量的附加信息。還提供了指向我們分析中使用的相應(yīng)基因組組裝數(shù)據(jù)的鏈接,包括基因組、基因集 (GFF) 和重復(fù)掩碼文件。染色體上 piRNA 簇位置的圖形表示與每個(gè)物種中 piRNA 簇的數(shù)量相關(guān)聯(lián)。此外,我們還提供了與數(shù)據(jù)庫(kù)的小 RNA (sRNA) 數(shù)據(jù)集相關(guān)的所有出版物的完整列表,包括 PubMed ID 和直接鏈接。

                                               

選擇物種后,用戶在瀏覽器中沿著所選物種的所有數(shù)據(jù)集瀏覽產(chǎn)生 piRNA 的基因座??捎没蜃诹斜碇刑峁в锌蛇x擇的 piRNA ID,其中包含有關(guān)位置、大小。最后,可以單獨(dú)選擇和取消選擇每個(gè) SRA 數(shù)據(jù)集,以生成跨不同數(shù)據(jù)集、組織或發(fā)育階段的 piRNA 簇表達(dá)的自定義視圖。



數(shù)據(jù)庫(kù)的第三部分詳細(xì)分析了來(lái)自選定物種的每個(gè) SRA 數(shù)據(jù)集的處理、過(guò)濾、映射和注釋的 sRNA 讀數(shù),這些數(shù)據(jù)由 unitas生成。SRA 數(shù)據(jù)集可從一個(gè)列表中選擇,該列表包括有關(guān)來(lái)源組織、讀取次數(shù)和相關(guān)出版物的 PubMed ID 的信息。對(duì)于每種帶注釋的 RNA 類型,例如 miRNA、rRNA、tRNA 衍生的 sRNAlncRNA、mRNA 等。此外,還為總 sRNA 讀數(shù)和 piRNA 讀數(shù)提供了關(guān)于讀數(shù)組成、長(zhǎng)度分布、位置核苷酸組成和乒乓簽名的圖形輸出,從而可以深入了解每個(gè) SRA 數(shù)據(jù)集的 sRNA 構(gòu)成以及 piRNA 對(duì)總讀取池。