導(dǎo)語:
細(xì)胞外囊泡(EVs)作為臨床相關(guān)生物標(biāo)志物的來源具有巨大潛力,因?yàn)樗鼈兛梢院苋菀椎貜纳锪黧w中分離出來,并攜帶可反映疾病狀況的microRNA(miRNA),mRNA和蛋白質(zhì)。但是,EV內(nèi)含物的生物學(xué)和技術(shù)性可變性是未知的,這使得健康受試者與患者之間的比較難以解釋。在這項(xiàng)研究中,作者試圖建立一個實(shí)驗(yàn)性和生物信息學(xué)分析渠道,以分析患者血清EVs中的小RNA含量,并評估健康個體中EVs的RNA含量的生物學(xué)和技術(shù)差異,說明這些小RNA可以用作生物標(biāo)記。
技術(shù)路線:
1.細(xì)胞外囊泡的提取及其特征鑒定
2.對5個健康供體分離的EV進(jìn)行了小RNA Seq以評估生物變異
3.對每個供體進(jìn)行了5個重復(fù)的小RNA Seq,以評估技術(shù)變異
4.spikein分析揭示了Truseq方法的測序偏差
5.文庫的選擇影響RNAseq檢測的miRNA序列
研究結(jié)果:
1.從5例健康供體的1毫升血清中分離出EV。透射電鏡顯示完整的圓形顆粒,顆粒一般小于200nm。用動態(tài)光散射法測定其粒徑分布,發(fā)現(xiàn)其峰值約為200nm左右。通過流式細(xì)胞術(shù)觀察到Annexin V和CD81的存在,但無法檢測到CD9或CD63的存在,且表明脂蛋白復(fù)合物出現(xiàn)的頻率較低。我們發(fā)現(xiàn)Alix存在于分離物中,而ApoB不存在。來自患者樣本的代表性電圖顯示了使用exoRNeasy試劑盒獲得的RNA的大小分布,這表明該方法產(chǎn)生了預(yù)期的RNA大小分布輪廓。
2.為了解決EV小RNA Seq的技術(shù)和生物學(xué)變異,對從5個健康供體分離的EV進(jìn)行了小RNA Seq,以評估生物變異,并對每個供體的5個重復(fù)進(jìn)行了小RNA Seq,以評估技術(shù)變異。此外,在5個供體中加入了52個濃度為1X或2X的合成spikein,以評估文庫制備方法的敏感性和特異性。使用主成分分析評估數(shù)據(jù)集內(nèi)數(shù)據(jù)可變性的來源。這種非監(jiān)督分析表明,給定供體的技術(shù)重復(fù)之間的差異遠(yuǎn)遠(yuǎn)小于個體間的差異。采用兩兩離散點(diǎn)圖來測量同一供體重復(fù)之間的技術(shù)方差,估計(jì)供體之間的技術(shù)方差平均為0.25%(0.10- 10 0.50%)。雖然個體間方差大于技術(shù)方差,但未超過健康受試者與類風(fēng)濕關(guān)節(jié)炎(RA)患者之間的差異。表明該方法能夠識別健康人群與患者人群之間的差異。
3. 摻有1X和2X數(shù)量的合成寡核苷酸的樣品用于評估文庫制備中的miRNA偏倚。每個樣品(1X或2X)被測序3次以創(chuàng)建總共6個文庫,每組三個樣品的平均值用于分析。具有1X和2X的樣品在所有方面都是相同的,除了摻入的濃度不同。我們通過繪制1x和2x樣品的已知輸入濃度與輸出讀數(shù)的關(guān)系圖,分析了52個刺入的讀數(shù)數(shù),以評估文庫制備方法的完整性。我們在圖3(a)中顯示了1X的三個重復(fù)樣本的輸入尖峰濃度與RNA-Seq輸出讀數(shù)之間的相關(guān)性。在沒有偏見的情況下,我們預(yù)計(jì)輸入的刺入濃度與測序后的輸出刺入讀數(shù)數(shù)量相關(guān)(接近藍(lán)色所示的最佳擬合線)。但是,我們觀察到輸入濃度和輸出讀數(shù)之間的相關(guān)性很差(R2 = 0.30),表明該方法存在問題。對三個原始供體的一個子集進(jìn)行了一項(xiàng)后續(xù)研究,每個供體包含三個技術(shù)重復(fù)(總共九個樣品),在其中添加了1倍的摻混混合物。然后使用Illumina Truseq小RNA方案或針對小RNA的Bioo Scientific Nextflex方案對9個樣品中的每一個進(jìn)行測序。從第二個研究中獲得的加標(biāo)讀物從所有文庫中提取出來,并通過方案與輸入濃度進(jìn)行比較,結(jié)果表明Nextflex方案在整個輸入濃度范圍內(nèi)具有線性范圍,總體相關(guān)性為0.67,而Truseq的相關(guān)性為0.33。此外,在Truseq和Nextflex方案之間,通過卡方檢驗(yàn)(p值<0.0001),輸出讀數(shù)與輸入濃度之間的相關(guān)性在統(tǒng)計(jì)上有顯著差異。因此,Nextflex方案產(chǎn)生的結(jié)果更適合引入的尖峰濃度。
4. 為了進(jìn)一步評估Truseq和Nextflex文庫制備方法之間的差異,比較了每個協(xié)議生成的讀操作。由供體標(biāo)記的校正數(shù)據(jù)集的主成分評分圖顯示,供體聚集的樣本符合預(yù)期。然而,kit的選擇也影響聚類,無論是生物方差還是kit的選擇有助于數(shù)據(jù)集的可變性。此外發(fā)現(xiàn),與Truseq試劑盒相比,Nextflex試劑盒在供體中識別出了大約150多個獨(dú)特的mirna,。然而,Truseq方案比Nextflex方案產(chǎn)生了更大比例的miRNA,這一差異具有統(tǒng)計(jì)學(xué)意義,表明后者可能過度表達(dá)了某些miRNA序列而遺漏了其他miRNA,這與spikein分析一致。
使用Truseq和Nextflex方法生成的數(shù)據(jù)集的技術(shù)差異非常小。但試劑盒之間的相關(guān)性較差,相關(guān)系數(shù)很少大于0.55。因此,不能直接比較不同協(xié)議生成的數(shù)據(jù)。對兩種文庫制備方案獲得的所有轉(zhuǎn)錄本進(jìn)行了差異表達(dá)分析。差異表達(dá)分析顯示兩種方案之間有1075個轉(zhuǎn)錄本存在顯著差異?;鹕綀D的差異表達(dá)基因顯示大部分的顯著差異是基于>雙重的表情變化和p值小于0.05,與前100個差異表達(dá)基因的熱圖顯示這些記錄的表達(dá)水平差別很大。
對10個差異表達(dá)的miRNA進(jìn)行了定量PCR (qPCR),其中包括前5位上調(diào)和前5位下調(diào)的miRNA。將qPCR數(shù)據(jù)轉(zhuǎn)化為miRNA豐度并與Truseq和Nextflex方法中相同miRNA的reads進(jìn)行比較。所有基因在Nextflex協(xié)議中都有可檢測的讀計(jì)數(shù),但在Truseq (log (TMM歸一化讀)>1)中只有5/10可檢測到。根據(jù)qPCR,未被Truseq方案檢測到的5個miRNA分子中,沒有一個是低豐度的,這與Truseq文庫制備方法存在方法學(xué)偏差一致,而不是較差的檢測下限。此外,還計(jì)算了qPCR和每個文庫制備試劑盒之間的Pearson相關(guān)性。Truseq和Nextflex的相關(guān)系數(shù)分別為0.05和0.1。因此,在這兩種庫準(zhǔn)備方法中,Nextflex方法生成的數(shù)據(jù)更有可能反映mirna的表達(dá)水平。
總結(jié):
使用Illumina Truseq方法對來自多個人的EV小RNA進(jìn)行了測序(生物學(xué)重復(fù)),并每個人進(jìn)行了多個重復(fù)的測序(技術(shù)重復(fù))。我們觀察到受試者聚集樣本的重復(fù)數(shù)表明,生物變異(約95%)大于技術(shù)變異(約0.50%)。我們觀察到約30%的測序讀段是miRNA。我們通過將EV RNA制備物摻入合成的小RNA混合物來評估測序的技術(shù)參數(shù),并證明了添加RNA的投入濃度和測序Read的頻率之間有脫節(jié),這表明在文庫制備過程中引入了偏差。為了確定文庫制備平臺之間是否存在差異,我們將Truseq與Nextflex方法進(jìn)行了比較,旨在減少文庫制備偏差。盡管這兩種方法在技術(shù)上都非??煽?,但Nextflex方法降低了偏差,并且合成spike-ins的輸入濃度呈現(xiàn)出線性分布??傊?,我們的結(jié)果表明,技術(shù)變異性遠(yuǎn)小于生物學(xué)變異性,從而支持了將EV小RNA用作潛在的生物標(biāo)記。我們的研究結(jié)果還表明,文庫制備方法的選擇導(dǎo)致數(shù)據(jù)的人為差異,從而導(dǎo)致通過文庫制備平臺的測序數(shù)據(jù)的可比性失效。