當(dāng)前, 絕大多數(shù)的轉(zhuǎn)錄組數(shù)據(jù)都是基于以Illumina平臺(tái)為代表的第二代高通量測(cè)序技術(shù)獲得的, 但是第二代測(cè)序技術(shù)無法提供大量的長(zhǎng)轉(zhuǎn)錄本并且丟失可變剪接等重要信息, 因而大大制約了轉(zhuǎn)錄組數(shù)據(jù)的深度利用.通過以PacBio為代表的第三代測(cè)序技術(shù), 可以獲得更長(zhǎng)乃至全長(zhǎng)轉(zhuǎn)錄組, 但由于PacBio轉(zhuǎn)錄組測(cè)序近幾年才剛興起, 只有少量的物種基于PacBio平臺(tái)獲得了轉(zhuǎn)錄組. PacBio全長(zhǎng)轉(zhuǎn)錄組測(cè)序, 在上才剛開展但發(fā)展很快, 其實(shí)驗(yàn)與數(shù)據(jù)分析標(biāo)準(zhǔn)和質(zhì)量控制方面的研究對(duì)于未來的大規(guī)模應(yīng)用至關(guān)重要.
來自南開大學(xué)生命科學(xué)學(xué)院等處的研究人員在上嘗試依據(jù)PacBio平臺(tái)試劑(P6/C4)優(yōu)化實(shí)驗(yàn)參數(shù), 設(shè)計(jì)質(zhì)量控制指標(biāo)并使全長(zhǎng)轉(zhuǎn)錄組測(cè)序標(biāo)準(zhǔn)化. 這篇文章基于一組昆蟲(麻皮椿)全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù), 對(duì)已取得的部分結(jié)果進(jìn)行報(bào)告,成果公布在《科學(xué)通報(bào)》上.
基因組和轉(zhuǎn)錄組測(cè)序是生命科學(xué)領(lǐng)域的基礎(chǔ)性工作. 由于絕大部分非模式生物缺乏基因組數(shù)據(jù), 全長(zhǎng)轉(zhuǎn)錄組測(cè)序就變得尤為重要, 全長(zhǎng)轉(zhuǎn)錄本可以大大促進(jìn)這些物種的基因功能、基因表達(dá)調(diào)控和進(jìn)化關(guān)系等多方面的基礎(chǔ)與應(yīng)用研究. 但是, 由于RNA易降解和不同的轉(zhuǎn)錄本表達(dá)量差異巨大等多種原因, 從總RNA中獲取盡量多的全長(zhǎng)轉(zhuǎn)錄本難度巨大. 當(dāng)前, 絕大多數(shù)的轉(zhuǎn)錄組數(shù)據(jù)都是基于第二代高通量測(cè)序技術(shù)獲得的, 第二代測(cè)序技術(shù)測(cè)序序列短, 短序列拼接無法提供大量的長(zhǎng)轉(zhuǎn)錄本并且丟失可變剪接等重要信息, 因而轉(zhuǎn)錄組的從頭測(cè)序開始采用PacBio第三代測(cè)序技術(shù).
PacBio RS系列測(cè)序儀, 是基于單分子實(shí)時(shí)(single molecule real time, SMRT)測(cè)序技術(shù)的單分子測(cè)序儀, 由美國(guó)Pacific Biosciences (PacBio)公司設(shè)計(jì)制造. PacBio RS Ⅱ型測(cè)序儀結(jié)合的P6/C4試劑(2014年8月15日推出), 可以獲得高達(dá)12000 bp平均長(zhǎng)度的測(cè)序讀段, 大大促進(jìn)了獲得完整基因組和全長(zhǎng)轉(zhuǎn)錄組的能力.
根據(jù)公開發(fā)表的文獻(xiàn), 只有少量物種基于PacBio平臺(tái)獲得了轉(zhuǎn)錄組: 這其中包括第二、三代測(cè)序混合拼接或第二代矯正第三代技術(shù)獲得的人的類淋巴母細(xì)胞[和丹參(Salvia miltiorrhiza)轉(zhuǎn)錄組數(shù)據(jù); *基于PacBio平臺(tái)獲得的轉(zhuǎn)錄組絕大部分來自人類, 另外也有HIV 的病毒、牛(Bovine)、小鼠(Mus musculus)和克氏冕狐猴(Propithecus coquereli)等; 然而, 基于PacBio平臺(tái)的全長(zhǎng)轉(zhuǎn)錄組測(cè)序方面的研究, 上才剛開展, 直到2015年才有真菌(Fungi)、四倍體棉花(Gossipium hirsutum)和歐洲烏賊(Sepia officinalis)等物種測(cè)序.
這項(xiàng)研究在大量實(shí)驗(yàn)與數(shù)據(jù)分析的基礎(chǔ)上, 在上嘗試依據(jù)PacBio平臺(tái)試劑(P6/C4)優(yōu)化實(shí)驗(yàn)參數(shù), 設(shè)計(jì)質(zhì)量控制指標(biāo)并使全長(zhǎng)轉(zhuǎn)錄組測(cè)序標(biāo)準(zhǔn)化.文章報(bào)道的部分研究結(jié)果基于一組昆蟲(麻皮椿(Erthesina fulloThunberg))全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)但不限于昆蟲, 具有更為普遍的意義.

文章指出,PacBio平臺(tái)發(fā)展迅猛, 其測(cè)序長(zhǎng)度和通量的增加潛力依然巨大, 有可能替代第二代測(cè)序技術(shù), 成為基因組和轉(zhuǎn)錄組從頭測(cè)序的. 未來的轉(zhuǎn)錄組測(cè)序優(yōu)選方案是基于PacBio平臺(tái)獲得樣品的全長(zhǎng)轉(zhuǎn)錄組, 而后以全長(zhǎng)轉(zhuǎn)錄組為參考應(yīng)用Illumina雙端測(cè)序數(shù)據(jù)定量. PacBio全長(zhǎng)轉(zhuǎn)錄組測(cè)序在建立標(biāo)準(zhǔn)流程, 優(yōu)化實(shí)驗(yàn)參數(shù)和質(zhì)量控制方面的研究將是未來基因組學(xué)領(lǐng)域的一個(gè)重要研究方向.
深圳子科生物科技有限公司編輯!