高低溫試驗箱三代測序技術(shù)PacBio和O |
| 發(fā)布者:無錫瑪瑞特科技有限公司 發(fā)布時間:2021/2/1 16:58:51 點擊次數(shù):370 關(guān)閉 |
三代測序技術(shù)(PacBio和Oxford Nanopore)可解決基因組重復(fù)區(qū)域的組裝難題,提高基因組完整性,已成為發(fā)育、再生、腫瘤和其它疾病過程中細(xì)胞基因組組裝的主流技術(shù)。其中,納米孔(Nanopore)測序技術(shù)的迅速發(fā)展更使得測序成本顯著降低,并且由于其可實現(xiàn)超長讀長(高達(dá)1Mbp),在復(fù)雜基因組組裝中具有天然優(yōu)勢。然而,高低溫試驗箱目前Nanopore的測序錯誤分布廣泛(10-30%,圖1A),存在高錯誤局部區(qū)域(1000bp中存在50%測序錯誤,圖1B),并且高錯誤局部區(qū)域的發(fā)生隨著測序讀長增加而顯著增加(圖1C),從而導(dǎo)致超長文庫數(shù)據(jù)中20-30%的序列存在高錯誤區(qū)域,F(xiàn)有的錯誤校正軟件只能通過裁剪的方式剔除高錯誤局部區(qū)域,顯著降低了Nanopore序列完整性和組裝完整性。 研究者提出了漸進(jìn)式序列校正策略,高低溫試驗箱首先選擇高精度的序列校正錯誤率的區(qū)域(圖2B),高低溫試驗箱之后優(yōu)選校正后高精度序列校正高錯誤局部區(qū)域,從而保證了序列校正速度和完整性(圖2C);另外,研究者還提出漸進(jìn)式組裝策略,通過校正后高精度的序列組裝基因組骨架(圖2D),之后通過原始序列提升基因組完整度(圖2E),從而保證基因組組裝結(jié)果的正確性和完整性。研究者將上述模型開發(fā)了NECAT軟件,開放給國內(nèi)外其它科研人員,進(jìn)行長達(dá)1年的體驗提升。 隨后,研究者收集了多種模式生物Nanopore數(shù)據(jù)集進(jìn)行性能測試,結(jié)果表明:NECAT校正后序列平均精度可達(dá)95-98%,可恢復(fù)原始數(shù)據(jù)中99%的高錯誤局部區(qū)域(HERS),從而保留了序列長度完整性(表1);NECAT組裝完整性明顯高于同類校正組裝軟件,且組裝錯誤量顯著低于同類軟件。另外,研究者將NECAT校正結(jié)果與多個組裝軟件結(jié)合使用發(fā)現(xiàn):NECAT校正結(jié)果顯著提高其它Nanopore組裝軟件的組裝質(zhì)量。 后,研究者完成了視網(wǎng)膜母細(xì)胞瘤Nanopore測序,并應(yīng)用NECAT組裝出了完整度較高母細(xì)胞瘤癌癥基因組,通過組裝結(jié)果發(fā)現(xiàn)了很多高精度結(jié)構(gòu)變異(SV)位點,其很多位點都與目前實驗報道和功能預(yù)測相符(圖3)。與原始數(shù)據(jù)SV檢測方法相比,NECAT組裝結(jié)果檢測SV精度顯著高于目前SV檢測方法。高低溫試驗箱上述結(jié)果表明,通過NECAT序列校正,顯著降低高錯誤區(qū)域所造成的SV假陽性結(jié)果。 綜上所述,本研究提出的漸進(jìn)式校正組裝方法可以有效解決了Nanopore復(fù)雜測序錯誤問題,顯著提高了Nanopore數(shù)據(jù)組裝完整性、正確性和數(shù)據(jù)利用率。另外,通過NECAT序列校正,可以有效降低高錯誤區(qū)域SV的假陽性。(生物谷 本網(wǎng)站所有注明“來源:生物谷”或“來源:bioon”的文字、圖片和音視頻資料,版權(quán)均屬于生物谷網(wǎng)站所有。非經(jīng)授權(quán),任何媒體、網(wǎng)站或個人不得轉(zhuǎn)載,否則將追究法律責(zé)任。取得書面授權(quán)轉(zhuǎn)載時,須注明“來源:生物谷”。其它來源的文章系轉(zhuǎn)載文章,本網(wǎng)所有轉(zhuǎn)載文章系出于傳遞更多信息之目的,高低溫試驗箱轉(zhuǎn)載內(nèi)容不代表本站立場。不希望被轉(zhuǎn)載的媒體或個人可與我們聯(lián)系,我們將立即進(jìn)行刪除處理。 溫馨提示:87%用戶都在生物谷APP上閱讀,掃描立刻下載! 天天精彩! 下載生物谷app,隨時評論、查看評論與分享,高低溫試驗箱或掃描上面二維碼下載相關(guān)閱讀
Science子刊:我國科學(xué)家基于全基因組篩選鑒定出促進(jìn)細(xì)胞衰老的基因KAT7 |

