新聞中心
今天就跟大家聊聊有關(guān)怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
創(chuàng)新互聯(lián)為企業(yè)級(jí)客戶提高一站式互聯(lián)網(wǎng)+設(shè)計(jì)服務(wù),主要包括網(wǎng)站建設(shè)、成都網(wǎng)站制作、重慶APP開發(fā)公司、微信小程序開發(fā)、宣傳片制作、LOGO設(shè)計(jì)等,幫助客戶快速提升營銷能力和企業(yè)形象,創(chuàng)新互聯(lián)各部門都有經(jīng)驗(yàn)豐富的經(jīng)驗(yàn),可以確保每一個(gè)作品的質(zhì)量和創(chuàng)作周期,同時(shí)每年都有很多新員工加入,為我們帶來大量新的創(chuàng)意。
早在2013年的時(shí)候, 就已經(jīng)有科學(xué)家提出了利用Hi-C數(shù)據(jù)來輔助基因組組裝的思路,可以將scaffold進(jìn)一步提升到染色體級(jí)別的長(zhǎng)度,并提供了配套的分析軟件LACHESIS
。該軟件默認(rèn)輸入的基因組組裝結(jié)果完全正確,后續(xù)的操作都是建立在這個(gè)前提下。然而實(shí)際情況中,受到組裝算法的限制,基因組草圖中會(huì)存在拼接錯(cuò)誤的情況。
分析思路: 首先會(huì)根據(jù)hi-c數(shù)據(jù)的結(jié)果,對(duì)輸入的基因組組裝結(jié)果中的拼接錯(cuò)誤進(jìn)行校正,然后在進(jìn)行后續(xù)分析,整個(gè)pipeline如下圖所示
可以分成以下4個(gè)大的步驟
preliminary filtration
misjoin correction
ordering and orientation
overlap merging
第一步首先對(duì)基因組組裝的結(jié)果進(jìn)行預(yù)處理,去除長(zhǎng)度太短的scafflod。長(zhǎng)度過短的scaffold在hi-c圖譜中對(duì)應(yīng)的交互信息會(huì)非常的少,沒有足夠的交互信息無法有效的進(jìn)行后續(xù)分析;第二步利用hi-c數(shù)據(jù)校正scaffold中存在的拼接錯(cuò)誤,對(duì)于檢測(cè)到存在拼接錯(cuò)誤的scaffold, 將其切割為存在拼接錯(cuò)誤的inconsistent
部分和未檢測(cè)到拼接錯(cuò)誤的consistent
部分,inconsistent
部分不會(huì)進(jìn)行后續(xù)分析。
第三步確定歸屬同一條染色體的scaffold,并進(jìn)行排序和調(diào)整方向;第四步檢測(cè)同一條染色體上的scaffold間是否存在overlap, 對(duì)于存在overlap的scaffold, 進(jìn)行merge。
應(yīng)用該算法結(jié)合hi-c數(shù)據(jù)對(duì)埃及伊蚊的基因組結(jié)果重新組裝后,效果如下所示
可以看到,由最初的草圖組裝到了最終的染色體級(jí)別。該算法對(duì)任意的基因組組裝都是適用的,值得一提的是該文章指出,通過hi-c數(shù)據(jù)輔助基因組組裝得到的最終結(jié)果中,還是會(huì)存在部分的錯(cuò)誤結(jié)果,這個(gè)是不可避免的。
看完上述內(nèi)容,你們對(duì)怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。
文章題目:怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝
文章來源:http://www.ef60e0e.cn/article/ijiehd.html