你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!
發(fā)布時(shí)間:2023-06-05
瀏覽次數(shù):0
廢話寫在上面
我可能不適合做科研,因?yàn)槲铱偸窃诤跻恍安槐匾钡臇|西~
剛開始接觸二代測(cè)序的時(shí)候,我是跟著Jimmy的前輩們開始接觸RNA-seq的。 當(dāng)時(shí)用的對(duì)比工具是..當(dāng)時(shí)并沒有想太多為什么要用這個(gè)工具。 你說了,我就用了,所以它成了我最喜歡的比較工具。
但是,由于我需要處理不同的數(shù)據(jù),我發(fā)現(xiàn)它不能滿足我的要求。 我可能需要考慮其他工具,但是我無從下手,也不知道哪些工具更適合我。 于是一場(chǎng)不考慮生物學(xué)意義,只考慮器具特性的戰(zhàn)斗就此拉開序幕……
看系列太長(zhǎng)了,廢話系列太多
其實(shí)我每次都說這是超級(jí)扯蛋系列,但是我真的很希望大家認(rèn)真看一下這部分內(nèi)容。 其實(shí)我能力有限,短短幾句話很難聽懂我想說什么,除非我寫文言文……
DNA-seq&RNA-seq
搜索了各種帖子,發(fā)現(xiàn)大家在比較工具的時(shí)候,喜歡把它們分為DNA比對(duì)工具(DNA-seq)和RNA比對(duì)工具(RNA-seq)。 仔細(xì)想想,你會(huì)發(fā)現(xiàn)它們的區(qū)別只是會(huì)不會(huì)考慮跨外顯子的比對(duì)(即:未比對(duì)的reads是否會(huì)split,split后的兩部分會(huì)重新比對(duì))。
隨著現(xiàn)在各種類型seq的出現(xiàn),我們已經(jīng)不能簡(jiǎn)單的根據(jù)比對(duì)DNA還是RNA來判斷工具的選擇,而是判斷reads的比對(duì)是否需要跨越外顯子。 比如PRO-seq/GRO-seq,他們?cè)诮◣?kù)的時(shí)候捕獲RNA,但是不需要考慮跨外顯子的比對(duì)。
廢話那么多,下面簡(jiǎn)單總結(jié)一下常用工具有哪些各類:
以上都是我自己用過的,沒用過的也不是我常用的,這里就不做對(duì)比了
&
它出現(xiàn)在古代(意思是很久以前),當(dāng)時(shí)測(cè)序行業(yè)發(fā)展還不成熟,序列厚度普遍在50bp以下,所以出現(xiàn)時(shí)滿足50bp以下寬度的reads比對(duì)。 官方表示,它可以快速將短 DNA 序列(35bp)與人類基因組進(jìn)行比較。
而它的出現(xiàn)填補(bǔ)了公司的短板。 擅長(zhǎng)比較長(zhǎng)度為50-100 bp的reads,寬度甚至可以達(dá)到1000。適合比較這些比較長(zhǎng)的基因組,比如養(yǎng)護(hù)植物的基因組。
推論:and,是兩種不同類型的比較工具,不是升級(jí)。 不同長(zhǎng)度大小不一,適用于寬度小于50b的reads的比對(duì),適用于寬度為50-100b甚至更長(zhǎng)的reads的比對(duì)。而且這兩個(gè)都是DNA -seq比較工具
和
/ 工具本身不進(jìn)行比較,它通過調(diào)用 / 來完成。 關(guān)鍵是它不是best的升級(jí)版,而是best的升級(jí)版。 所以只能調(diào)用,除了調(diào)用(默認(rèn)),還可以修改設(shè)置調(diào)用。
調(diào)用 / 后,它會(huì)首先使用 / 對(duì)齊序列。 對(duì)于沒有比對(duì)的,會(huì)考慮外顯子交叉的可能性,將reads拆分,重新比對(duì)。
如果你去//的官網(wǎng)仔細(xì)觀察,你會(huì)發(fā)現(xiàn)他們每個(gè)人都有自己的官網(wǎng),都有自己的介紹。 但是Tohat不一樣,它只有一個(gè),并且在2012年4月9日才發(fā)布了2.0.0版本,公布了支持對(duì)比。 我們一般稱之為支持版本。
據(jù)悉,如果你夠無聊dnastar序列比對(duì),上下滾動(dòng)他們的主頁(yè),你會(huì)發(fā)現(xiàn)無論是2019年還是2019年,一直都有更新。而2016年2月就停止更新了。。。為什么?請(qǐng)看以下部分
原作者不知道是什么原因dnastar序列比對(duì),所以不再更新,而是開發(fā)了一個(gè)新的對(duì)比工具,推薦大家使用,號(hào)稱速度更快,顯存占用率更小,而且具有更高的準(zhǔn)確率。
據(jù)悉,除了支持RNA-seq比對(duì)外,還支持DNA-seq比對(duì)。 唯一需要做的就是添加一個(gè)參數(shù)--no--。 目前,大多數(shù)人將其用于 RNA-seq,沒有人將其用于 DNA-seq
BWA
雖然說的不多,但是是我知道的第一個(gè)比對(duì)工具,屬于DNA-seq比對(duì)工具。 雖然全基因組或者全基因組大部分都是用BWA來進(jìn)行比對(duì)的。 那時(shí)候大學(xué)里有一門課叫估算生物學(xué)。 當(dāng)時(shí)在學(xué)習(xí)BWT算法的時(shí)候,經(jīng)常把算法的名字和對(duì)比工具的名字搞混。
值得一提的是,這個(gè)工具是李衡開發(fā)的。 不認(rèn)識(shí)李衡,至少應(yīng)該知道工具吧。 這個(gè)工具也是李衡發(fā)明的。 一個(gè)強(qiáng)大的可怕的女人...
星星
第一次看到這個(gè)工具的名字是在第一次研究期間,當(dāng)時(shí)確實(shí)有點(diǎn)懵。 當(dāng)時(shí)覺得是個(gè)很冷門的野雞工具。 后來發(fā)現(xiàn)身邊很多人都在用這個(gè)工具,于是懷著好奇的心情上網(wǎng)搜索了一下它的資料。
如果你不搜索,你不知道。 如果你搜索,你會(huì)感到震驚。 嘖嘖嘖,皇室用的RNA-seq比對(duì)工具,真香……
幾種RNA-seq工具的比較
可能是因?yàn)镽NA-seq分析比較流行,所以大部分的對(duì)比工具都是使用RNA-seq的效率來進(jìn)行對(duì)比。
《-RNA-seq》這篇文章堪稱史上最全面的RNA-seq評(píng)測(cè)。 比較了RNA-seq的各個(gè)方面。 因?yàn)樘媪?,有點(diǎn)亂,所以只關(guān)注一些自己感興趣的地方。
不管是還是STAR,對(duì)于Toph來說都有很大的優(yōu)勢(shì),即使Toph不持續(xù)更新,這也是我們不用它的一個(gè)更強(qiáng)大的理由。 至于,他的正確率是最高的,敏感度比較低。 STAR比較敏感,會(huì)出現(xiàn)很多包含soft-clip的低質(zhì)量比對(duì)。 據(jù)悉,STAR的比例最高。 對(duì)于雙端測(cè)序的reads,要么比較所有的reads,要么全部丟棄。 它不僅會(huì)比較某些讀取像和
最后,這篇文章也給出了一種自己認(rèn)為比較好的RN-seq的組合形式:
前段時(shí)間龍星課程給出了RNA-seq的另一種組合形式:SATR+RSEM,其中STAR既可以用于比對(duì)也可以用于定量(計(jì)數(shù))
選擇哪種組合取決于習(xí)慣、眼神交流和心情……
文末有廣告
一鍵讓我有一點(diǎn)收入
您的點(diǎn)擊是我的動(dòng)力
您不考慮訂購(gòu)廣告嗎?
參考
如有侵權(quán)請(qǐng)聯(lián)系刪除!
Copyright ? 2023 江蘇優(yōu)軟數(shù)字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服務(wù)提供商
13262879759
微信二維碼