你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!
發(fā)布時(shí)間:2023-08-19
瀏覽次數(shù):0
在上一篇文章中,我們過濾了數(shù)據(jù)質(zhì)量控制,所以現(xiàn)在我的下一步是進(jìn)行比較。 在進(jìn)行比較之前,我們需要先了解一下比較的目的是什么? RNA-Seq數(shù)據(jù)比較和DNA-Seq數(shù)據(jù)比較有什么區(qū)別?
RNA-Seq 數(shù)據(jù)分析有多種類型,例如尋找差異表達(dá)基因或?qū)ふ倚碌奶娲艚印?如果您正在尋找不同表達(dá)的基因,您只需要確定不同的讀取技術(shù)即可。 我們可以使用bwa這樣的比較工具,或者像這樣的免對齊工具,但前者更快。
如果您需要尋找新的或替代的 RNA 剪接,您需要 STAR 等工具來查找剪接位點(diǎn)。 由于RNA-Seq與DNA-Seq不同,當(dāng)DNA轉(zhuǎn)錄為mRNA時(shí),內(nèi)含子被部分去除。 因此dnastar序列比對,如果mRNA倒轉(zhuǎn)的cDNA無法與參考序列進(jìn)行比較,則會將其分離并重新比對,以確定中間是否有內(nèi)含子。
本文的重點(diǎn)
下載索引
索引
比較
1.下載索引
通常有現(xiàn)成的索引可供人類使用。 我建議你嘗試下載現(xiàn)成的,使用服務(wù)器自己創(chuàng)建索引,這會花費(fèi)很長的時(shí)間。
#切換到工作目錄,并創(chuàng)建index文件夾
master@master:~$?cd?User/Projects/rna/biotree?&&?mkdir?index?&&?cd?index
#下載索引文件,并解壓
master@master:~/User/Projects/rna/biotree/index$?wget?ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz
master@master:~/User/Projects/rna/biotree/index$?tar?-zxvf?hg19.tar.gz
2. 建立索引
工具上有一個(gè)命令是-build,只需要指定基因組fasta序列文件和創(chuàng)建的索引系列文件的前綴:
master@master:~$?conda?activate?rna
(rna)?master@master:~/User/Projects/rna/biotree/index$?hisat2-build?GRCh38.p13.genome.fa?hisat2_index_GRCh38
請記住,創(chuàng)建的索引系列文件的前綴非常重要,后續(xù)比較實(shí)際上需要這個(gè)前綴。
3. 比較
#?hisat2?-p?線程數(shù)?-x?索引?-1?轉(zhuǎn)錄組文件1.fastq?-2?轉(zhuǎn)錄組文件2.fastq?-S?輸出文件.sam?
(rna)?master@master:~/User/Projects/rna/biotree$?hisat2?-p?10?-x?/index/hisat2_index_GRCh38?-1?SRR11618610_1.fasta.gz?-2?SRR11618610_2.fasta.gz?-S?output/SRR11618610.sam
#重復(fù)其他兩個(gè)數(shù)據(jù)
在復(fù)現(xiàn)這種代碼的過程中,你可能會遇到各種問題dnastar序列比對,也有可能是我的代碼不正確。 這時(shí)候你需要有足夠的耐心和思考,并且相信你會做到。
如有侵權(quán)請聯(lián)系刪除!
Copyright ? 2023 江蘇優(yōu)軟數(shù)字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服務(wù)提供商
13262879759
微信二維碼