你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!
發(fā)布時(shí)間:2023-12-08
瀏覽次數(shù):0
在上一篇文章中,我們過濾了數(shù)據(jù)以進(jìn)行質(zhì)量控制,所以現(xiàn)在下一步是進(jìn)行比較。 在比較之前,我們要明白比較的目的是什么? RNA-Seq數(shù)據(jù)比較和DNA-Seq數(shù)據(jù)比較有什么區(qū)別?
RNA-Seq數(shù)據(jù)分析可以分為多種類型,例如尋找差異表達(dá)基因或?qū)ふ倚碌倪x擇性剪接。 如果我們要尋找差異表達(dá)的基因,我們只需要確定不同的read技術(shù)即可。 我們可以使用bwa等比較工具,或者align-free工具,后者速度更快。
但如果您需要找到新的或替代的 RNA 剪接,您將需要像 STAR 這樣的工具來找到剪接位點(diǎn)。 由于RNA-Seq與DNA-Seq不同,當(dāng)DNA轉(zhuǎn)錄為mRNA時(shí),內(nèi)含子部分被去除。 因此dnastar序列比對(duì),如果反向的mRNA cDNA無法與參考序列進(jìn)行比較,則會(huì)將其分離并重新比對(duì),以確定中間是否有內(nèi)含子。
本文重點(diǎn)
下載索引
建立索引
比較
1.下載索引
人類索引一般都是現(xiàn)成的。 我建議你嘗試下載現(xiàn)成的,使用服務(wù)器自己創(chuàng)建索引,時(shí)間比較長(zhǎng)。
#切換到工作目錄,并創(chuàng)建index文件夾
master@master:~$?cd?User/Projects/rna/biotree?&&?mkdir?index?&&?cd?index
#下載索引文件,并解壓
master@master:~/User/Projects/rna/biotree/index$?wget?ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz
master@master:~/User/Projects/rna/biotree/index$?tar?-zxvf?hg19.tar.gz
2. 建立索引
工具中有一個(gè)命令叫-build。 您只需要指定基因組fasta序列文件和構(gòu)建的索引系列文件的前綴:
master@master:~$?conda?activate?rna
(rna)?master@master:~/User/Projects/rna/biotree/index$?hisat2-build?GRCh38.p13.genome.fa?hisat2_index_GRCh38
請(qǐng)記住,這個(gè)構(gòu)建的索引系列文件的前綴非常重要。 后面的比較實(shí)際上需要這個(gè)前綴。
3. 比較
#?hisat2?-p?線程數(shù)?-x?索引?-1?轉(zhuǎn)錄組文件1.fastq?-2?轉(zhuǎn)錄組文件2.fastq?-S?輸出文件.sam?
(rna)?master@master:~/User/Projects/rna/biotree$?hisat2?-p?10?-x?/index/hisat2_index_GRCh38?-1?SRR11618610_1.fasta.gz?-2?SRR11618610_2.fasta.gz?-S?output/SRR11618610.sam
#重復(fù)其他兩個(gè)數(shù)據(jù)
在復(fù)現(xiàn)這些代碼的過程中,你可能會(huì)遇到各種問題dnastar序列比對(duì),或者我的代碼可能不正確。 這時(shí)候你需要有足夠的耐心和思考,相信自己能做到。
如有侵權(quán)請(qǐng)聯(lián)系刪除!
Copyright ? 2023 江蘇優(yōu)軟數(shù)字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服務(wù)提供商
13262879759
微信二維碼