国产精品高清一区二区三区不卡-国产精品一区二区三区免费视频-日韩免费高清一级毛片-亚洲欧美一区二区三区国产精品-日韩欧美一区二区三区不卡视频-亚欧免费视频一区二区三区-亚洲欧美日韩一区成人-欧美日韩视频综合一区无弹窗-精品日韩在线视频一区二区三区-国内精品视频一区二区三区

你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!

誠信、勤奮、創(chuàng)新、卓越

友好定價(jià)、專業(yè)客服支持、正版軟件一站式服務(wù)提供

13262879759

工作日:9:00-22:00

⑤轉(zhuǎn)錄組上游數(shù)據(jù)分析——hisat2比對(duì)

發(fā)布時(shí)間:2023-12-08

瀏覽次數(shù):0

在上一篇文章中,我們過濾了數(shù)據(jù)以進(jìn)行質(zhì)量控制,所以現(xiàn)在下一步是進(jìn)行比較。 在比較之前,我們要明白比較的目的是什么? RNA-Seq數(shù)據(jù)比較和DNA-Seq數(shù)據(jù)比較有什么區(qū)別?

RNA-Seq數(shù)據(jù)分析可以分為多種類型,例如尋找差異表達(dá)基因或?qū)ふ倚碌倪x擇性剪接。 如果我們要尋找差異表達(dá)的基因,我們只需要確定不同的read技術(shù)即可。 我們可以使用bwa等比較工具,或者align-free工具,后者速度更快。

但如果您需要找到新的或替代的 RNA 剪接,您將需要像 STAR 這樣的工具來找到剪接位點(diǎn)。 由于RNA-Seq與DNA-Seq不同,當(dāng)DNA轉(zhuǎn)錄為mRNA時(shí),內(nèi)含子部分被去除。 因此dnastar序列比對(duì),如果反向的mRNA cDNA無法與參考序列進(jìn)行比較,則會(huì)將其分離并重新比對(duì),以確定中間是否有內(nèi)含子。

本文重點(diǎn)

下載索引

建立索引

比較

1.下載索引

人類索引一般都是現(xiàn)成的。 我建議你嘗試下載現(xiàn)成的,使用服務(wù)器自己創(chuàng)建索引,時(shí)間比較長(zhǎng)。

#切換到工作目錄,并創(chuàng)建index文件夾
master@master:~$?cd?User/Projects/rna/biotree?&&?mkdir?index?&&?cd?index

#下載索引文件,并解壓
master@master:~/User/Projects/rna/biotree/index$?wget?ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz

master@master:~/User/Projects/rna/biotree/index$?tar?-zxvf?hg19.tar.gz

2. 建立索引

工具中有一個(gè)命令叫-build。 您只需要指定基因組fasta序列文件和構(gòu)建的索引系列文件的前綴:

master@master:~$?conda?activate?rna

(rna)?master@master:~/User/Projects/rna/biotree/index$?hisat2-build?GRCh38.p13.genome.fa?hisat2_index_GRCh38

請(qǐng)記住,這個(gè)構(gòu)建的索引系列文件的前綴非常重要。 后面的比較實(shí)際上需要這個(gè)前綴。

3. 比較

#?hisat2?-p?線程數(shù)?-x?索引?-1?轉(zhuǎn)錄組文件1.fastq?-2?轉(zhuǎn)錄組文件2.fastq?-S?輸出文件.sam?

(rna)?master@master:~/User/Projects/rna/biotree$?hisat2?-p?10?-x?/index/hisat2_index_GRCh38?-1?SRR11618610_1.fasta.gz?-2?SRR11618610_2.fasta.gz?-S?output/SRR11618610.sam

#重復(fù)其他兩個(gè)數(shù)據(jù)

在復(fù)現(xiàn)這些代碼的過程中,你可能會(huì)遇到各種問題dnastar序列比對(duì),或者我的代碼可能不正確。 這時(shí)候你需要有足夠的耐心和思考,相信自己能做到。

如有侵權(quán)請(qǐng)聯(lián)系刪除!

13262879759

微信二維碼