你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!
發(fā)布時(shí)間:2023-06-07
瀏覽次數(shù):0
指導(dǎo)
考慮到比較轉(zhuǎn)錄組時(shí),可用的軟件很多,但很少介紹它們之間的差距。 為此,本文主要介紹STAR,,.的區(qū)別。
1. 定義 2. 對(duì)比
那么[1]有什么區(qū)別呢?
2.1.
當(dāng)我們比較一個(gè)read時(shí),除了要問(wèn)它在基因組中可能的位置外,還要問(wèn)核苷酸和核苷酸之間的確切對(duì)應(yīng)關(guān)系。 例如,我們想要得到類似于“ 可能起源于 chr1 位置 123 到 140。前 7 個(gè)核苷酸是 foo 和參考之間的完全匹配,然后是 3 個(gè)核苷酸插入,然后是核核苷酸的其余部分匹配 foo 和參考?!?/p>
2.2.
當(dāng)我們進(jìn)行閱讀時(shí)dnastar序列比對(duì)dnastar序列比對(duì),我們只是在問(wèn),“它是從哪里來(lái)的?” 不過(guò),我們不一定關(guān)心讀取與其來(lái)源之間的對(duì)齊。
直到最近,它們幾乎是同義詞。 工具喜歡并改變它,因?yàn)樗鼈兛梢栽诓徊榭淳_比對(duì)的情況下將讀取分配給基因/特征/任何東西。 因?yàn)檫@樣更快,而且我們實(shí)際上并不關(guān)心一般的對(duì)齊結(jié)果,所以這在個(gè)別應(yīng)用程序中是一個(gè)巨大的優(yōu)勢(shì)。
3. 區(qū)別 3.1. 星星
STAR[2] 是一個(gè)。 它的工作是找出每個(gè)測(cè)序讀數(shù)在基因組中的位置,這就是(主要)它輸出的內(nèi)容 - 讀數(shù)列表及其在基因組上的坐標(biāo)(以 BAM 文件的形式)。 它非常關(guān)心每個(gè)核苷酸的正確位置。
對(duì)于表達(dá)分析,您需要將這些位置轉(zhuǎn)換為基因表達(dá)值。 有幾種方法可以做到這一點(diǎn),但最簡(jiǎn)單的方法是估計(jì)基因組中與每個(gè)基因重疊的位置的讀數(shù)數(shù)量(執(zhí)行此操作的程序示例是 )。 另一種方法是使用統(tǒng)計(jì)模型將讀數(shù)分配給可能的轉(zhuǎn)錄本(其中多個(gè)轉(zhuǎn)錄本可能在基因組中重疊)。 執(zhí)行此操作的程序示例是 RSEM。
3.2.&
并且是定量工具——它們獲取包含測(cè)序讀數(shù)的文件并輸出基因表達(dá)水平。 事實(shí)上,弄清楚這些讀數(shù)在轉(zhuǎn)錄組中的來(lái)源是該過(guò)程的第一步。 一旦找到,他們使用統(tǒng)計(jì)模型將其轉(zhuǎn)換為轉(zhuǎn)錄表達(dá)水平,考慮讀取來(lái)自哪些轉(zhuǎn)錄本。
看起來(lái)和做的更多,所以他們應(yīng)該花更長(zhǎng)的時(shí)間,但事實(shí)并非如此——事實(shí)證明他們要快得多。 這一代工具最初是基于這樣的想法,即如果你正在量化基因,你更關(guān)心的是 read 可能來(lái)自的轉(zhuǎn)錄本集,而不是它在轉(zhuǎn)錄本/基因組中的精確位置。 他們以不同的形式來(lái)做到這一點(diǎn)——使用“偽對(duì)齊”,最新版本使用一種叫做“選擇性對(duì)齊”的東西,它介于 STAR 和(據(jù)我所知)之間,盡管舊版本被稱為準(zhǔn)對(duì)齊。
4.異同 與單獨(dú)使用STAR+量化相比,求和速度更快,占用顯存更少。 它們提供轉(zhuǎn)錄水平的表達(dá)信息(其中 STAR+ 計(jì)數(shù)僅提供基因水平,而 STAR+RSEM 提供轉(zhuǎn)錄)。 處理讀取映射到多個(gè)轉(zhuǎn)錄本或基因的情況。 一般來(lái)說(shuō),只有轉(zhuǎn)錄組(由細(xì)胞形成的轉(zhuǎn)錄物序列)而不是基因組被描繪出來(lái)。參考文獻(xiàn)
[1]:#
[2]:#
如有侵權(quán)請(qǐng)聯(lián)系刪除!
Copyright ? 2023 江蘇優(yōu)軟數(shù)字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服務(wù)提供商
13262879759
微信二維碼