DNA序列分析軟件Sequencher的Next-Generation Sequencing功能
gene codes致力于為您帶來在**評審期刊上開發(fā)和發(fā)布的各種比對和組裝算法,但讓非工程師也可以使用它們。例如,gsnap(tom wu,genentech,inc.)被認(rèn)為是正確識別剪接點的算法之一。生物信息學(xué)可能會像這樣調(diào)用該程序:
如果我們有一些工具來幫助我們了解所有可用的標(biāo)志和參數(shù)是什么以及它們?nèi)绾斡绊懗绦颍敲次覀兇蠖鄶?shù)人的工作效率都會高。sequencher界面可幫助您選擇選項、設(shè)置值并通過說明和工具提示了解可用功能。上面指令行中的相同選項在sequencher中設(shè)置如下:
只需幾個步驟即可執(zhí)行snp分析、甲基化分析或rna a-to-g耐受比對。
在平板電腦中查看您的結(jié)果 。
bwa、velvet、maq、gsnap和tablet只是sequencher的開始。如果您要對混合群體進行測序,請將參考引導(dǎo)比對與從頭組裝的力量結(jié)合起來。將讀數(shù)與參考比對并捕獲未比對的讀數(shù),以進行進一步的基于參考的比對或從頭組裝。
通過添加cufflinks套件,您可以使用我們?yōu)樗衝gs算法開發(fā)的相同風(fēng)格的界面來執(zhí)行rna-seq差異表達。
我們還添加了您期望看到的圖表,例如火山圖,因此您*借助指令行即可查看結(jié)果。因為我們知道您有自己喜歡的矯正器,所以我們不會堅持您使用我們的。只要您的對齊器創(chuàng)建sam或bam作為其輸出,您就可以使用廣泛認(rèn)可的rna-seq工具之一來探索您的數(shù)據(jù)。
fastqc質(zhì)量控制報告
在開始調(diào)整數(shù)據(jù)之前,請停下來考慮一下。您不想知道您的數(shù)據(jù)有多好嗎?好吧,現(xiàn)在您可以使用fastq質(zhì)量報告。我們已將流行的fastqc程序集成到sequencher中。從“序列”>“分析”>“fastq質(zhì)量報告...”啟動,您可以獲得多達12個不同指標(biāo)的結(jié)果。從“每堿基序列質(zhì)量”到“kmer內(nèi)容”,從“序列重復(fù)水平”到“過度代表性序列”,結(jié)果以易于理解的交通燈系統(tǒng)以及詳細的圖形形式呈現(xiàn)。
每個報告都顯示在自己的窗口中,以便您可以并排查看它們。使用報告在組裝之前監(jiān)控數(shù)據(jù)集的單獨質(zhì)量或隨著時間的推移監(jiān)控質(zhì)量。
rna測序
rna-seq實驗為蛋白質(zhì)編碼轉(zhuǎn)錄本的研究帶來了新的理解和知識,無論是來自不同時間點的正常組織還是正常與生病狀態(tài)之間的轉(zhuǎn)錄本。sequencher插件家族的新成員是cufflinks套件,一系列專為研究rna-seq ngs數(shù)據(jù)而設(shè)計的程序。入門再簡單不過了。
使用您喜歡的比對器將您的rna-seq ngs數(shù)據(jù)與參考序列比對,然后獲取生成的sam或bam文件以及參考gtf文件以開始使用 cufflinks。
關(guān)鍵是利用cufflinks、cuffmerge、cuffdiff的四步過程進行差異表達,然后將數(shù)據(jù)顯示為表格和繪圖。cufflinks套件指令行程序都可以使用我們易于使用的圖形界面進行訪問。為了實現(xiàn)控制,您還可以通過簡單的點擊“高等(編輯)”對話框來訪問所有高等指令行功能。
您可以在sequencher中運行分析并以繪圖形式查看結(jié)果。通常,差異表達需要您從指令行安裝并使用r統(tǒng)計編程語言。
我們?yōu)槟峁┮粋€菜單指令,允許您使用火山圖、散點圖和條形圖顯示結(jié)果。每個點或條都鏈接到其基礎(chǔ)數(shù)據(jù),因此您可以單擊您感興趣的點或條并詳細探索結(jié)果。
sequencher中的cufflinks套件現(xiàn)在包括cuffquant和cuffnorm。如果您不處理差異表達基因但仍需要標(biāo)準(zhǔn)化結(jié)果,請在 cufflinks步驟后使用cuffquant和cuffnorm。如果您需要減少計算機上的計算負(fù)載,可以在cufflinks和cuffmerge步驟之后使用 cuffquant來量化數(shù)據(jù)集中的讀數(shù)。然后,當(dāng)您準(zhǔn)備好時,使用cuffdiff完成差異分析。您會發(fā)現(xiàn)這一步要快得多,因為那部分工作已經(jīng)完成。
通過基因名稱或基因id搜索數(shù)據(jù)表,快速找到您感興趣的數(shù)據(jù)。
對數(shù)據(jù)進行排序和篩選,僅繪制您感興趣的數(shù)據(jù),然后以png格式導(dǎo)出圖表以包含在演示文稿或報告中。
de novo組裝
velvet在5.1版中加入了不斷壯大的sequencher插件家族。velvet是一個從頭匯編器,它不需要參考序列。雖然我們談?wù)搗elvet,但它實際上由兩個程序組成。velveth準(zhǔn)備您的數(shù)據(jù)集,而velvetg使用一種稱為de bruijn圖的方法執(zhí)行組裝步驟。velvetg構(gòu)建重疊群,甚至?xí)L試搭建那些無法自行組合在一起的重疊群。
velvet可以使用multiplex id數(shù)據(jù)進行從頭組裝。sequencher自動按條形碼將數(shù)據(jù)劃分為單獨的文件(箱),然后對齊它們并將結(jié)果放入單獨的結(jié)果文件夾中。然后可以在平板電腦瀏覽器中查看結(jié)果。每個重疊群的共有序列將出現(xiàn)在您的項目窗口中。
velvet被編寫為在指令行上運行。sequencher使您只需單擊幾下即可輕松啟動程序集運行,從而保護您免受指令行的影響。高等用戶和新手仍然可以訪問指令行參數(shù)來添加或改參數(shù),我們引入了一個新的gui,讓您也可以訪問和利用這些參數(shù)。
參考引導(dǎo)對齊
比對人員花費一部分時間對參考序列進行索引,以加快整體比對速度。現(xiàn)在,您可以創(chuàng)建并保留這些索引 (bwa) 或數(shù)據(jù)庫 (gsnap),當(dāng)您想要嘗試不同的參數(shù)以改進對齊或拼接位置時,速度會快。
索引和數(shù)據(jù)庫文件是跨平臺的,因此您可以與不同類型計算機上的協(xié)作者共享它們。當(dāng)您創(chuàng)建新索引或數(shù)據(jù)庫時,它將自動出現(xiàn)在該比對器的可用參考序列列表中,可供隨時使用。sequencher會記住它的位置,因此您*記住它。
來自預(yù)處理參考的文件可能會變得很大。當(dāng)您不再使用某個數(shù)據(jù)時,只需使用外部數(shù)據(jù)瀏覽器一鍵刪除即可。您將節(jié)省磁盤空間,并且如果您需要再次索引相同的參考序列,sequencher可以輕松地重新創(chuàng)建它。
bwa
bwa在5.2版本中加入了sequencher插件系列。sequencher使用bwa-mem,這是bwa軟件包中新、快的算法。bwa-mem旨在將70bp到1mbp的序列讀數(shù)與參考比對。
bwa被編寫為在指令行上運行。sequencher為您提供了一個易于使用的界面,使您*使用指令行,也*學(xué)習(xí)或使用指令行參數(shù)。對于想要訪問這些指令行功能的高等用戶來說,“高等(編輯)”對話框也可以讓您利用這些功能。
gsnap
gsnap在5.0版中加入了sequencher插件系列。gsnap通過壓縮參考序列,使用基于參考的對齊方法。這使得gsnap在執(zhí)行下一代測序時變得快、容易。
gsnap旨在對雙端和不雙端的illumina-solexa或sanger標(biāo)準(zhǔn)數(shù)據(jù)執(zhí)行基于參考的比對。序列的長度對于gsnap來說不是問題,因為它能夠輕松對齊很短到任意長的數(shù)據(jù)長度。
gsnap現(xiàn)在可以處理multiplex id (mid) 數(shù)據(jù),從而進一步很大限度地提高效率。現(xiàn)在您擁有了sequencher的用戶友好界面,它允許您通過mid數(shù)據(jù)利用 gsnap 的功能。sequencher自動將數(shù)據(jù)按條形碼劃分為單獨的文件,使用gsnap將這些文件與參考對齊,并將結(jié)果放入單獨的結(jié)果文件夾中。
任意與gsnap對齊的結(jié)果都可以在流行的平板電腦瀏覽器中查看。
對于想要好地控制gsnap指令行功能的高等用戶,請按“高等(編輯)”打開“高等gsnap 選項”對話框,您可以在其中配置特定的指令行參數(shù)。
maq
maq在5.0版本中加入了sequencher插件系列。流行的maq算法將單端和雙端下一代數(shù)據(jù)與參考序列對齊。開始設(shè)計用于對齊 illumina-solexa 數(shù)據(jù),它將對齊任意很短的讀取數(shù)據(jù)(63個堿基或少)。參考序列可以是fasta或genbank文件的形式。maq使用二進制格式來壓縮引用并讀取文件。關(guān)鍵的是,maq運行所需的ram很少,這使得執(zhí)行下一代測序變得加容易。它也適用于大約200萬次讀取的小型項目,盡管可以將較大的項目分解然后稍后合并結(jié)果。
比對結(jié)果可以在maqview或tablet中查看。
maq開始是為了在指令行上運行而編寫的。sequencher 提供了一個簡單、易于使用的界面,可以保護您免受指令行的影響,也不必學(xué)習(xí)如何使用指令行參數(shù)。
使用samtools進行變體調(diào)用
您已經(jīng)對它進行了測序,現(xiàn)在您已經(jīng)對其進行了對齊。接下來使用新的變體調(diào)用功能檢查變體的比對。無論您是使用我們的參考引導(dǎo)比對器之一比對讀數(shù),還是在其他地方獲取比對的sam/bam文件,您仍然可以使用samtools的變體調(diào)用來檢查變體。
該分析可以在snp耐受比對、甲基化耐受比對或gsnap中新的rna a-to-i編輯耐受模式之后使用。然后將生成的vcf文件和 sam文件加載到您喜歡的瀏覽器中(如果您沒有試用平板電腦)——它是我們dna-seq工具發(fā)行版的一部分。向平板電腦提供gtf文件進行注釋,您還可以看到功能中的變體。
multiplex id
sequencher 5.2及高版本使用bwa、gsnap或velvet的從頭或基于參考的組裝的復(fù)用方法。多路復(fù)用既快速又簡單。每個 dna樣本都有一個與其相關(guān)的特定條形碼。sequencher可以讀取這些條形碼并將數(shù)據(jù)劃分到各種文件或“容器”中。然后,sequencher獲取每個“bin”中的序列并為您執(zhí)行組裝或比對。sequencher的multiplex id可與單端或雙端數(shù)據(jù)一起使用。對于成對末端數(shù)據(jù),成對中的每個讀取都必須在 5' 端具有相同的條形碼才能被識別為成對。您可以使用平板電腦查看器查看多重組裝或比對的結(jié)果。
snp分析
在尋找候選snp時,篩選下一代測序產(chǎn)生的數(shù)百萬條讀數(shù)是一項重大挑戰(zhàn)。maq和gsnap算法都包含snp篩選功能。
maq有一個兩級篩選過程,首先搜索讀數(shù)和參考序列之間的差異。接下來,進行過濾步驟,篩選初始結(jié)果,尋找每列讀數(shù)的同一類別的小數(shù)量的變體,以及嵌入高質(zhì)量區(qū)域的變體。結(jié)果以綜合報告形式呈現(xiàn)。您還可以在maqview或平板電腦中查看結(jié)果。
通過gsnap,snp分析采用不同的方法來查看先前報告的snp以及新的候選者。用戶必須提供已知snp的列表以及讀數(shù)和參考序列。gsnap對所有主要和次要等位基因執(zhí)行snp耐受比對。該算法能夠區(qū)分次要等位基因和不匹配。結(jié)果以綜合報告形式呈現(xiàn)。您還可以在平板電腦中查看結(jié)果。
methylation studies
幾十年來,dna甲基化一直被認(rèn)為在基因表達中發(fā)揮著重要作用。當(dāng)dna用亞硫酸氫鹽處理時,任意胞嘧啶都會轉(zhuǎn)化為尿嘧啶,除非胞嘧啶已被甲基化。gsnap將從亞硫酸氫鹽處理的dna測序中獲取的下一代測序讀數(shù)與參考序列進行比對,其比對方式不會掩蓋真正的錯配,但仍會暴露用亞硫酸氫鹽處理未甲基化dna時發(fā)生的c到t錯配。
rna耐受比對
gsnap已新,現(xiàn)在包含a到g的容忍對齊模式。如果您的mrna可能已被adar基因編輯,導(dǎo)致腺苷轉(zhuǎn)化為肌苷,請使用此模式。測序時i被視為g。
該版本還引入了鏈鏈和非鏈模式,用于新的rna耐受模式和甲基化分析。當(dāng)您的實驗室方案允許 5' 到3' 基因組讀取及其每條鏈上的反向互補時,請使用非鏈模式。
viewers
tablet是用于下一代序列比對的高性能查看器。在多種不同模式下查看和檢查您的maq、gsnap、bwa-mem或velvet結(jié)果,以不同顏色**顯示堿基并讀取方向。獲取有關(guān)單個讀數(shù)和讀數(shù)對的信息,并安排讀數(shù)的堆疊以揭示配對。平板電腦具有用于啟用翻譯、放大和縮小以及**顯示變體堿基的控件,使您可以輕松探索閱讀內(nèi)容。
北京環(huán)中睿馳科技有限公司專注于prism數(shù)據(jù)分析軟件,snapgene多少錢,evs總代理,mimics軟件價格,hydrus,gms培訓(xùn),鉑金代理,軟件銷售,購買渠道等, 歡迎致電 01067506619