网上科普有关“BWA和Bowtie2默认参数比对结果”话题很是火热,小编也是针对BWA和Bowtie2默认参数比对结果寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
一直认为 bwa 和 bowtie2 比对差异比较大,比对一组数据时均使用默认参数如下
BWA
Bowtie2
看下bowtie2的比对结果
比对率为15.2%~52.4%,除去未比对上的reads,single mapped reads最多。
看下bwa的比对结果
选几个未mapped的reads查看
# V300032513L2C001R0020005307
这条read使用bowtie2比对,只有paired-end一条read比对上,而bwa两条均能比对上,另一条比对为 41T4T53 ,还有很多类似情况就不一一举例了
如果直接使用默认参数的话,两个的差距还是挺大的
如何bowtie2加入环境变量
bowtie2有end-to-end和local两种比对模式。
两种模式的的预设参数如下,其中 end-to-end是默认比对模式
可以通过参数设置进行调节,比如选择 --very-sensitive-local 模式
bowtie2 --very-sensitive-local -x $REF -1 $R1 -2 $R2 > bowtie.sam
思路:从一个基因组中以一定错误率生成一定数量的reads,再用两个比对工具比对
结果bwa和bowtie2比对率差不多,分别是95.4%和94.7%。
但是 生成错误率为10%的reads进行比对,则差异很大。
bwa比对率为83.3%,而bowtie2只有28.9%。
通过调节为 --very-sensitive-local 模式,比对率上升至63.86%,进一步调节模式参数
time bowtie2 -D 20 -R 3 -N 1 -L 20 -x $REF -1 $R1 -2 $R2 > bowtie.sam
比对率上升至87.14%,可见在 测序质量不好时,比对结果和模式参数设置有很大关系。
基于BWT算法的比对软件原理解析(BWA & Bowtie & Bowtie2)
安装,配置j2sdk: 执行j2sdk安装程序,自定义路径,我们的安装路径为:C:\j2sdk1.4.2_04 配置j2sdk: 配置环境变量: 我的电脑->属性->高级->环境变量->系统变量中添加以下环境变量: JAVA_HOME=C:\j2sdk1.4.2_04 CLASSPATH=.;C:\j2sdk1.4.2_04\lib\tools.jar;C:\j2sdk1.4.2_04\lib\dt.jar;C:\j2sdk1.4.2_04 \bin; path=E:\Program Files\Java\jdk1.6.0_10 ; 写一个简单的java程序来测试J2SDK是否已安装成功: public class hello { public static void main(String args[]) { System.out.println("Hello") } } 将程序保存为文件名为hello.java的文件。 打开命令提示符窗口,进入到hello.java所在目录,键入下面的命令 javac hello.java java hello 此时..
参考:
踏踏实实做技术:BWA,Bowtie,Bowtie2的比对算法推导
remove multiple mapping reads的方法
CHIP-seq: Bowtie2、BWA用的比较多
RNA-seq: Tophat、Bsmap
甲基化:BS-seeker
global---NW
local--SW
好处是能够穷举出所有的比对情况,所以可以选择全局最优的结果;最大的缺点是比对的非常慢。
BWT(Burrows-Wheeler Transform )
第一步,在raw seq中加$符号,并平移,形成一个 raw matrix
第二步,根据Raw Matrix的首字母进行排序,得到转换矩阵Matrix’,默认$符号排在第一位,
所以最后只用保存L列和每个字母的相对位置就可以了,根据L列和每个字母的相对位置可以干两件事情:
例如:第一个是L- 对应F- 的前一个是G,L-G对应F-G;F-G的前一个是L-C,依次类推,得到原来的ref:ACAACG$
14bp(high quality)---14bp(low quality of high quality)--8bp(real low quality)
分成三断seed,seed1+seed2比对总共的mismatch <= 2,则继续8bp的比对;如果 > 2 直接放弃后面的比对;
第一步,选择seed区域;
20里面选18---
(18+2)+(18+2)+(18+2)+...+(18+2)
保证一个fragment是20,seed 是18bp
或者,10里面选16--
fragment = 16,overlap = 6,
那么根据BWT算法,就把拆分的seed mapping到基因组的大概位置;
然后把基因组可能mapping上的那段区域挑出来,和query seq做比对(用NW或者SW算法),因为query seq NW和SW允许gap open
关于“BWA和Bowtie2默认参数比对结果”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[进爵孤锋]投稿,不代表小熊号立场,如若转载,请注明出处:https://xx-scm.com/cshi/202606-179336.html
评论列表(4条)
我是小熊号的签约作者“进爵孤锋”!
希望本篇文章《BWA和Bowtie2默认参数比对结果》能对你有所帮助!
本站[小熊号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:网上科普有关“BWA和Bowtie2默认参数比对结果”话题很是火热,小编也是针对BWA和Bowtie2默认参数比对结果寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在...