v2.0.3
增加aligner的数据截取功能
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 功能开发 | aligner: 增加数据截取功能,支持指定一定数量的碱基进入比对环节 report: 增加WES的Fold80_Base_Penalty统计 |
| 问题修复 | 修复aligner生成的bam索引文件后缀命名问题 | |
| VarArc | 问题修复 | 修复GVCF压缩问题 |
v2.0.2
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | aligner: 修复aligner markdup阶段在部分物种下的问题 |
v2.0.1
修改aligner markdup阶段逻辑,降低该部分的内存占用,并在大数据时实现加速效果。
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | aligner: 修改aligner markdup阶段逻辑,降低该部分的内存占用,并在大数据时实现加速效果。并修复windows换行符导致的fai文件解析问题 |
| SeqArc | 问题修复 | 修复管道压缩bug |
v2.0.0
支持多倍体物种的变异检测,体细胞变异检测部分开始支持多线程加速,aligner支持新的索引结构,增强稳定性。
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 功能开发 | aligner:支持低内存索引模式(运行速度略微降低),对资源要求更友好,并可以解决类似苏铁等基因组的bug variantCaller:支持多倍体物种的变异检测(参数:--ploidy)。添加WES数据的相应统计字段 report:支持输出WES数据的报告 util:bamStat功能(单独统计bam)与variantCaller保持一致,增加WES的统计字段 |
| 体细胞变异检测 | 功能开发 | 支持多线程加速模式,用--nthread参数设置,32线程下速度能达到原版本的8倍左右。 |
| 群体基因组联合分析 | 功能开发 | 支持多倍体物种(参数:--ploidy) |
| VarArc | 功能开发 | 新增该模块,支持对GVCF/VCF文件(文本或gz格式)的压缩和解压 |
| SeqArc | 问题修复 | 修复管道压缩bug |
备注:
1、WES数据的bam统计不要使用variantCaller的统计结果,要用util的bamStat功能单独统计
2、多倍体在variantCaller后,建议使用jointcaller来执行GVCF到VCF的操作
v1.5.0
支持使用加密狗(dongle)来做离线认证,达到单机使用本工具的目的。
| 模块 | 类型 | 描述 |
|---|---|---|
| 所有模块 | 功能开发 | 增加使用加密狗来进行离线license认证的功能,运行机器可以不联网使用DCS Tools |
| WGS/WES | 问题修复 | genotyper:修复内存占用较多的问题 |
v1.4.0
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 功能开发 | genotyper增加--include-non-variant-sites参数,与GATK的GenotypeGVCFs的同名参数功能类似,在VCF中保留GVCF的非变异block信息并将其展开,方便下游遗传病分析等场景。注意该参数开启时,需要设置ref文件(-R) |
| SeqArc | 问题修复 | 修复获取用户磁盘可用空间异常的bug |
v1.3.0
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | aligner: 1. 修复单行长度过长的fasta引起生成fai文件的问题。2. 修复arm架构欧拉操作系统的析构bug variantCaller: 1. 修复某些场景下的段错误。2. 修复某些物种情况下内存问题 |
| SeqArc | 功能开发 | 实现了windows解压工具 |
| SeqArc | 功能开发 | 支持arc直接解压为gz格式,并支持管道模式 |
| SeqArc | 功能开发 | 支持U碱基的压缩和解压 |
| 体细胞突变检测 | 功能开发 | 新增该模块 |
v1.2.0
支持arm指令架构,并支持样本量和数据量(压缩)统计,配合按样本量数据量的license模式。
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | bqsr:修复染色体长度超过2G时的bug variantCaller:修复-L参数部分场景下的bug,修复gvcf索引文件问题 |
| 功能开发 | aligner:增加共享内存功能,需要开启--useSharedMemIndex参数 variantCaller:1.增加15x覆盖度统计结果 2.兼容有overlap的bed文件 report:更新报告版本号,增加15x覆盖度统计 |
|
| SeqArc | 功能开发 | 实现了单独的解压工具 |
| 功能开发 | 实现了基因库的统计功能 | |
| JointCalling | 问题修复 | 修复了分区end bug |
v1.1.0
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | 解决aligner内存泄漏问题 |
| 问题修复 | 解决aligner在构建某些ref fasta索引时出现卡死问题 | |
| SeqArc | 功能开发 | 使用simde来实现跨平台指令集 |
| 功能开发 | 实现了单独的解压工具 | |
| 功能开发 | 实现了基因库的统计功能 |
v1.0.1
改动模块:aligner, report
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 问题修复 | 修复了aligner某种场景下coredump的问题 |
| 问题修复 | 修复了aligner输出文件为不带路径的纯文件名时的问题 | |
| 问题修复 | 将aligner生成的bam索引文件重命名为*.bam.bai,不再是*.bai | |
| 问题修复 | 修复report模块深度累积频率图潜在问题 | |
| 问题修复 | quick_start包中wgs脚本中增加set -e,遇到错误时及时退出 |
v1.0.0
| 模块 | 类型 | 描述 |
|---|---|---|
| WGS/WES | 功能开发 | 新增比对和变异相关信息统计功能 |
| SeqArc | 功能开发 | 按照avs-g标准,重构了项目框架 |
| 功能开发 | 增加了长读长数据的压缩功能 | |
| 功能开发 | 调整了参数解析方式,增加了子命令和长短参数 |