DCS Tools
高效准确的生物信息数据分析工具集
从单样本到百万级队列:全链路加速方案
高效率
- ✅ 极速检测: 单样本 WGS 30X 变异检测仅需 1.79h (32线程)
- ✅ 规模领先: 支持百万级大型队列联合变异检测
- ✅ 群体VCF高效检索: 在5000人规模VCF中检索速度比bcftools快 2倍
低成本
- ✅ WGS胚系变异检测: 相比BWA + GATK,单个WGS 30X数据计算成本降低约77%
- ✅ FASTQ压缩: 相比gzip, 可以节约 80% 的存储
- ✅ GVCF/VCF压缩: 相比gzip, 可以节约 50-66% 的存储
易使用
- ✅ 开箱即用:自带环境,解压即运行
- ✅ 无缝平替:兼容 BWA/GATK 常用参数
- ✅ 灵活解压:解压工具跨平台支持(Windows/Linux)
- ✅ 广泛适配:原生支持 X86_64 及 ARM 架构
性能和准确度
相比于BWA+GATK流程,DCS Tools在WGS胚系变异检测中可以加速约16倍,变异准确度与GATK一致。
| 32线程 各步骤运行时间(h) |
HG001 30X | HG002 30X | HG003 30X | HG005 40X |
|---|---|---|---|---|
| 质控比对排序和标记重复 (aligner) |
1.21 | 1.51 | 1.31 | 1.7 |
| 碱基质量值矫正 (bqsr) |
0.09 | 0.09 | 0.08 | 0.11 |
| 变异检测 (variantCaller) |
0.47 | 0.53 | 0.48 | 0.53 |
| GVCF转VCF (genotyper) |
0.02 | 0.02 | 0.02 | 0.02 |
| 总时间(h) | 1.79 | 2.15 | 1.89 | 2.36 |
适用场景
主要工具
aligner
质控、比对、排序和标记重复
bqsr
碱基质量值矫正
variantCaller
变异检测(类似GATK haplotypeCaller)
jointcaller
联合变异检测,支持百万级样本
SeqArc
高效无损FASTQ压缩工具
VarArc
高效无损VCF压缩工具
Mutect2加速版
体细胞变异检测
运行环境
硬件要求
- 一台联网机器:用于软件许可验证(离线使用请联系客服)
- CPU: 至少有8核
- 内存: 至少有128G
- 存储: 建议使用读写速度更快的SSD硬盘
- 架构: 支持x86和arm架构
操作系统和依赖
- 操作系统: Linux,推荐Centos 7, Debian 8, Ubuntu 14.04及以上的发行版
- 软件所需依赖库已经在软件包中,解压后配置完license直接使用
引用
开始使用
填写申请试用表单,获取软件包和许可文件
