DCS Tools

高效准确的生物信息数据分析工具集
从单样本到百万级队列:全链路加速方案

高效率

  • 极速检测: 单样本 WGS 30X 变异检测仅需 1.79h (32线程)
  • 规模领先: 支持百万级大型队列联合变异检测
  • 群体VCF高效检索: 在5000人规模VCF中检索速度比bcftools快 2倍

低成本

  • WGS胚系变异检测: 相比BWA + GATK,单个WGS 30X数据计算成本降低约77%
  • FASTQ压缩: 相比gzip, 可以节约 80% 的存储
  • GVCF/VCF压缩: 相比gzip, 可以节约 50-66% 的存储

易使用

  • 开箱即用:自带环境,解压即运行
  • 无缝平替:兼容 BWA/GATK 常用参数
  • 灵活解压:解压工具跨平台支持(Windows/Linux)
  • 广泛适配:原生支持 X86_64 及 ARM 架构

性能和准确度

相比于BWA+GATK流程,DCS Tools在WGS胚系变异检测中可以加速约16倍,变异准确度与GATK一致。

WGS胚系变异检测性能
32线程
各步骤运行时间(h)
HG001 30X HG002 30X HG003 30X HG005 40X
质控比对排序和标记重复
(aligner)
1.21 1.51 1.31 1.7
碱基质量值矫正
(bqsr)
0.09 0.09 0.08 0.11
变异检测
(variantCaller)
0.47 0.53 0.48 0.53
GVCF转VCF
(genotyper)
0.02 0.02 0.02 0.02
总时间(h) 1.79 2.15 1.89 2.36
准确度

适用场景

大型队列研究

支持大规模样本的联合变异检测,适用于群体基因组学研究。

遗传病诊断

快速准确的变异检测,有助于遗传病的早期诊断和分析。

肿瘤诊断

高效处理肿瘤样本数据,支持肿瘤基因组学分析。

动植物基因组学

适用于各种动植物基因组的分析和研究。

基因组数据压缩

大幅减少存储空间,便于数据长期保存和传输。

主要工具

aligner

质控、比对、排序和标记重复

bqsr

碱基质量值矫正

variantCaller

变异检测(类似GATK haplotypeCaller)

jointcaller

联合变异检测,支持百万级样本

SeqArc

高效无损FASTQ压缩工具

VarArc

高效无损VCF压缩工具

Mutect2加速版

体细胞变异检测

运行环境

硬件要求

  • 一台联网机器:用于软件许可验证(离线使用请联系客服)
  • CPU: 至少有8核
  • 内存: 至少有128G
  • 存储: 建议使用读写速度更快的SSD硬盘
  • 架构: 支持x86和arm架构

操作系统和依赖

  • 操作系统: Linux,推荐Centos 7, Debian 8, Ubuntu 14.04及以上的发行版
  • 软件所需依赖库已经在软件包中,解压后配置完license直接使用

引用

  • Gong C., Yuan D., et al. (2026) DCS Tools: A high-performance, resource-efficient and scalable computing suite for population-scale genomic analysis and data compression. bioRxiv. doi: https://doi.org/10.64898/2026.03.13.711253
  • Gong C., Yang Q, et al. (2026) DPGT: A spark based high-performance joint variant calling tool for large cohort sequencing. bioRxiv. doi: https://doi.org/10.64898/2026.03.02.709184
  • 开始使用

    填写申请试用表单,获取软件包和许可文件