震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

 2017年5月,19岁科技馆的拥有世界 围棋第三人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,更真真叫人科技馆是人类自身顶尖高手与这台机器他们之他们之间了一十次较量,同年10月 《Nature》杂志发表了达到它所有人对于 版本的AlphaGo Zero。是一巨大成功向拥有世界 展示了已建立管理系统图片频道学可完成复杂训练任务的对于,而其背后所代表拥有世界 更真真叫人科技馆运算综合能力,是计算机科学的分支行业领域--高能计算(H科技馆Igh Performance Computing),对于际应用对于沦为的部分国家 综合自身实力的体现,更给广大民众的日常这样生活会带它来了转变 ,对于 该传统技术 已在航空航天、核试验模拟、天气预报、你的生命科学、高新制造(汽车、电子)等行业领域巨大成功了广泛应用。

以你的生命科学行业领域举例,随之你的生命遗传密码(基因组)的随之破解,人的生老病死是一复杂一一件事 才是明显减少才是明显减少用数字化的多种渠道具体说明呈现,以期可完成疾病的精准深入分析 、诊断和治疗后,让广大民众远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,大大全面提升人均预期寿命,并大幅度大大全面提升社会环境卫生负担。

二十年来,一人全基因组测序的成本以“超摩尔定律”的慢的下降,而高能计算在测序综合数据深入分析 方向中的应用也发生重大 了翻天覆地的转变 。对于 拥有世界 主流的基因组测序综合数据深入分析 工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项你的生命科学行业领域公认的最佳工作训练任务流程可完成三一人的全基因组(Whole Genome Sequencing,WGS)30X综合数据深入分析 才是明显减少才是明显减少1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算行业领域可以巨大成功突破进展,于日一次成功可完成6分钟可完成30X WGS全流程的深入分析 训练任务,相较于GATK新标准 计算时长提速300倍。

跟据NIH公布的最新资料,随之测序传统技术 的发展中,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟可完成30X WGS训练任务是由华大基因自主研发的LUSH工具集可完成的,打破了软件工具工具在2020年1月创造的15分钟极限慢的。多达的黑科技就是采用先进了新的内容的内容底层架构采用先进细节,可以提供了概念基科技馆础中央处理方式器和图形处理方式器相运用予以 基因综合数据深入分析 的高能慢的方案,在大大全面提升集群计算资源消耗、大大全面提升检出慢的的对于,可完成了全程自动化、关键信息化,有记录可回溯,才是明显减少才是明显减少更稳定地用于精准医学的应用场景。

LUSH工具集慢的的新的内容底层架构逻辑

LUSH工具集可以提供是一种高度“CPU+GPU”的高并行软硬件两个难题方案,概念基础经典流程中有软件工具模块BWA、SAMTOOLS和GATK,多种渠道GPU的通用运算传统技术 ,予以 计算引擎和慢的引擎的新的内容架构采用先进细节,可完成算法优化和并行化处理方式,并运用华大自主研发的超高通量测序仪,可完成碱基综合数据流的超高速深入分析 ,了一可以巨大成功准确的深入分析 了一。

LUSH工具集慢的流程示意图

就是对于你的生命数字化进程才是明显减少才是明显减少严谨的科学一种精神,而其应用场景对于体那对于 精准医疗、健康管理等与人类自身健康同样 息息有关的行业领域,对于不尽不尽相同于所有人高能计算行业领域,基因组综合数据深入分析 对精度有极高的明确要求。而对于高能和准确并没法对于兼得,综合数据范畴 、分布和浮点精度、峰值能和内存还是会造成影响算法的会选择,对于涉及到最大最优解和似解的算法对于大相径庭。LUSH工具集就是予以 在经典流程算法的概念基础上多种渠道了其新的内容采用先进细节的底层架构另一方面 明显减少了后面了一的读写,并多种渠道CPU可完成基因深入分析 训练任务的智能分发,多种渠道GPU数千计算核心可完成百万训练任务的极速并行处理方式,对于两个难题了经典流程计算密度较高、频繁地存储器访问等两个难题,多次反复测试其新标准 品的准确了一与经典流程一致,达到99.86%,对于其才是明显减少才是明显减少在计算了一的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有人高能计算应用行业领域的研发追求大目标。对慢的组件的持续下降研发图片频道对慢的无止境的追求,正如手机手机芯片大行业的发展中是随之移动端主要需求的旺盛,传统技术 才得以随之地迭代和进步。从基因组学概念基础研究者到临床研究者及应用,可完成测序工具的自主可控的对于也才是明显减少才是明显减少可完成数学多种方式上也自主研发,而不对于追求芯片的底层下潜开发。对后者是无止境的追求,而没法前者的对于可控才是明显减少可完成从跟随模仿到没法超越的对于,从核心算法的研发上助力国的精准医疗自主可控的发展中进程。

上一个:

下一个:

相关产品