论文

ISSCC 2017 Session 14 Slides整理(8/8)

论文八:A 135mW Fully Integrated Data Processor for Next-Generation Sequencing

机构:台湾国立大学,国立交通大学

简述:

第一款完整集成的下一代基因测序处理器,设计了硬件友好的NGS数据处理算法sBWT,对比常用的高端的GPU,能效超出8900x,单位面积吞吐率超400x。最终采用2048 SE单元达到1 cycle的延时;采用SA和OCC下降采样减少了98.7%的存储;反向搜索降低了96.7%的延迟,整体系统性能在40nm 下200MHz实现135mW的能耗表现。

注意:本篇论文芯片面向下一代测序技术,在生物测序方面笔者毫无基础,故本文很多内容以slides展示,不做展开解释,内容以slides为准。

主要内容:

(P3-4)面向下一代基因测序技术:医学、生物、物种检测众多场景有重大意义。但是在检测新基因序列中,数据复杂且数量巨大,检测难度很大。一般处理器功耗高,而且难以达到计算吞吐要求,需要专用的加速器,即NGS Data Processor。(NGS:Next-Generation Sequencing)

(P5)NGS的数据分析方法:sBWT算法,经过:

 

(P14)基于上述算法提出的架构:

10.png
Overall Architecture

(P15-20)其中核心计算步骤的硬件实现:

 

(P21-22)架构在存储和延时上的优化及成效:

(P23)芯片参数:在40nm 下200MHz实现135mW能耗表现:

19.png
Chip Photograph

(P24-25)性能数据:能效远高于现有常用的GPU等通用处理器

 

(P26)总结:

1、第一款完整集成的NGS处理器,实现了SA分类和反向搜索

2、贴近硬件的NGS数据处理算法sBWT:使用K排序的SA分类+访存规整的FM标注算法

3、架构优化采用2048 SE单元达到1 cycle的延时;采用SA和OCC下降采样减少了98.7%的存储;反向搜索降低了96.7%的延迟

4、对比高端的GPU,能效超出8900x,单位面积吞吐率超400x。

 

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s