【原创】新药研发进入算力时代,赛灵思FPGA大显身手(中)

【原创】新药研发进入算力时代,赛灵思FPGA大显身手(上)

作者:张国斌

赛灵思FPGA在医学领域大显身手

1.jpg

赛灵思大中华区数据中心业务销售总监钟屹(William Zhong)表示在今年5月10日的举行的首届中国生物计算大会暨数字医学创新峰会,围绕“如何定义生物计算”这一主题,分别从生物计算的行业需求、现状及挑战、发展驱动力等多个维度进行了深入探讨。 此次大会表明,生物计算作为跨界融合和与人类命运息息相关的技术产业,正在成为科技业的一个新热点。生物计算正日渐从研发中心走向行业应用,成为驱动整个产业链和人才梯队发展的新发展引擎。“生物计算 = 新数据 *新算法”成为大会公认的观点。

“赛灵思早在2018年就看到了大数据爆炸及人工智能普适对算力的强大需求,从2018年至今不断打造和扩展世界上最快的数据中心加速卡 Alveo 系列平台,使得其在整个医疗和生命科学研究工作中,成为了一个理想的创新平台。我们的很多合作伙伴,包括今天和我们共同参与分享的雪湖科技,人和未来,都是基于Alveo卡进行的研究和实现的行业突破。行业的需求,用户和合作伙伴所取得的成就,足以说明赛灵思在这个领域的投入,具有公认的技术前瞻性和有利的行业证明。”他指出,“由于数据大爆炸,特别是大量的非结构化数据的产生和各种不同应用,不同workload (工作负载)的加速需求,数据中心正在经历一次技术转型,我们看到从以往的以CPU为中心正转向定制的分布式计算,同时多种不同的应用、不同的workload及相应的算法更新迭代很快,远远超出芯片的发展速度,现有芯片架构无法满足上述更新迭代的速度与需求。

而赛灵思的Alveo加速卡可以适配各种不同的workload,可以满足各种不同且持续变化的工作负载。Alveo同时集成存储和网络的控制器,拥有强大的集成度,可以满足从云到端各种工作负载的各种性能需求。 

2.png

基于不同的应用,赛灵思的自适应加速平台 —— Alveo卡可以在三个方面很好的满足数据中心不同应用的要求,第一个就是高性能,最大的吞吐量和超低延时,这个是基于我们通过优化的领域专用架构,即英文经常说的DSA ( Domain Specific Architecture) 来实现的。这个是很重要的,也是我们跟其他方案最大差异化的地方。

另外,我们看到数据中心有这么多种不同的应用,相应的我们的这种加速卡,由于其特有的自适应这种能力,可以满足不断变化的工作负载。这种自适应能力对于数据中心企业节省投资、面向未来具有非常重要的价值。

第三点我们Alveo卡集成存储和网络控制器,在加速方面,不仅仅能够加速计算,同时还能加速存储、网络,通过单卡满足客户多样化要求。

基于上述三大优势,我们在能耗比这一块,性能和功耗能耗比在运营和成本上,都能给客户带来前所未有的价值。也正因为此,Alveo卡在公有云、线上还有在线下都得到了广泛的应用和部署。

3.png

上图是性能对比,跟CPU的性能来比,赛灵思FPGA的方案将性能提高了90倍,换句话说,CPU这一块之前做基因测序要30个小时,而基于FPGA的解决方案则实现了基因测序只要20分钟。所以就是90倍的性能提升。

他举的第二个案例是Twitch,Twitch是亚马逊的一个子公司,专注在在线游戏(online gaming)和电竞 (e-sport)。以同时满足300万个用户在线做比较,相比CPU,FPGA性能可以提升30倍,成本降低25%。

4.png

他指出赛灵思在2018年”DC First (数据中心优先)”这个战略指引下,持续将公司从一个器件供应商向平台提供商转型。赛灵思作为一个平台提供商,和很多合作伙伴一起打造了一个高效的生态系统,以便为越来越多的用户提供快速上手且前沿的创新平台。如上图所示,赛灵思的合作伙伴很多,包括阿里巴巴、百度、腾讯、浪潮、联想、戴尔、惠普等。“我们可以联合我们的公有云客户,ISV及解决方案提供商,服务器OEM,共同为客户提供整体解决方案。”他指出。

5.jpg

赛灵思数据中心加速系统架构师傅垚则介绍了赛灵思FPGA及自适应计算加速平台Alveo在生物医疗领域四个方面的应用案例。

第一个是是基因组学分析,他指出赛灵思的Alveo加速平台最大的一个特点就是能够加速的计算类型理论上是不受限制的,不像GPU对于浮点的高密度的矩阵或者是矢量运算比较强,但其他的就会有限制,或者CPU通用性强但是限制也多。

6.png

“赛灵思的加速平台可以加速各种类型的运算,并且都能够达到比较好的加速性能和效率。在基因组分析的整个端到端的流程上就会有比较明显的一个体现。比如现在我们第二代基因测序的一个基本流程首先是实验室先去提取样本,样本会放到我们的测序仪里面进行短序列的测序,短序列的测序过程中他其实就是说在测序仪里面会对我短序列的反应过程会获取很多的图像,我们通过图像的处理来确认我们序列碱基的情况,生成短序列。这个过程中就会用到很多图象处理的算法,这个是我们跟测序仪厂商,都会有一些这样子的项目在我们的测序仪里面做图像的处理。”他举例说,“我们拿到短序列之后我们可以去做一些序列比对和拼接,这样子的话可以形成一个比较完整的序列,来做我们后面的一些分析。这个序列比对拼接主要是一些字符串模式的比对。这其实是很典型的,像其他的针对浮点数据运算,或者我们的数学运算设计的这些加速器,譬如像GPU很难做很高效的处理,但我们FPGA仍然可以针对这种字符串模式的处理做到很好的加速效果。这是是赛灵思独特的优势。”

他表示在变体识别之后有高密度计算需求。Alveo加速平台所搭载的赛灵思器件也可以满足需求。从端到端整个的分析流程来看,赛灵思的加速平台其实在每一个步骤,都会提供加速。

他表示如果做性能对比,用8张英伟达的V100加速卡可以完成32个样本的处理,但是同样的样本处理,只用单张Alveo加速卡就可以实现超过46个样本的处理!

7.png

第二个应用是图形数据库,图数据库的应用主要是用在病历分析场景。他解释说一般来说医院或者说医生诊断的时候,病人会有很多过去的相关数据,比如说病人之前的一些发病情况,包括病人之前的一些诊断,还有他的保险,包括他的一些相关病史,包括他之前的一些遗传学分析和各种数据,赛灵思都会把他放到图形数据库里面做相似度分析。

8.png

他举了一个和北美合作伙伴 TigerGraph一起将进行的UHG项目案例。UHG 利用其病人信息构建了一个很大的图形数据库,大概有100亿个顶点和500亿个边,大概1.2T的数据。“相当于把所有的,包括医疗提供商,包括病人的基本情况,包括就医处方在内的所有数据,都放在这个数据库里面。在这个数据库里面我们可以通过相似度的分析,找到类似病例,可以去指导医生的判断和诊断,在这个应用场景里能够极大降低成本,并且能够更好的保证医护的质量。”他解释说。

9.png

第三个应用是医疗影像分析,这是FPGA的传统优势项目,常见的如X光的分析,包括CT扫描、超声或者内窥镜等类似应用。近年来这一类型的医疗影像分析用到了很多人工智能的算法,这些应用有把赛灵思芯片和设备融合在一起的分析案例,不过一些传统设备可能不具备智能化分析能力,则可以把这些数据放到医院的数据中心里做处理,这样医院也不需要去升级他的智能化分析设备。

10.png

“去年新冠疫情爆发以后,我们通过公开的数据库里面采集到的一些肺炎数据,用一些公开的模型去做的一个新冠肺炎的分析模型,我们基于原来普通肺炎的分析模型,拿新冠肺炎的X光数据做了重新训练,能够达到一个比较可观的对新冠肺炎的诊断分析的效果和准确率。这个模型已经放到了赛灵思Vitis AI Model Zoo,这样研究人员就可以随时拿到我们的模型和我们的数据,再结合他们自己已有的数据去做更进一步的模型的部署和升级。”他举例说,“因为我们的Model Zoo基本上相当于参考设计或者参考模型的情况,如果像医院或者是研究人员需要做进一步的更加准确的模型的训练或者他们有自己的一些私有的数据集,或者对一些不同的病症进行分析的话,他们完全是可以通过我们的Model Zoo的模型做一个重新训练,可以达到一个更好的效果,并且可以非常轻松的部署到赛灵思的Alveo加速卡上去做实时推断的。”

11.png

在CT断层扫描方面,可以通过二维的CT的数据,通过赛灵思一些算法能生成3D立体的表达,还有对基于低剂量的CT影像数据,通过深度学习的方法能够获得一个更高质量的CT成像,这可以降低病患在CT辐射下面的暴露量。

在超声影像方面,可以侦测一些可能比较重要的病灶区域,他表示赛灵思也基于公开的数据集、公开的模型在Alveo平台上做了一个例子,合伙伙伴可以用自己的数据重新训练并优化。

12.png

第四个应用是智慧医院,案例是赛灵思跟南美的一个合作伙伴医院在ICU里面实现智能监控,如果病人在病房里面摔倒或者病人身体移出病床,或者病人挥手呼救,或者在护士请求帮助的时候,都能够得到一个及时响应。

“我们的应用场景就是通过病房里边的监控,通过实时的AI分析,能够及时地检测到需要注意或者需要及时响应的情况。特别是在去年新冠疫情比较严重的情况下,医疗人员人手出现了极大的不足,医院就会发现不是每个病床一直都会有医护人员看守的,此时此刻这样的需求就会比较明显。”他指出,“这个应用部署在了Alveo  U50加速卡上,一台服务器需要三到五个U50加速卡,其中一个用来做视频解码分析,另外三张Alveo加速卡处理高密度的人工智能模型,是计算密度比较高的人工智能模型,包括姿态检测模型、像素分割、跌倒检测模型,在这些模型处理结果完成之后还会有一些应用的基本逻辑在里面完成,如姿态检测模型在结合人员追踪或者手势检测的模型后就可以检测出病人或者护士请求帮助的手势。而像素分割模型和姿态检测模型结合则可以检测到病人身体移出这个病床的情况。”

未完待续......

注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利!

最新文章