FPGA

人工智能芯片FPGA的30年成长史

我们知道,相对于专业的ASIC, FPGA 有上市时间和成本上的优势。另外,在大多数情况下,FPGA执行某些功能较之CPU上的软件操作更高效。这就是为什么我们认为它不但会运用在数据中心的服务器、交换器、存储层的各个角落,并且具有加速整个工作流程的功能。

标签

智慧云中的FPGA

作者:唐杉

人工智能大热之前,Cloud或Data Center已经开始使用FPGA做各种加速了。而随着Deep Learning的爆发,这种需求越来越强劲。本文主要讨论Cloud巨头Amazon和Microsoft的FPGA策略。

在Microsoft Build 2017大会上,微软Azure云计算平台CTO Mark Russinovich做了一个名为 “Inside Microsoft's FPGA-Based Configurable Cloud”的演讲,介绍了Azure平台中使用FPGA的情况(大家可以点击文末的阅读原文收看视频);另外,在Amazon的“Amazon EC2 F1 Instances”网站,有一个Webinar视频,介绍AWS的FPGA服务。本文将结合这两个讲座展开讨论,以下分别简称MS和AWS。

智能云对数据处理的需求

 

从需求层面来看,云端智能对数据处理有了更高的要求,体现在巨大的规模,低时延和高吞吐率几个方面。而从这几个角度来说,FPGA都有自己独特的优势。

 

机器视觉:让机器看世界

小时候第一次阅读艾萨克·阿西莫夫的《我,机器人》这篇小说时,故事中的类人机器人就深深吸引了我。这些机器人具备类人的视听以及与周围环境进行互动的能力。这些让人赞叹的能力打开了我的想象力大门。我甚至问过爸爸,这些机器人是否真的可以“看到”。现在,作为一名工程师我深刻了解到机器视觉以及“视力”对于机器人而言是多么重要。

移动相关应用的蓬勃发展使得人们对于智能未来的想象成为了现实——采用语音控制实现更智能的家居环境,更智能的传感器为实现智慧城市助力,更智能的工厂通过实现自动化解决了许多问题,智能的自动驾驶汽车更不用说了。机器视觉能够推动自主学习、自主决策和自主系统技术的发展。

机器视觉系统浅析

机器视觉对于硬件和软件有一定的要求。主要的要求之一是图像采集,这使用(大多数情况下)摄像头实现。例如,现代移动处理器具备摄像头接口,如MIPI CSI-2接口是许多移动相关应用中常用的接口。图像传感器可以很方便地捕获图像,并使用标准或自定义接口将传感器数据发送到处理单元。

利用 OpenCL™ 平台和英特尔® Stratix® 10 FPGA 加快深度学习发展

在这个高度依赖图像的时代,英特尔® FPGA 可利用 OpenCL™ 平台满足巨大的图像处 理和分类需求

简介
从 2015 年到 2020 年,互联网视频流量将增长四倍。[1] 鉴于可视数据的爆炸性增长, 找到有效的图像排序、分类和识别方法变得至关重要。卷积神经网络(CNNs)是一种基 于人脑功能的机器学习方法,通常用于图像分析。软件可将图像分为多个部分(通常采 取重叠操作),然后通过分析图像形成可视空间的整体示意图。该流程需要采用多个复 杂的数学运算步骤以分析、比较和识别图像,同时保持较低的错误率。

开发人员使用计算密集型算法创建 CNN,并在各种平台上对其进行实施。本白皮书介绍 了 CNN 在英特尔® Stratix® 10 FPGA 上的实施方案。对于大批量任务,该方案能以每瓦 每秒 70 幅图像的速度每秒处理 14,000 幅图像;对于批量大小为 1 的任务,该方案能 以每瓦每秒 18 幅图像的速度每秒处理 3,015 幅图像。† 这些数字表明,英特尔 Stratix 10 FPGA 在处理大批量任务时完全可媲美其他高性能计算(HPC)器件(如 GPU), 在处理小批量任务时则比其他器件更快。

CNN 性能指标评测

心之所向,无往不至 — “90后”全可编程创新新势力闪耀DDC 2017中国区总决赛

「可见光通信便携式多语种交互式语音讲解系统」、「机器人辅助康复训练系统」、「手势识别与空中写字系统」、「时间飞行相机」、「近红外静脉手背显像系统」、「可穿戴智能运动设备」……来自于全国各大高校的21项看点十足的“全可编程”创新创业项目,48位充满脑洞、才华、与激情的追梦少年,在刚刚过去的一个周末,Digilent Design Contest (DDC) 2017中国区决赛 见证了国内90后“全可编程创新新势力”的集体闪耀!

DIGILENT全可编程大赛(DDC)一直是全球FPGA领域,嵌入式系统领域知名的学生创新创业赛事,今年步入其第13个年头,已总共累计吸引了超过全球2万名学生参与其中。作为新DIGILENT回归后的重新登陆中国的首场DDC,本届赛事的决赛现场有哪些精彩看点?借着这篇文章,让我们带你回顾决赛现场的诸多精彩瞬间!

时间:2017年7月9日

坐标:上海交通大学闵行校区微电子学院

2017 DDC中国区总决赛由上海交通大学国家级双创示范基地承办,决赛会场设置在了上海交通大学微电子学院楼。炎炎夏日的决赛清晨,迈入交大“凯旋门”,远远就能望见微电子学院楼外的决赛现场“整装待发”!

百度云发布FPGA云服务器 加速人工智能应用开发

日前,百度云FPGA云服务器发布内测版本,成为国内率先推出可用的FPGA云服务的厂商。FPGA云服务器的发布,标志着百度云逐步将FPGA的技术实践经验对外开放,满足企业和开发者的高性能计算需求,助力人工智能和大数据应用。

FPGA是现场可编程门阵列(Field Programmable Gate Array)的简称,通常被应用于特定应用领域的计算加速,是异构计算家族重要的一员。近年来, GPU/FPGA的使用,使得深度学习的训练速度倍数提升,大规模、高性能的云端计算硬件集群成为人工智能发展的强劲引擎。FPGA在互联网、人工智能行业逐渐被应用起来,涉及人脸识别、语音识别、智能家居、智能交通、基因测序、视频、图像、文本数据处理等众多领域。