NVIDIA DGX-1助力网易加速布局全产业链AI

作为中国领先的互联网公司,网易在开发互联网应用、服务及其它技术方面,始终保持国内业界的领先地位。网易利用最先进的互联网技术,加强人与人之间信息的交流和共享,实现“网聚人的力量”。其主营领先的业务包括游戏、新闻、教育、音乐、翻译等,新兴业务包括电商、云等都在行业拥有良好的口碑。

网易感知与智能中心是网易的AI技术核心机构,由博士后出身的李晓燕领衔。起初作为“多媒体技术组”,为网易邮箱的新功能提供有效的算法支持。此后,发展成为集算法、开发和业务为一体的网易AI科研与落地的核心机构。现已推出包括BOT平台、AR平台和开放平台在内的系统性AI支持体系。主要研究和落地技术包括图像识别、人脸识别、语音识别、语义理解和自然语言处理等,现已应用于网易云、音乐、游戏、教育、新闻等产品中。

需求推送变革,AI成为转型驱动力

面对互联网行业产品迅速迭代、用户需求多变,以及相应技术的高速发展,都对于网易的AI科研、产品迭代和业务创新提出了速度和品质上的更高要求。网易感知与智能中心从2012年开始就全面应用GPU来加速深度学习的研究和落地,从而能够给网易的核心业务在人工智能技术上提供快速和强有力的支持。从业务上来看,网易最先落地AI的核心业务主要有语音识别、客服机器人、机器翻译和游戏。

NVIDIA DGX-1发布使得网易很期待这款产品的强大性能,网易成为中国最早一批预定该产品的企业。2016年10月份下旬交付时,在NVIDIA的支持下,DGX-1半天内就在网易得到成功部署,与常规其他服务器部署一般需要数天安装和调试相比,效率提升十分明显。

DGX-1超级计算机突出的性能优势,包括其使用的最新Pascal架构的Tesla P100加速器,性能高达 170 TFLOPS,相当于250台服务器,对训练速度的提升不言而喻。其次,通过NVIDIA NVLink连接,实现高速大带宽直连通讯的快速互联机制。此外,通过IB网络,还能够进一步提升节点之间的通信速度。DGX-1所提供的具有行业针对性的软件、库和其他工具,都简化了编程和应用的难度,综合保障和提升了深度学习训练的速度。

网易感知与智能中心总经理李晓燕表示:“我们也在持续关注除GPU之外的其它深度学习硬件加速方案,目前看来针对互联网行业这种频繁迭代更新的业务场景,FPGA、ASICs等方案相对还不够成熟,而且开发成本比较高。比如,利用FPGA编程实现深度模型的计算加速,完成编码、仿真、调试验证等整个流程一般需要数周甚至数月时间。相较之下,NVIDIA为深度学习提供了完整的软硬件解决方案,技术成熟度高,同样的事情基于GPU进行开发,一周之内基本就可以完成。一周相比于几个月的时间,差距非常明显。深度学习技术发展非常快,同时互联网行业的产品需求也千变万化,我们很难接受几个月的开发周期,因为几个月之后,可能深度学习技术底层的模型结构和算法流程都变了,同时产品的需求也变了。DGX-1应该是市面上能买到的性能最强大的深度学习平台,对网易在人工智能效益方面有明显的提升。”

从局部到全产业链,DGX-1助力网易加速超越

成功部署后,DGX-1主要被网易在机器翻译、AI开放平台、网易云和游戏等核心业务上。基于DGX-1的在深度学习训练方面的高性能,网易得以提升在图像识别、人脸识别、语音识别、语义理解和自然语言处理等方面的技术实力,同时提升业务的个性化、用户体验、安全和效率。比如,加速网易翻译业务的模型训练速度;提升网易云的智能化效率;加强网易游戏基于语音和AI的游戏体验。

据李晓燕介绍,在基于深度学习的机器翻译业务上,基础的算法框架业界都差不多,但是底层的实现与优化,包括具体的每个模型的深度、尺寸、连接结构、数据处理流程等,有很多种不同的方案,其选择除了跟踪学术论文与公开报道,参考一些行业经验外,最关键的还是要根据企业不同的数据,不同的需求来开展实际的探索与验证。这个过程就需要训练不同的模型,然后再互相对比,挑选出最佳的方案。在采购DGX-1之前,如果不用集群进行训练,单节点在中等规模数据集上训练一次模型需要1个月的时间,但是采用DGX-1,训练时间可以大幅缩减到1周。因此,网易得以有机会尝试更多新的算法和模型,产品与功能的迭代和发展步伐能变的更快。从2016年下半年开始,基于深度学习技术的翻译系统逐步上线并提供服务。总体来说,有了DGX-1,大幅加速了网易AI技术研发的效率,促进了产品体验的优化。

在以业务落地为导向的网易,实现快速的从研发到落地,是网易感知与智能中心的工作重心。 受益于DGX-1的性能优势,网易得以更快的训练模型,优化网易翻译业务的准确度和响应速度,并支持翻译业务新功能、新玩法的落地。未来,除了核心的音乐和游戏业务之外,网易的全产业链,包括云计算、教育、新闻和电商等业务上都将获得AI技术的支持和优化。比如,利用AI加强新闻的内容生态建设,为内容生态打造有力的补充;在反欺诈方面,账号安全保障方面,内容的精准推送方面,都可以利用AI为产业链的业务进行全面加持。

基于NVIDIA DGX-1,网易在未来对于全产业链AI的落地更有信心和技术实力的支撑,在AI垂直和场景化的创新发展方面,将形成更具竞争力的优势。