All Node List by Editor

winniewei的头像
winniewei

7月7日——华为今天宣布已与大众汽车集团(“大众”)的一个供应商达成专利许可协议。

该协议包括华为4G标准必要专利(SEP)许可,涵盖装有无线连接功能的大众汽车。该协议是迄今为止华为在汽车领域达成的最大许可协议。

华为首席法务官宋柳平表示:“作为一家创新型企业,华为拥有领先的无线技术专利组合,为汽车领域创造了巨大价值。我们很高兴看到汽车领域的主流厂家认可我们专利的价值。我们相信,通过这一许可,全球消费者将受益于我们先进的技术。”

华为预计,根据目前签署的所有汽车领域专利许可协议,超过3000万辆汽车将获得其专利许可。

在过去20年里,华为与欧洲、美国、日韩等全球主要厂商签署了100多份专利许可协议。华为将继续致力于为全球更多汽车带来数字联接,构建万物互联的智能世界。

来源:华为

围观 28
评论 0
路径: /content/2021/100114330.html
链接: 视图
角色: editor
winniewei的头像
winniewei

在主题为“智联世界,众智成城”的2021世界人工智能大会上,嬴彻科技展示了两款自动驾驶重卡的量产车型。这两款车型分别是与东风商用车、中国重汽联合开发,搭载嬴彻轩辕自动驾驶系统,是全球最早的量产型自动驾驶重卡。嬴彻科技同台展示了其全栈自研自动驾驶技术的一系列最新成果。

两款自动驾驶重卡登台WAIC  全球最早实现量产

嬴彻首度展出和东风商用车、中国重汽分别联合开发的两款自动驾驶量产车型。2019年嬴彻启动与OEM联合开发自动驾驶重卡,两年来与产业伙伴紧密合作,遵守严谨的车辆正向开发流程,在自动驾驶领域共创多个行业第一。其中嬴彻与OEM联合开发的线控底盘,整合国际和国内Tier1资源设计,在转向、制动、电源系统均有多重冗余,实现了整车级线控底盘的全冗余方案,为重卡行业首创。

在这次大会上嬴彻也首次展示了全套车规级硬件套装,包括长距和补盲激光雷达、毫米波雷达、摄像头、GPS/IMU、计算平台、网关、T-Box、IVI-Box等,所有零部件均经过包括工程、开发、生产三阶段的严格认证,和电气、机械、环境和电磁的试验验证,满足重卡150万公里生命周期的可靠性耐久性。继完成冬季黑河寒区测试,嬴彻量产样车目前已完成加速耐久测试,并即将开展海南高温耐久测试。2021年5月,嬴彻获得国内首个重卡自动驾驶领域的最高级别ISO26262 ASIL D功能安全流程认证。

两款量产自动驾驶重卡登台WAIC 嬴彻科技全栈技术再攀高峰

全栈自研面向量产 自动驾驶技术再攀高峰

全栈自研的嬴彻轩辕自动驾驶系统在今年3月发布后,其核心算法和软件加速升级。嬴彻精准语义分割3D感知技术,通过“非对称3维神经网络模块算法”,实现即使在遮挡或是稀疏点云输入的情况下也能准确辨别驾驶场景下的小物体,该技术获得SemanticKITTI榜单第一。嬴彻针对重卡的节油算法(FEAD)也在更多车型和更多道路上得到验证。

嬴彻自研车载计算平台算力达245TOPS,可提供的CPU 和神经网络加速的计算能力显著领先于行业水平,并且支持更丰富的高阶自动驾驶传感器接入,最高可支持12路 4K高清摄像头,10路以上1000/100 Base T1以太网,内置GNSS传感器等,均为行业领先水平。目前样件已完成电子电气和电磁兼容测试,达到量产要求。

目前,嬴彻自动驾驶功性能所覆盖的典型ODD(Operation Design Domain)场景已超过500个,并通过仿真路测、封闭路测、开放路测不断优化算法,性能可满足高速全场景工况和各种复杂天气,近期将完成C样车的联合验收。

嬴彻科技创始人兼CEO马喆人表示:我们坚信以量产为依托的全栈自研才是一个自动驾驶公司的长期技术优势。嬴彻科技让自动驾驶重卡最早实现车规级量产,最快地在真实复杂道路上实现安全运行,正在加速成为卡车自动驾驶技术的行业领导者!

两款量产自动驾驶重卡登台WAIC 嬴彻科技全栈技术再攀高峰
2021世界人工智能大会,嬴彻科技展示最新两款自动驾驶重卡量产车型

稿源:美通社

围观 44
评论 0
路径: /content/2021/100114329.html
链接: 视图
角色: editor
winniewei的头像
winniewei

加速符合 O-RAN 标准的 5G 和 4G 网络的部署

是德科技公司(NYSE:KEYS)携手欧洲著名通信技术公司意大利电信(TIM)移动无线连接解决方案全球创新企业 JMA Wireless 2021 世界移动通信大会(MWC 21)上展示了最新开放式无线接入网(O-RAN)技术。是德科技提供先进的设计和验证解决方案,旨在加速创新,创造一个安全互联的世界。

这三家公司都在 O-RAN 联盟定义的开放接口为基础,全力研发无线接入网(RAN)技术,旨在推动符合 O-RAN 标准的 5G 和 4G 网络加速投入部署。TIM 和 JMA 使用 Keysight Open RAN Architect(KORA)解决方案验证 O-RAN 子系统的一致性、互操作性和性能,为创造新 5G 业务商机开路

是德科技副总裁兼网络基础设施事业部总经理 Giampaolo Tardioli 表示我们非常高兴能够 TIM  JMA Wireless 提供解决方案,有力支持 O-RAN 厂商验证每个网元能否在多厂商网络中发挥预期性能。

 MWC 21 ,TIM 采用是德科技的 RuSIM 来仿真 O-RAN 无线单元(O-RU),并验证 JMA Wireless 所提供的分布式单元(O-DU)和中央单元(O-CU)组合的功能、性能和一致性。RuSIM 不仅支持 4G LTE 网络,还支持 5G 新空口(NR)网络因此用户能够使用它来验证是否可以通过同一 O-RAN 前传接口提供多技术蜂窝业务。

JMA 意大利公司董事总经理兼国际销售部负责人 Remo Ricci 表示:我们很高兴与 TIM 和是德科技并肩合作,在 MWC21 上演示O-RAN 解决方案。得益于O-RAN 体系结构,移动运营商能够突破以往部署的传统技术的局限,为每一个网元自由选择心仪供应商。

是德科技的 RuSIM 允许用户仿真流经 O-RAN 前传接口真实网络流量,验证 RAN 的端到端性能。该产品属于是德科技无线接入网(RAN)、5G 核心网(5GC)和 5G NR测试解决方案组合的一员,该组合覆盖 RAN 边缘网络核心的整个应用领域

是德科技的 Open RAN Architect 采用全面、可重复自动化的测试流程,赋能移动运营商、开放测试集成中心(OTIC)以及芯片设计和网络基础设施厂商加快开发、集成和部署 O-RAN 设备。用户能够获得一系列通用解决方案,从流片前验证到云部署中的整个工作流程中轻松共享工作成果。

关于是德科技

是德科技(NYSE:KEYS)是一家领先的技术公司,致力于帮助企业、服务提供商和政府客户加速创新,创造一个安全互联的世界。从设计仿真、原型验证、生产测试到网络和云环境的优化,是德科技提供了全方位的测试与分析解决方案,帮助客户深入优化网络,进而将其电子产品以更低的成本、更快地推向市场。我们的客户遍及全球通信生态系统、航空航天与国防、汽车、能源、半导体和通用电子终端市场。2020 财年,是德科技收入达 42 亿美元。更多信息,请访问 www.keysight.com

围观 78
评论 0
路径: /content/2021/100114328.html
链接: 视图
角色: editor
winniewei的头像
winniewei

78日,2021世界人工智能大会(WAIC)即将正式拉开帷幕。本届大会围绕智联世界,众智成城的主题展开,将深入展现人工智能技术、产业和应用全球化发展的趋势。

伴随我们正快速迈向人与万物智能互联的世界,5GAI和云端的结合将驱动新一代智能边缘终端和云计算的发展。高通公司总裁兼CEO安蒙(Cristiano Amon)、高通公司中国区董事长孟樸、高通技术公司产品市场副总裁孙刚将在大会的多个环节发表主题演讲,与您分享5G+AI如何推动创新和经济增长,并带来高通公司的AI解决方案在移动、云端的最新技术落地以及高通公司推动智能驾驶发展的创新解决方案。如您计划参会,欢迎拨冗出席高通公司的主题演讲,我们诚邀您共同关注5G+AI赋能的重要机遇。

  • 主题演讲
时间

大会环节

演讲嘉宾

活动地址

7813:30-17:00

2021世界人工智能大会全体会议

——产业发展高峰论坛

安蒙

高通公司总裁兼CEO

世博中心

银厅3

78

13:30-17:30

智能芯片定义产业未来论坛

孟樸

高通公司中国区董事长

上海世博展览馆

1号会议室

710

09:30-12:00

智行破界——WAIC 2021智慧出行论坛

孙刚

高通技术公司产品市场副总裁

上海世博展览馆

1号会议室

  • 在线观看

2021世界人工智能大会(WAIC)同步开设云端峰会。云端会场需注册观看,免费注册现已开放,请点击链接或通过移动端云平台2.0填写信息注册获取通行证,高通期待与您云端相聚。

围观 21
评论 0
路径: /content/2021/100114327.html
链接: 视图
角色: editor
winniewei的头像
winniewei

随着全球各国政府着力于投资重点国家基础设施以实现制造、运输和医疗保健的现代化,他们正寻求加速5G网络升级的方法。康普推出的HELIAX® SkyBlox™满足这一需求,助力网络运营商以强劲的势头构建可靠的移动网络。

重量仅为一公斤的HELIAX SkyBlox™有助于最大限度地减少对塔架负载的影响,并将通常安装包括安装盒子塔架上、配置光纤固定所有电源线等所需总用时间减少50%以上。

康普外无线网络高级副总裁Farid Firouzbakht表示:移动互联对于经济复苏至关重要。网络运营商可以通过选择有助于自身应对挑战和简化安装的技术来加快5G网络的部署。全新HELIAX SkyBlox在加速部署和减少碳足迹的进程中创下了又一里程碑。

基于光纤的5G铺平道路

康普的HELIAX® SkyBlox™面向新建或扩展光纤到天线 (FTTA) 部署,专为精简、简化和支持最佳网络性能而构建。新系统由100%可回收材料制成,复合光纤和电源架构,以及塔部署的重量限制,能够降低向现有基站添加负载从而为运营商减轻上市时间延迟的负担。

Mobile Experts创始人兼首席分析师Joe Madden表示:运营商面临着如何在拥挤的蜂窝塔上同时承载4G和5G设备的严峻挑战。他们正在寻找能够结合模式和频段,且设计简单、结构轻巧的天线系统。在构建面向未来需求的网络战略中,电源和光纤的快速部署将至关重要

为进一步简化此类5G部署,康普还推出了HELIAX模块化FTTA解决方案,以在基带和无线电装置之间提供灵活连接。康普HELIAX模块化FTTA解决方案具有可扩展性和可堆叠性,使移动网络运营商使用紧凑机构的带有环境防护护套的单一馈缆,就能快速部署光纤和电源线。不含金属的耐用型电缆束同样由可回收材料制成,有助于减少无源互调 (PIM) 干扰,并减轻塔重量。

康普最新HELIAX®创新连接器解决方案还为网络运营商及其天线和OEM合作伙伴提供了一系列全新射频连接解决方?6?7?6?7案,以应对当今复杂而拥挤的5G网络需求。

关于康普:

康普(纳斯达克股票代码:COMM)致力于突破现有的技术界限,打造世界领先的有线和无线通信网络。由员工、创新者和技术人员组成的全球团队始终致力于为世界各地的客户预测未来趋势,塑造网络可能性。了解更多:https://zh.commscope.com/

围观 38
评论 0
路径: /content/2021/100114326.html
链接: 视图
角色: editor
winniewei的头像
winniewei

架构升级迭代,具备更强算力的通用人工智能训练芯片

202177——燧原科技今日发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群,成为国内首家发布第二代人工智能训练产品组合的公司。

燧原科技第二代通用人工智能训练芯片“邃思2.0”

燧原科技第二代通用人工智能训练芯片“邃思2.0

经过全新升级迭代后,邃思2.0的计算能力、存储和带宽、互联能力较第一代训练产品有巨大提升,对超大规模的模型支持能力获得显著增强。而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。完全自研的软硬件架构,助力燧原科技在知识产权和产品升级迭代上可以自主掌控方向和节奏。

燧原科技第二代通用人工智能训练加速卡“云燧T20”

燧原科技第二代通用人工智能训练加速卡“云燧T20

燧原科技第二代通用人工智能训练模组“云燧T21”

燧原科技第二代通用人工智能训练模组“云燧T21

四大核心升级 打造全新产品矩阵与智算集群

架构升级实现算力飞跃:邃思2.0进行了大规模的架构升级,新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32TF32FP16BF16INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,均为国内第一。

HBM2E存储带来海量吞吐:邃思2.0共搭载了4HBM2E片上存储芯片,高配支持64 GB内存,带宽达1.8 TB/s,是中国第一个支持世界最先进存储HBM2E和单芯片64 GB内存的产品。

高速互联支撑算力扩展GCU-LARE全域互联技术是燧原专为人工智能训练集群研发的互联技术,提供双向300 GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

全新软件驾驭澎湃算力:驭算TopsRider是燧原科技自主知识产权的计算及编程平台,通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

建设原始创新的通用算力和自主生态,加速产品商业化

“第二代人工智能训练产品的发布,是燧原科技开发原始创新的算力产品和构建自主生态又一重要的里程碑。通过芯片架构和软件平台的升级迭代,提升产品竞争力,满足市场需求,从而加速产品商业化的步伐。”燧原科技CEO赵立东指出,“在复杂的国际大环境下,原始创新和自主生态成为发展趋势,这也是燧原科技自创立以来始终坚持的战略选择,是支撑技术和业务长远发展,不断拉近与世界先进水平的距离,并在市场竞争中取得主动的基础。面向泛互联网、传统行业(金融、交通、电力、医疗、工业等)以及新基建三大业务方向,燧原科技正以全新、更具竞争力的产品,服务市场和客户。”

燧原科技CEO赵立东(左)与 燧原科技COO张亚林(右)共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原科技CEO赵立东(左)与 燧原科技COO张亚林(右)共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原科技COO张亚林介绍道:“邃思2.0大幅提升了算力指标,升级后的驭算软件平台更加便捷易用和客户友好,燧原科技也可针对客户的场景和业务模型提供软件定制化服务和优化,打造差异化解决方案。此外,基于云燧T20T21训练产品、GCU-LARE互联技术和新一代驭算,燧原科技可以打造超大规模的集群产品CloudBlazer Matrix,有效降低人工智能超算集群的整体复杂度和成本,同时通过与合作伙伴的联合开发,一起构建超大规模的液冷智能数据中心,以响应国家‘低碳算力’和‘绿色一体化智能计算’的战略方向。”

关于燧原科技

燧原科技专注人工智能领域云端算力平台,开发自主知识产权的高算力、高能效比、可编程的通用人工智能训练和推理产品,其创新性架构、互联方案和分布式计算及编程平台,可广泛应用于云数据中心、超算中心、互联网、金融及政务等多个人工智能场景,为人工智能产业发展提供普惠的算力基础设施和解决方案。

燧原科技携手业内国际标准组织,秉承开源开放的宗旨,与产业伙伴一起促进人工智能产业发展。

围观 113
评论 0
路径: /content/2021/100114325.html
链接: 视图
角色: editor
winniewei的头像
winniewei

专注于引入新品并提供海量库存的电子元器件分销商贸泽电子 (Mouser Electronics) 很高兴地宣布荣获Ohmite Corporation颁发的2020年度渠道合作伙伴奖Ohmite Corporation是一家知名的大电流、传感、高压和高能应用电阻器供应商,这个奖项是对贸泽出色的Ohmite新品销售业绩的肯定

Ohmite总裁Greg Pace表示:“我们很高兴将这个奖项授予贸泽,他们在2020年的优异表现让这个奖项实至名归,衷心祝贺贸泽。贸泽对Ohmite新产品的快速引进和推广帮助我们实现了业务增长。感谢贸泽全球团队的辛勤工作以及优质的服务。”

贸泽亚太区市场及商务拓展副总裁田吉平女士表示:“非常感谢我们重要的合作伙伴Ohmite授予我们这一荣誉,这是对我们团队出色表现的高度肯定。期待未来我们能继续深入合作,互助共赢。”

长期以来,贸泽与Ohmite保持着良好的合作关系。作为全球分销商,贸泽连续六年荣获Ohmite颁发的总裁菁英奖,并凭借全球销售增长和合作关系、快速的新产品导入能力、全球支持方面的优异表现,以及为客户和Ohmite提供始终如一的出色服务,摘得年度卓越销售奖。

自1925年以来,Ohmite在功率电阻器产品的设计和制造方面一直保持重要地位,并进一步延伸到大电流、高压、高能和可变电压控制电阻器的生产领域。此外,Ohmite还提供了一个全面的散热器阵容。如需了解更多有关Ohmite产品的信息,敬请访问https://www.mouser.cn/manufacturer/ohmite/

作为全球授权分销商,贸泽电子库存有丰富的半导体和电子元器件,并积极引入原厂新品,支持随时发货。贸泽旨在为客户供应全面认证的原厂产品,并提供全方位的制造商可追溯性。为帮助客户加速设计,贸泽网站提供了丰富的技术资源库,包括技术资源中心、产品数据手册、供应商特定参考设计、应用笔记、技术设计信息、设计工具以及其他有用的信息。

关于贸泽电子 (Mouser Electronics)

贸泽电子隶属于伯克希尔哈撒韦集团 (Berkshire Hathaway) 公司旗下,是一家授权电子元器件分销商,专门致力于向设计工程师和采购人员提供各产品线制造商的新产品。作为一家全球分销商,我们的网站mouser.cn能够提供多语言和多货币交易支持,分销超过1100家品牌制造商的500多万种产品。我们通过遍布全球的27个客户支持中心,为客户提供无时差的本地化贴心服务,并支持使用当地货币结算。更多信息,敬请访问:http://www.mouser.cn

围观 52
评论 0
路径: /content/2021/100114324.html
链接: 视图
角色: editor
winniewei的头像
winniewei

Quick-Connect IoT系统集成了用于MCU和传感器的模块化及标准化软硬件构件,进一步巩固瑞萨在物联网领域的优势

全球半导体解决方案供应商瑞萨电子集团(TSE:6723)今日宣布,推出创新物联网系统设计平台——Quick-Connect,可显著简化物联网系统的原型设计。瑞萨Quick-Connect IoT系统由标准化的板卡和接口组成,使设计者能够快速、轻松地将各种传感器连接至MCU开发板。该系统还提供可在板卡之间移植的核心软件构件,大大降低了编码要求。

作为Quick-Connect IoT系统的一部分,瑞萨电子与Digilent合作开发了全新Type 6A扩展I2C Pmod接口,以实现更广覆盖范围和更大灵活性。瑞萨已将Digilent的全新6A Pmod连接器标准化,用于新型Pmod传感器板和MCU开发套件。标准化还使设计人员能够非常灵活地为任何物联网原型设计选择优化产品组合。MCU板将带有双Pmod连接器,分别用于传感器Pmod和通信模块;Pmod亦可级联,实现更大灵活性。

瑞萨还为各种传感器重新定义了通用软件应用程序接口(API)和硬件抽象层(HAL)代码,并嵌入至瑞萨e2 studio集成开发环境中。现在,设计人员无需编写和测试数百行驱动程序代码,而仅需以图形方式选择他们的传感器并编写数行代码即可。所有集成与设置工作均在后台进行,缩短了开发时间。

瑞萨电子系统及解决方案市场部总监D.K Singh表示:“我们专注于解决方案的打造,使客户能够更迅速地将卓越的终端产品推向市场。例如,瑞萨开发的数百款‘成功产品组合’为客户提供了更高阶设计平台,从而降低设计风险并缩短开发时间。Quick-Connect IoT是我们专注于该技术领域的最新例证,未来我们将扩大其覆盖范围以支持更多板卡和产品。此外,拥有标准化的硬件连接平台也允许客户采用由第三方和其他供应商所开发的兼容Pmod。”

Digilent营销总监Talesa Bleything表示:“全新6A Pmod接口体现了我们致力于让系统原型设计更容易、更便捷的愿景。它符合I2C规范,具有可选的中断和复位引脚,以及可选的控制信号,为用户各种类型的系统开发带来更大灵活性。”

目前,Quick-Connect IoT包含10余款全新瑞萨Pmod传感器及其它模块化板卡,如空气质量传感器、流量传感器、生物感测、飞行时间、温度与其它传感元件等。同时,更多包括各种传感器和外围设备的瑞萨传感器Pmod也在开发中。RA、RX和RL78产品家族超过25款MCU开发板及套件可直接或通过瑞萨开发的小型转接板与新型Pmod 6A型标准相兼容;在不久的将来会同时支持RE和RZ开发板。客户可通过瑞萨的销售和样品发放渠道订购开发套件、传感器和转接板。

瑞萨电子高级副总裁Chris Allexandre表示:“我们的物联网领域客户需要的不仅仅是出色的MCU、传感器和软件;Quick-Connect IoT作为一款改变游戏规则的产品,强化了我们在物联网市场的优势。”

供货与更多产品信息

Quick-Connect IoT设计系统目前可通过瑞萨提供的各种硬件和软件产品获得。了解可用的板卡清单、软件下载链接、文献、操作视频等更多信息,请访问:http://www.renesas.com/quickconnect

关于瑞萨电子集团

瑞萨电子集团 (TSE: 6723) ,提供专业可信的创新嵌入式设计和完整的半导体解决方案,旨在通过使用其产品的数十亿联网智能设备改善人们的工作和生活方式。作为全球微控制器、模拟、电源和SoC产品供应商,瑞萨电子为汽车、工业、家居、基础设施及物联网等各种应用提供综合解决方案,期待与您携手共创无限未来。更多信息,敬请访问renesas.com。关注瑞萨电子微信公众号领英官方账号,发现更多精彩内容。

围观 42
评论 0
路径: /content/2021/100114320.html
链接: 视图
角色: editor
winniewei的头像
winniewei

模型大小不断增长给现有架构带来了挑战

深度学习对计算能力的需求正以惊人的速度增长,其近年来的发展速度已从每年翻一番缩短到每三个月翻一番。深度神经网络(DNN)模型容量的不断提升,表明从自然语言处理到图像处理的各个领域都得到了改进——深度神经网络是诸如自动驾驶和机器人等实时应用的关键技术。例如,Facebook的研究表明,准确与模型大小的比率呈线性增长,通过更大的数据集进行训练准确甚至可以得到进一步提高。

目前在许多前沿领域,模型大小的增长速度远快于摩尔定律,用于一些应用的万亿参数模型正在考虑之中。虽然很少有生产系统会达到同样的极端情况,但在这些示例中,参数量对性能的影响将实际应用产生连锁反应。模型大小的增长给实施者带来了挑战。如果不能完全依靠芯片扩展路线图,就需要其他解决方案来满足对模型容量增加部分的需求,而且成本要与部署规模相适应。这种增长要求采用定制化的构,以最大限度地发挥每个可用晶体管的性能。

图1:模型大小的增长速度(来源:Linley Group)

图1:模型大小的增长速度(来源:Linley Group)

Parameters (log scale):参数(对数刻度)

Image-processing models:图像处理模型

Language-processing models:语言处理模型

随着参数数量快速增长,深度学习架构也在快速演进。当深度神经网络继续广泛使用传统卷积、全连接层和池化层的组合时,市场上也出现了其它结构,诸如自然语言处理(NLP)中的自注意力网络们仍然需要高速矩阵和面向张量的算法,但是存储访问模式的变化可能会给图形处理器(GPU当前现有的加速器带来麻烦

结构上的变化意味着诸如每秒万亿次操作(TOps)等常用指标的相关性在降低。通常情况下,处理引擎无法达到其峰值TOps分数,因为如果不改模型处理方式,存储和数据传输基础设施就无法提供足够的吞吐量。例如,批处理输入样本是一种常见的方法,因为它通常可以提高许多架构上可用并行性。但是,处理增加了响应的延迟,这在实时推理应用中通常是不可接受的。

数值灵活性是实现高吞吐量的一种途径

提高推理性能的一种途径是使计算的数值分辨率去适应各个独立层的需求,这也代表了与架构的快速演进相适应。一般来说与训练所需的精度相比,许多深度学习模型在推理过程中可以接受明显的精度损失和增加的量化误差,而训练通常使用标准或双精度浮点算法进行。些格式能够在非常宽的动态范围内支持高精度数值这一特性在训练中很重要,因为训练中常见的反向传播算法要在每次传递时对许多权重进行细微更改,以确保收敛。

通常来说,浮点运算需要大量的硬件支持才能实现高分辨率数据类型的低延迟处理,它们最初被开发用来支持高性能计算机上的科学应用,完全支持它所需的开销并不是一个主要问题。

许多推理部署都将模型转换为使用定点运算操作,这大大降低了精度。在这些情况下,对准确的影响通常是最小的事实上,些层可以转换为使用极其有限的数值范围,甚至二进制或三进制数值也都是可行的选择。

然而,整数运算并不总是一种有效的解决方案。有些滤器和数据需要高动态范围。为了满足这一要求,整数硬件可能需要24位或32位字长来处理数据,这将比8位或16位的整数数据类型消耗更多的资源,这些数据类型很容易在典型的单指令多数据(SIMD)加速器中得到支持。

一种折衷方案是使用窄浮点格式,例如适合16位字长的格式。这种选择可以实现更大的并行性,但它并没有克服大多数浮点数据类型固有的性能障碍。问题在于,在每次计算后,浮点格式的两部分都需要进行调整,因为尾数的最高有效位没有显式存储。因此,指数的大小需要通过一系列的逻辑移位操作来调整,以确保隐含的前导“1”始终存在。这种规范化操作的好处是任何单个数值都只有一种表示形式,这对于用户应用程序中的软件兼容性很重要。然而,对于许多信号处理和人工智能推理常规运算来说,这是不必要的。

这些操作的大部分硬件开销都可以通过在每次计算后无需标准化尾数和调整指数来避免。这是块浮点算法所采用的方法,这种数据格式已被用于标准定点数字信号处理(DSP提高其在移动设备的音频处理算法、数字用户线路(DSL调制解调器和雷达系统的性能。

图2:块浮点计算示例

图2:块浮点计算示例

mantissa:尾数

block exponent:块指数

使用块浮点算法,无需将尾数左对齐。用于一系列计算的数据元素可以共享相同的指数,这一变化简化了执行通道的设计。对占据相似动态范围的数值进行四舍五入造成的精度损失可被降到最小。在设计时就要为每个计算块选择合适的范围。在计算块完成后,退出函数就可以对数值进行四舍五入和标准化处理,以便在需要时将它们用作常规的浮点值。

支持块浮点格式是机器学习处理器(MLP)的功能之一。AchronixSpeedster®7t FPGA器件和Speedcore™ eFPGA架构提供了这种高度灵活的算术逻辑单元。机器学习处理器针对人工智能应用所需的点积和类似矩阵运算进行了优化。相比传统浮点,这些机器学习处理器对块浮点的支持提供了实质性的改进。16位块浮点运算的吞吐量是传统的半精度浮点运算的8倍,使其与8位整数运算的速度一样快,与仅以整数形式的运算相比,有功功耗仅增加了15%。

另一种可能很重要的数据类型是TensorFloat 32(TF32)格式,与标准精度格式相比,该格式的精度有所降低,但保持较高的动态范围。TF32也缺乏块指数处理的优化吞吐量,但对于一些应用是有用的,在这些应用中,使用TensorFlow和类似环境所创建的模型的易于移植性是很重要的。Speedster7t FPGA中机器学习处理器所具有的高度灵活性使得使用24位浮点模式处理TF32算法成为可能。此外,机器学习处理器的高度可配置性意味着可以支持一个全新的、块浮点版本的TF32,其中四个样本共享同一个指数。机器学习处理器支持的块浮点TF32,其密度是传统TF32的两倍。

图3:机器学习处理器(MLP)的结构

3:机器学习处理器(MLP)的结构

Wireless:无线

AI/ML:人工智能/机器学习

Input Values:输入值

Input Layer:输入层

Hidden Layer 1:隐藏层1

Hidden Layer 2:隐藏层2

Output Layer:输出层

处理灵活性优化了算法支持

虽然机器学习处理器能够支持多种数据类型,这对于推理应用而言是至关重要,但只有成为FPGA架构的一部分,它的强大功能才能释放出来。可轻松定义不同互连结构的能力使FPGA从大多数架构中脱颖而出。在FPGA中同时定义互连和算术逻辑的能力简化了构建一种平衡架构的过程。设计人员不仅能够自定义数据类型构建直接支持,还可以定义最合适的互连结构来将数据传入和传出处理引擎。可重编程的特性进一步提供了应对人工智能快速演进的能力。通过修改FPGA的逻辑可以轻松支持自定义层数据流的变化

FPGA的一个主要优势是可以轻松地在优化的嵌入式计算引擎和由查找表单元实现的可编程逻辑之间切换功能。一些功能可以很好地映射到嵌入式计算引擎上,例如Speedster7t MLP。又如,较高精度的算法最好分配给机器学习处理器(MLP),因为增加的位宽会导致功能单元的大小呈指数增长,这些功能单元是用来实现诸如高速乘法之类的功能。

较低精度的整数运算通常可以有效地分配给FPGA架构的查找表(LUT)。设计人员可以选择使用简单的位串行乘法器电路来实现高延迟、高并行逻辑阵列。或者,他们可以通过构建进位保存和超前进位加法器等结构来为每个功能分配更多的逻辑,这些结构通常用来实现低延迟的乘法器通过Speedster7t FPGA器件中独特的LUT配置增强了对高速算法的支持,其中LUT提供了一种实现Booth编码高效机制,这是一种节省面积的乘法方法。

结果是,对于一个给定的位宽,实现整数乘法器所需的LUT数量可以减半。随着机器学习中的隐私和安全性等问题变得越来越重要,应对措施可能是在模型中部署同态加密形式。这些协议通常涉及非常适合LUT实现的模和位域操作有助于巩固FPGA作为人工智能未来验证技术的地位。

数据传输是吞吐量的关键

为了在机器学习环境中充分利用数值自定义,周围的架构也同样重要。在越来越不规图形表示中,能随时需要地方和时间传输数据是可编程硬件的一个关键优势。但是并非所有FPGA架构都是一样的。

传统FPGA架构的一个问题是,它们是从早期应用演变而来的;但在早期应用中,其主要功能是实现接口和控制电路逻辑。随着时间的推移,由于这些器件为蜂窝移动通信基站制造商提供了一种愈发昂贵的ASIC中转移出来的方法,FPGA架构结合了DSP模块来处理滤波和信道估计功能。原则上,这些DSP模块都可以处理人工智能功能。但是,这些模块最初设计主要是用于处理一维有限冲激响应(1D FIR)滤波器,这些滤波器使用一个相对简单的通道通过处理单元传输数据,一系列固定系数在该通道中被应用于连续的样本流。

传统的处理器架构对卷积层的支持相对简单,而对其他的则更为复杂。例如,全连接层需要将一层中每个神经元的输出应用到下一层的所有神经元上。其结果是,算术逻辑单元之间的数据流比传统DSP应用中的要复杂得多,并且在吞吐量较高的情况下,会给互连带来更大的压力。

尽管诸如DSP内核之类的处理引擎可以在每个周期生成一个结果,但FPGA内布线限制可能导致无法足够快速地将数据传递给它。通常,对于专为许多传统FPGA设计的、通信系统中常见的1D FIR滤波器来说,拥塞不是问题。每个滤波阶段所产生的结果都可以轻松地传递到下一个阶段。但是,张量操作所需的更高的互连以及机器学习应用较低的数据局部性使得互连对于任何实现而言都更加重要。

图4:滤波器和人工智能数据流

4:滤波器和人工智能数据流

Memory Cascade Out:存储级联输出

Operand Cascade in:操作数级联

Register File:寄存器文件

Fracturable:可分割

Adder/Accumulator:加法器/累加器

Memory Cascade in:存储级联

机器学习中的数据局部性问题需要注意多层级的互连设计。由于在最有效模型中参数数量庞大,片外数据存储通常是必需的。关键要求是可以在需要时以低延迟传输数据的机制,并使用靠近处理引擎的高效便笺式存储器,以最有效地利用预取以及其使用可预测访问模式的策略,来确保数据在合适的时间可用。

Speedster7t架构中,有以下用于数据传输的创新

  • 优化的存储层次结构
  • 高效的本地布线技术
  • 一个用于片内和片外数据传输的高速二维片上网络(2D NoC)

传统的FPGA通常具有分布在整个逻辑架构片上RAM块,这些RAM块被放置在距离处理引擎有一定距离的地方。对于典型的FPGA设计来说,这种选择是一种有效的架构,但在人工智能环境,它带来额外的和不必要的布线开销。在Speedster7t架构中,每个机器学习处理器(MLP都与一个72kb的双端口RAMBRAM72k)和一个较小的2kb的双端口逻辑RAM(LRAM2k)关联,其中LRAM2k可以作为一个紧密耦合的寄存器文件。

可以通过FPGA布线资源分别访问机器学习处理器(MLP及其关联的存储器。但是,如果一个存储器正在驱动关联的MLP则它可以使用直接连接,从而卸载FPGA布线资源并提供高带宽连接。

在人工智能应用中BRAM可以作为一个存储器,用于存储那些预计不会在每个周期中发生变化的值诸如神经元权重和激活值。LRAM更适合存储有短期数据局部性的临时值,诸如输入样本的短通道以及用于张量收缩和池化活动的累积值。

该架构考虑到需要能够将大型复杂的层划分为可并行操作的段,并为每个段提供临时数据值。BRAM和LRAM都具有级联连接功能,可轻松支持机器学习加速器中常用的脉动阵列的构建。

图5:具有存储和级联连接功能的MLP

图5:具有存储和级联连接功能的MLP

MLP可以从逻辑阵列、共享数据的级联路径以及关联的BRAM72k和LRAM2k逐周期驱动。这种安排能够复杂的调度机制和数据处理道,使MLP持续得到数据支持同时支持神经元之间尽可能广泛的连接模式。MLP持续提供数据是提高有效TOps算力的关键。

MLP的输出具有同样的灵活性,能够创建脉动阵列和更复杂的布线拓扑,从而为深度学习模型可能需要的每种类型的层提供优化架构。

图6:具有端点和I/O块的NoC

6:具有端点和I/O块的NoC

Multiplier / multiplicand fractions after converting inputs to have the same exponent:将输入转换为具有相同指数后的乘数/被乘数分数

Multiplier block exponent:乘数块指数

Multiplicand block exponent:被乘数块指数

Integer Multiply / Add Tree:整数乘法/加法树:

Convert to Floating Point:转换为浮点

Floating Point Accumulation:浮点累加

Round to desired precision:四舍五入到所需精度

Speedster7t架构中的2D NoC提供了从逻辑阵列的可编程逻辑位于I/O环中的高速接口子系统高带宽连接,用于连接到片外资源。它们包括用于高速存储访问的GDDR6和诸如PCIe Gen5和400G以太网互连协议。这种结构支持构建高度并行化的架构,以及基于中央FPGA的高度数据优化加速器。

通过将高密度数据包路由到分布在整个逻辑阵列上的数百个接入点,2D NoC使得大幅增加FPGA上的可用带宽成为可能。传统的FPGA必须使用数千个单独编程的布线路径来实现相同的吞吐量,而这样做会大量吃掉本地的互连资源。通过网络接入点将千兆数据传本地区域2D NoC缓解了布线问题,同时支持轻松快速地将数据传入和传出MLP和基于LUT的定制处理器。

相关的资源节省是相当可观的——一个采用传统FPGA软逻辑实现的2D NoC具有64NoC接入点(NAP),每个接入点提供一个运行频率为400MHz128位接口,将消耗390kLUT。相比之下,Speedster 7t1500器件中的硬2D NoC具有80NAP,不消耗任何FPGA软逻辑,并且提供了更高的带宽。

使用2D NoC还有其他的一些。由于相邻区域之间互连拥塞程度较低,因此逻辑设计更易于布局。因为无需从相邻区域分配资源实现高带宽路径的控制逻辑,因此设计也更加。另一个好处简化了局部性配置——NAP支持单个区域成为有效的独立元,这些单元可以根据应用的需要进行交换导入导出。这种可重配置的方法反过来又支持需要在特定时间使用不同模型者支持片上微调或定期对模型进行再训练这样架构

结论

随着模型增大和结构上变得更加复杂,FPGA正成为一种越来越具吸引力的基础器件来构建高效、低延迟AI推理解决方案,而这要归功于其对多种数值数据类型和数据导向功能的支持。但是,仅仅将传统的FPGA应用于机器学习远远不够的。机器学习以数据为中心的特性需要一种平衡的架构,以确保性能不受人为限制。考虑机器学习的特点,以及不仅是现在,而且在其未来的开发需求,Achronix Speedster7t FPGAAI推理提供了理想基础器件

围观 92
评论 0
路径: /content/2021/100114319.html
链接: 视图
角色: editor
winniewei的头像
winniewei

e络盟第三届物联网年度调查还证实,新冠疫情促使物联网在医疗领域的应用增加

安富利旗下全球电子元器件产品与解决方案分销商e络盟发布物联网最新调研报告。报告显示,物联网在工业自动化与控制应用中的作用日益增长,这对于实现工业4.0至关重要。e络盟全球物联网年度调查旨在进一步洞察物联网这一关键市场,尤其是物联网工程师所面临的机遇和挑战。

此次调查表明,工业自动化与控制25%、家庭自动化18%以及人工智能12%是物联网最主要的应用领域。然而,尽管业界将工业自动化与控制视为物联网关键应用市场,但也普遍认为工业4.0应用的增长仍然较为缓慢。究其原因,主要是因为安全性问题32%及业务战略缺乏30%阻碍了智能制造解决方案的采用和集成。调查还显示,安全性仍然是开发人员在物联网设计过程中需考虑的最重要问题29%,也是他们最为关心的问题36%,其次是连接性和互操作性。

物联网连接设备所收集数据的价值是物联网获得应用的重要因素之一。随着智慧城市、智慧工厂、智慧家庭及智能汽车之间的互联程度日渐加深,一些联网设备与系统已能自动交换并存储数据。这些数据能够促使企业机构改进众多业务运营水平、提高业务盈利能力或降低运营成本,同时还将助力实现更高品质、更高效能及更强合规性和预测性维护功能。48%的受访者表示,提升生产力和制造能力是他们设计物联网连接的主要考量。

调查还指出,人工智能将在物联网方案设计中获得持续应用。39%的受访者表示已经在项目设计中使用了人工智能,另有47%的受访者表示愿意在未来的项目设计中部署人工智能。此外,环境传感器仍然被评为物联网设备中最常用的传感器,可用于测量温度、湿度、压力、气体等。这一趋势在e络盟开展的三届物联网调查中始终延续。调查还发现,有48%的受访者使用单板机作为物联网方案设计的核心平台。

面向智能家居、工业、市场及政府的一系列创新解决方案为物联网的未来发展奠定了良好的基础。研究表明,物联网仍将是未来的设计重点。然而,当被问及其公司能否在未来物联网市场中占据主导地位时,一半的受访者49%)置信度为0-25%。仅有11%的受访者预期其公司将在物联网发展领域处于领先地位,并对公司发展有着明确规划。

2020年间,新冠疫情对物联网行业产生了重要影响,促使新型医疗设备和系统的开发迅猛增长,未来还将推动对更先进联网医疗设备的增长性需求。物联网日渐改变着患者的诊断、治疗和监测方式,并能为疫苗追踪、库存管理等提供支持。四分之一的受访者认为,医疗保健将成为下一个受益于物联网创新连接的重要行业。此外,将单板机用作物联网设计的核心平台也与e络盟此前收集到的客户反馈一致。疫情居家隔离期间,设计工程师已使用开发套件和单板机进行方案设计。

Farnell及e络盟全球技术营销部门总监 Cliff Ortmeyer表示:“至少从中期来看,工业自动化的发展和工业4.0的持续实施将形成规模最大、增速最快的物联网市场。这一领域是 e络盟业务发展的重点,也是我们当前大力投资的领域。e络盟致力于为客户的物联网开发之旅提供所需支持,不仅能提供更广泛的物联网产品和解决方案,还能提供深入的市场洞察来提升客户的专业知识并助力实现创新研发。e络盟全球物联网调查已先后开展过三次,业已成为物联网行业的风向标。通过了解工程师最看重的物联网解决方案特性、工程师构建物联网设计的方式,以及工程师面临的日常挑战等问题,我们能够更有针对性地根据客户的需求来改善服务,同时还能针对整个物联网市场提供有用且丰富的洞察理解。

e络盟2020物联网年度调查结果还分享了工程师的一些个人见解,涉及物联网设计中无线与有线连接选择、首选供应商、用于新型物联网设计的热门单板机、最常用编程语言和通信偏好等。e络盟提供广泛的产品和配套资源,能够帮助开发人员设计物联网解决方案并集成人工智能技术,其中包括来自领先制造商Raspberry PiArduino产品,以及来自施耐德MolexOmega等面向IAC应用的产品

e络盟还设有IoT中心,可方便用户获得最新产品、行业见解和白皮书,从而为他们整个设计流程提供所需支持。用户可访问Farnell(欧洲、中东和非洲)、Newark(北美)以及e络盟(亚太地区)查看e络盟第三届全球物联网调查项目完整调研结果。

关于我们

e络盟隶属于 Farnell 集团。Farnell是全球电子技术产品领导者,致力于科技产品和电子系统设计、生产、维护与维修解决方案的高品质服务分销已逾80年。作为专业的“电子元器件产品与解决方案分销商”,Farnell 凭借其丰富的业界经验向电子爱好者、设计工程师、维修工程师和采购人员等广泛的客户群体提供强有力支持,同时与全球领先品牌和初创企业积极合作,共同研发高新产品并推向市场。公司还全力协助推动行业的发展以期培养出一批优秀的当代和下一代工程师。Farnell在欧洲经营 Farnell 品牌,北美经营 Newark 品牌,亚太地区经营 e络盟 品牌。Farnell通过其广泛的分销网络及在英国的CPC公司直接向客户供货。

Farnell隶属于安富利公司(纳斯达克代码:AVT。安富利是一家全球技术解决方案提供商,拥有庞大而完善的生态系统,可在产品生命周期的各个阶段为客户提供设计、产品、营销和供应链专业服务。

欲了解更多信息,敬请访问:http://www.farnell.com/corporatehttps://www.avnet.com

围观 43
评论 0
路径: /content/2021/100114318.html
链接: 视图
角色: editor