All Node List by Editor

winniewei的头像
winniewei

7月17-18日,在中国规模最大、规格最高的RISC-V峰会上,芯华章向数千名专业用户展示其面向RISC-V指令集打造的完整敏捷验证方案,其中最新发布的GalaxSim Turbo 3.0创新性地结合事件驱动和周期驱动双引擎在仿真性能上的优势,以自动负载调度算法提升并行仿真效率,在周期加速场景中,相比于传统商业仿真器相比可实现十倍以上的验证效率提升。

1.jpg

GalaxSim Turbo 3.0 

双仿真引擎兼顾性能和易用性

随着现在设计复杂性的提高,传统的逻辑仿真器产品在很多场景下受限于事件的异步行为,设计的分割(Partition)和线程同步有较大的限制,往往无法支持高速的并行仿真,从而大大限制了验证的场景和规模。

GalaxSim Turbo高速仿真模式让用户在不需要修改验证环境的情况下,大幅提高了仿真并行度。同时混合仿真模式兼顾了传统仿真器对SystemVerilog语法和UVM特性的支持,结合XEDB波形合并、功能覆盖率分析等一系列实用的调试工具,有效确保了验证流程的连贯性。

使用门槛更低

支持Verilog/SystemVerilog全语法,额外支持SVA,Functional Coverage等Verilator没有的功能,同时可在原先的仿真用例上可以一键切换;

易用性更强不局限C Testbench,验证环境的移植平滑,维护成本大大降低;

并行效率高Verilator线程数目需要编译前指定,Turbo的线程数目可以在RunTime的时候根据服务器资源指定,大大提高多线程的管理效率;

仿真运行速度更快在拆分设计之前对设计描述方式和信号同步机制进行深度优化,同时可以根据客户设计特点进行特殊的定向优化;

运行资源管理优化运行时可以自动寻找合适的CPU资源,并得到计算资源,通讯资源的优化匹配;

调试能力强支持并行下载芯华章波形文件格式XEDB,波形文件大幅减小,下载速度显著提升,得到完整的一体化Debug体验。

表1:RISC-V开源项目实践,验证效率显著提升

2.png

芯华章科技联席CEO谢仲辉表示:“在科技竞争异常激烈的今天,我们以AI赋能EDA技术革新的同时,也在积极地探索具有巨大潜能的应用场景,以更敏捷、更充分、更完备的验证方案,保障基于RISC-V架构相关产品的稳定性,从而助力RISC-V其获得大规模的商业部署,发展中国自主可控的RISC-V架构芯片服务于市场。”

芯华章在与芯来、开芯院、国家集成电路设计自动化技术创新中心、中国科学院计算技术研究所等多家客户深度合作中,产品也在不断升级,帮助客户解决从IP高度定制化到系统软硬件协同验证等一系列挑战。

3.jpg

RISC-V 具有高度可定制化和场景复杂的特点,在AI芯片定制当中,设计者为了提高计算效率、支持如浮点运算、AI算子等特定应用需求,往往会对传统处理器指令(如RISC-V)进行扩展定制,而其计算复杂度高,验证难度大,使用传统验证方法难以做到有效完备验证。

GalaxEC

面向EDA 2.0目标,芯华章运用新一代形式化求解算法和并行计算技术打造高性能求解引擎,GalaxEC基于形式化底层技术,能一站式满足用户全流程等价性验证需求,避免多工具切换成本,帮助工程师确保不同层次设计之间的一致性,同时,GalaxEC HEC可完备验证RISC-V处理器算子实现的正确性,包括算术逻辑单元ALU、整数运算单元及浮点运算单元等C++算法模型到RTL实现的等价性,可支持原生云部署,更好地满足敏捷验证与设计需要。

基于RISC-V的应用系统需要系统级验证及软件适配,更多软件生态需要移植到RISC-V处理器,但由此带来的bug是软件问题还是硬件问题?定位和调试困难,需要更强大的软件代码-硬件电路联合调试手段。

HuaPro P3

HuaPro P3采用最新一代可编程SoC芯片,结合自研的HPE Compiler工具链 ,可支持容量更大、速度更快、更多最新高速接口的用户芯片设计;同时,对基于RISC-V等多种异构处理器架构的定制化高性能应用芯片,HuaPro P3的软硬件系统可支持自动化和智能化的实现流程、支持灵活模块化扩展和云部署,有效减少用户人工投入、缩短芯片验证周期,兼顾验证性能和深度调试的需求。

关于第五届RISC-V中国峰会

RISC-V中国峰会是全球三大RISC-V专业会展之一,也是中国规模最大的RISC-V年度活动。

本届由上海开放处理器产业创新中心(SOPIC)主办,旨在协同RISC-V产业链上下游企业,共建RISC-V关键共性技术平台,用开放的硬件平台构建开源的软件生态,从而有力促进RISC-V技术的产业化应用和商业化落地。

来源:芯华章科技

围观 22
评论 0
路径: /content/2025/100593270.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:安森美

无人机以高效创新的方案,改变了多个行业的格局。在农业领域,无人机助力精准农业、作物监测和牲畜追踪。工业部门利用无人机进行现场勘测、基础设施检查和项目监控。无人机还在革新配送服务,尤其在向偏远地区运送包裹、医疗用品和紧急援助物资方面表现出色,本文将重点介绍其系统实现。

无人机的众多应用

1.测绘无人机

这类无人机配备了高分辨率相机和深度传感器,能够为建筑、采矿和环境监测等领域创建详细的地图和 3D 模型。

2.巡检无人机

这类无人机借助热像仪和传感器检查桥梁和管道等基础设施,能够提供实时数据,并发现裂缝和腐蚀等问题。

3.农业无人机

这类无人机利用多光谱传感器监测作物健康状况、管理灌溉,以及喷洒农药或肥料,助力精准农业发展。

4.配送无人机

这类无人机专为货物运输而设计,适用于物流、医疗保健、电子商务等领域,可实现快速高效的配送服务。

5.监控与安防无人机

这类无人机配备高清相机和热成像技术,能够监控大范围区域和检测入侵行为,从而增强安全性。

6.重载无人机

这类无人机载重能力出色,可在建筑、救灾和物流领域用于运输物资和设备。

7.环境监测无人机

这类无人机用于监测空气和水质,以及野生动物种群,为研究和保护工作提供数据支持。

8.应急响应无人机

在紧急情况下用于运送医疗物资、寻找幸存者和评估损失;借助热像仪和扬声器提升救援行动的效率。

9.建筑无人机
这类无人机用于勘察现场、监测施工进度和开展安全检查,能够提供实时数据和高分辨率图像,从而实现更高效的项目管理。

1.png

无人机分类

2.png

表 1.不同类型无人机的优缺点比较

3.png

无人机自主导航系统


图像和深度传感器是无人机导航系统不可或缺的一部分, 它们为无人机提供环境感知和交互所需的关键数据。 图像传感器(例如高分辨率摄像头) 通过检测和追踪视觉地标来支持视觉导航, 这在没有 GPS 的环境中尤其有用。 这些传感器让无人机能够识别障碍物, 沿着指定路线飞行, 并根据视觉输入进行实时导航调整。

图像传感器捕获的视觉数据由先进的计算机视觉算法进行处理, 使无人机能够解读复杂的场景并做出明智的决策。 相反,深度传感器通过发射激光脉冲并测量反射信号, 来生成周围环境的精确 3D 地图。

这项技术使无人机即使在光线不足或视觉干扰严重的环境下, 也能高精度地穿越复杂地形并避开障碍物。 通过先进的传感器融合技术, 将图像传感器和深度传感器的数据进行整合, 能增强无人机的态势感知能力, 使无人机具备避障、 精确导航和自主决策等复杂功能。 视觉和深度感知的结合, 对于无人机在多样化和具挑战性的环境中高效可靠地作业至关重要。

基于 GPS 的导航是无人机导航系统的另一大基石, 它借助全球定位系统确定无人机的精确位置, 并引导无人机飞向预先设定的航路点。 GPS 能提供可靠的定位数据, 这对于无人机在户外应用中保持航向和准确抵达目的地至关重要。 该系统的工作原理是接收多颗卫星发出的信号, 然后通过三角测算法确定无人机的精确位置。 

然而, 在某些环境中, 比如在室内、 茂密的森林里或在高楼大厦阻挡信号的城市峡谷地带, GPS 信号可能会受到干扰或根本无法接收到信号。 为了克服这些局限性, 可以将 GPS 与图像传感器、 深度传感器等其他传感器相结合, 以确保无人机实现持续且精确的导航。

这种混合导航方式使无人机能够在不同的导航方法之间无缝切换, 从而增强其在各种场景下的作业灵活性和可靠性。 通过将 GPS 数据与实时传感器输入相结合, 即使在 GPS 信号微弱或丢失的情况下, 无人机也能保持精确的定位和导航, 确保在各种环境中都能持续稳定地工作。

无人机感知系统

为无人机选择图像传感器时, 务必要考虑应用的具体条件和要求。 通常,一个系统可能会使用六到八个传感器, 但使用多达十二个传感器的情况也并不少见。 

全局快门传感器能够同时捕捉整个画面, 非常适合用于拍摄移动物体, 因为它们可以避免图像失真和运动伪影。 这对于测绘、 勘察和工业巡检等对精度要求极高的应用尤为重要。 通过同时捕捉整个画面, 全局快门可以防止卷帘快门中常见的“果冻效应” 和运动模糊等失真。

  • 低功耗图像传感器具有多项优势,其功耗低,还能部署在多个位置,从而可以提供场景的全面视图。

  • 高动态范围 (HDR) 相机在无人机技术中至关重要,可在不同的光照条件下捕捉到细节丰富、准确清晰的图像。这种相机能够平衡明暗区域的曝光度,确保在复杂的光线条件下也不会遗漏任何细节。

  • 高分辨率:2000 万像素的 Hyperlux AR2020 将进一步增强这些能力,使巡检和勘测工作能够更细致、精确地开展。

  • 拓展视野:借助 SWIR 图像传感器,实现超越可见光范围的观测。

5.jpg

围观 38
评论 0
路径: /content/2025/100593269.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

随着RISC-V开放指令集架构在高性能计算、人工智能等领域的深入应用,其开放、模块化、可扩展的特性不断被发掘。然而,在实时性要求极高的场景,如工业控制、嵌入式系统、IO外设虚拟化等方向,RISC-V的落地依然面临挑战。在第五届RISC-V中国峰会前沿创新技术论坛上,鹏城实验室工程师黄哲在其题为《Sophon:低延迟、可扩展的开源RISC-V架构》的报告中,提出了一套以“控制确定性+指令加速”为核心的Sophon架构方案,有效填补了该领域的技术空白。

1.png

架构设计背景与技术定位

黄哲指出传统通用处理器内核尽管在编程灵活性方面表现出色,但在需要纳秒级时序精度控制的场景中表现力有限。软硬件之间的调度不确定性导致行为不可预测,难以满足高可靠控制的需求。而硬件逻辑虽能实现确定性强的控制,但开发复杂、迭代缓慢。因此,如何让软件也具备硬件级的时间精度和响应确定性,成为Sophon架构设计的出发点。

2.png

为此,黄哲团队基于两条思路展开架构设计:单周期执行模型:构建能够在一个时钟周期完成所有操作的精简内核,实现软件级对时序的精准控制;高效指令扩展机制:支持批量操作数传输和多参数指令调度,将关键高频任务通过自定义指令固化为加速单元。

Sophon 内核架构详解

1 单周期精简内核

Sophon采用单周期五段式流水线,实现了从指令获取、解码到执行的每一步都仅需一个时钟周期。支持fGPIO、snapreg等轻量级控制指令,可实现在固定周期内控制IO状态变化,实现了“软件时序即硬件时序”的理念。

该结构中还引入SR(Snap Register)机制,允许在指令结束后立即访问数据,进一步压缩路径延迟,适用于高频IO模拟和控制场景。

3.png

2 PDA自定义指令接口

Sophon定义了名为PDA(Programmable Data Access)的接口,实现对标准RISC-V指令的增强扩展,分为两类:

Cast1:增强型自定义指令,支持同时传递多个操作数并并行控制多个数据路径,适合高频IO操作加速;

Cast2:适用于复杂逻辑行为的用户定制逻辑指令。

该设计打破了传统RISC-V自定义指令“操作数数量受限”的瓶颈,最高可传递30个操作数,满足多通道并发操作需求。

3. 应用实例分析:IO-Hub外设虚拟化平台

黄哲团队基于Sophon架构,开发了一款名为IO-Hub的控制平台,专用于高性能SPI接口模拟和并行外设控制。

4.png

IO-Hub结构设计

每4路GPIO及其辅助加速模块构成一个虚拟接口单元,多个虚拟接口通过并行通路驱动多路外设,支持多种时序接口(如SPI、I2C、PWM)在软件中进行仿真模拟。

 自定义指令加速优化

在标准实现中,对SPI每个bit的模拟处理需要11条指令;在Sophon架构下,通过自定义指令优化,降低至仅4条指令完成完整bit处理,显著提升接口模拟速率。

4. 性能评估

5.png

1 硬件资源对比

他指出评估结果表明,在集成多个SPI接口的应用场景中,Sophon+IO-Hub方案的资源开销明显优于传统实现,尤其在SPI接口数超过8路时优势显著。

2 实际运行频率

峰值性能:在50MHz内核频率下,单通道SPI接口模拟频率达12.5MHz以上;并行性能:可并行模拟8路独立数据流的SPI接口,单路模拟频率达4.17MHz,实现了多接口低延迟控制的目标。

总结与展望

6.png

黄哲指出Sophon架构通过单周期内核与可扩展指令系统的有机结合,成功将RISC-V架构优势扩展至对时序精度、延迟控制要求极高的嵌入式应用场景。其创新点主要体现在:软件可编程内核具备硬件级控制能力;自定义指令扩展突破传统限制,支持高效多参数并行操作;在GPIO、SPI等接口模拟中实现性能与资源效率的显著提升。

未来,Sophon的核心理念有望被广泛应用于工业自动化、机器人控制、实时信号处理和边缘AI设备等领域,进一步拓展RISC-V在实时控制领域的边界。

围观 43
评论 0
路径: /content/2025/100593267.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

1.png

在日益复杂的无线通信系统中,如何在工艺受限的环境下实现高性能、低功耗的数字信号处理(DSP)成为芯片架构师面临的重要挑战。在第五届RISC-V中国峰会前沿创新技术分论坛上芯昇科技高级专家、中国移动拔尖人才李高山发表了题为《DSP领域最新RISC-V指令集及DSA在无线领域中的创新应用》的报告,深度解析了RISC-V在DSP领域的演进与专用架构(DSA)在通信应用中的突破性价值。

一、背景:DSP和通信芯片的矛盾

李高山指出随着5G/6G通信标准的推进,无线信号处理计算密集度显著提升,而工艺水平却受制于外部限制,停留在中低端节点。面对标准协议统一、工艺同质化的“双重挤压”,通信芯片厂商在传统架构下难以实现有效差异化。李高山指出,此背景下指令级定制能力更强、架构更开放的RISC-V平台,为通信DSP的创新提供了理想土壤。

二、RISC-V DSP-W:为无线而生的指令集扩展

2.png

他表示芯昇科技联合芯来科技共同推动了名为RISC-dsp-W的新一代DSP指令集,它基于RISC-V架构进行深度定制,作为RISC-V基金会RVV SIG筹备中的DSP TG(Task Group)标准候选方案之一。其核心优势体现在以下几点:

3.png

1. 增强型定点算术支持

引入饱和(saturation)、摄入(rounding/clipping)等机制;

提供更广的动态范围与更高的精度,适配复杂信号特性。

2. 原生复数运算能力

支持SC16等主流复数数据类型;

内建复数加乘、乘累加等基本操作指令,提升FFT、滤波效率。

3. 数据类型转换优化

实现整数、小数、复数间的快速转换;提供一致性强的硬件加速接口(如SFT指令集族)。

4. 快速非线性函数支持

内建指数、对数、tanh、sigmoid等AI常用激活函数的分段函数实现;

适配AI/DSP混合场景下的高效计算需求。

李高山展示的数据表明,在无线信号处理中,相同硬件资源下RISC-dsp-W可实现RVV架构4~5倍的性能提升,尤其在点积、卷积等核心DSP算子上表现优越。

三、DSA 架构:为定制而生的RISC-V实践

他指出DSA(Domain Specific Architecture)是旨在为特定领域设计出架构级别最优的解决方案。RISC-V的模块化和开放特性与DSA的需求天然契合,为无线通信领域提供了精准突破路径。

4.png

他指出当前基带芯片架构的问题:标准协议固定,无法差异化;通用DSP(如SIMD/VLIW)效率低、功耗高;ACCE类硬件方案缺乏灵活性,只能做低层比拼等。而DSA的突破点则是以RISC-dsp-W为基础构建面向无线信号的定制加速器--面积、功耗与ACCE方案相当,但具备指令级灵活性;还能根据实际场景进行算法、算子级别的优化,更适配非标需求。

在该架构指导下,芯昇与芯来合作开发的ND900处理器已成为首个支持RISC-dsp-W指令集的DSP核,展现出优于传统DSP在功耗密度、指令效率和灵活性方面的显著优势。

四、自研高性能DSP:释放国产架构潜力

李高山在演讲最后介绍了芯昇最新发布的一款基于RISC-dsp-W的自研DSP架构。其核心特性如下:

混合编程模型:C语言与矢量汇编结合,兼顾易用性与极致性能;

自动向量化适配:针对目标算法可灵活配置VPU(向量处理单元);

高指令效率:同等算力下面积缩小至1/3,功耗显著下降;

设计理念极简主义:去除无用指令与功能单元,最大程度压缩PPA。

正如李高山所比喻:“通用DSP就像轿车,而定制化RISC-V DSP更像赛车——剥离冗余、轻装上阵,目标就是极致的领域性能表现。”

五、RISC-V + DSP + DSA = 通信芯片破局之钥

5.png

面对通信芯片“同质化、价格战”的僵局,李高山指出以RISC-V为核心、DSA为方向、RISC-dsp-W为落地载体的架构路径,正为行业提供一条在性能与灵活性之间取得最优平衡的新解法。芯昇科技等头部企业的推进,标志着国产DSP技术在无线通信领域迈向自主可控、高性能发展的关键节点。

作者注:RISC-dsp-W相关标准正在RISC-V基金会的DSP TG中积极推进,未来可能作为Z扩展(如Zvspw)正式发布,预计将对国内外通信与AI芯片设计产生深远影响。建议持续关注该指令集在开源社区和产业界的最新动态。

围观 66
评论 0
路径: /content/2025/100593266.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

随着计算应用场景愈发多样化,传统通用处理器架构已难以全面兼顾性能、功耗与可定制性。在这种趋势下,RISC-V 以其开放性与高度可扩展性脱颖而出。在第五届RISC-V中国峰会前沿创新技术分论坛上新思科技资深应用工程师毛海雪在其演讲《将RISC-V扩展至VLIW、SIMD架构,应对特定应用工作负载》中,系统性地剖析了如何将RISC-V从基础架构延伸至VLIW(Very Long Instruction Word)与SIMD(Single Instruction, Multiple Data)架构,以满足面向特定应用(如AI推理、音视频处理等)的高性能需求。

1.png

RISC-V扩展性的基础逻辑

毛海雪指出RISC-V架构的最大特点之一便是其指令集的可扩展性。毛海雪指出,这种扩展分为两大类:一个是标准扩展(Standard Extensions):如整数(I)、压缩(C)、浮点(F/D)等,由RISC-V基金会维护,需经过标准流程审核。另一个是定制扩展(Custom Extensions):由设计团队根据特定应用自定义开发,能够融合多条基础指令,生成一条高效复合指令,从而在保持精简架构理念的同时实现高性能或低功耗。

2.png

这种“模块化、可裁剪”的架构哲学使RISC-V极其适用于应用特定处理器(ASIP)的开发场景。

指令级并行与VLIW架构扩展

3.png

她指出当应用对并行性提出更高要求时,传统的顺序执行方式已显不足。RISC-V的一个重要扩展方向便是构建静态多发射(Static Multi-Issue)架构,即VLIW。与动态多发射(Dynamic Multi-Issue)相比,VLIW的主要特点包括:

编译器级并行提取:并行化任务由编译器在编译阶段完成。

多槽位指令包:超长指令由多个执行槽组成,每个槽控制不同的功能单元。

适用于专用处理器设计:在性能、面积、功耗之间取得良好平衡,尤其适合音频处理、图像识别、神经网络推理等领域。

4.png

毛海雪以MobileNet v3加速器为例,展示了将RISC-V进行VLIW架构扩展后的效果。该处理器在保留RISC-V原有指令和软件生态的基础上,新增了3个向量单元,架构扩展后性能提升了360倍左右。

数据级并行与SIMD/V扩展

5.png

她表示另一种常见的并行处理方式是进行RVV扩展,这是一种数据级并行。RVV扩展的硬件实现也比较复杂,扩展后的架构中通常包含400条以上的指令。

RISC-V定制工具链:ASIP Designer助力架构探索

6.png

她表示RISC-V扩展不仅依赖设计思想,更需要强有力的EDA工具支持。毛海雪详细介绍了ASIP Designer在架构拓展中的作用:

nML语言建模:通过nML对处理器进行结构性描述,便于快速建模和架构修改。

自动生成SDK:ASIP Designer可在数秒内自动生成完整的软件开发工具链(包括编译器、调试器等),支持高效的软件模拟和验证。

硬件级验证与优化:自动生成可综合RTL代码,并支持PPA(功耗、性能、面积)分析,确保架构设计可落地。

内建大量处理器模板:支持CPU、DSP、AI加速器等不同类别的处理器模型,开发者可直接修改现有模板快速迭代。

这一工具链极大提升了处理器从概念到原型的开发效率,尤其适用于快速迭代、资源受限的芯片项目。

面向未来,拓展RISC-V的性能疆界

RISC-V不仅是一种处理器架构,更是一种设计范式的革新。在数据驱动与边缘智能爆发的时代背景下,如何通过定制扩展释放RISC-V的潜力,成为产业关注的焦点。

毛海雪在本次演讲中提供了清晰的路径指引:

利用定制扩展实现差异化竞争力;

通过VLIW和SIMD等架构形式应对高并行需求;

借助ASIP Designer等工具加速软硬件协同设计。

随着RISC-V生态持续繁荣,这些面向特定工作负载的架构定制化能力,将成为其在AIoT、可穿戴、边缘计算等领域持续推进的核心驱动力。

围观 116
评论 0
路径: /content/2025/100593264.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

在当前软硬件安全问题日益凸显的背景下,如何在性能与安全之间取得平衡已经成为芯片设计与操作系统架构中的关键难题。在第五届RISC-V中国峰会前沿创新技术分论坛上,上海交通大学夏虞斌教授带来的报告《RISC-V软硬协同的安全隔离:蓬莱实践”》全面系统地展示了其团队在可信执行环境(TEE)方面的研究成果与技术创新,为RISC-V生态提供了一种极具实用性和前瞻性的安全计算范式。

1.png

一、问题背景:性能与安全的“零和博弈”

2.png

夏虞斌教授指出从无隔离的早期软件体系到支持虚拟化的现代操作系统,安全隔离机制经历了多轮演进。每一次隔离层级的增加虽然提升了系统安全性,却也带来了性能的不可忽视的损耗。以Linux 4.0为分水岭,随着如KPTI(内核页表隔离)等机制的引入,系统调用的开销显著增加,成为业界关注的焦点。

3.png

夏教授指出,主流芯片厂商(如Intel)花费了数十年时间试图在性能与隔离之间取得更优权衡,但在RISC-V这一新兴开放指令集架构下,是否可以通过软硬件协同创新,突破性能与安全之间的对立,是蓬莱系统探索的核心问题。

二、TEE技术演进:从TrustZone到蓬莱

4.png

他指出可信执行环境(TEE)已经在服务器(如Intel SGX、AMD SEV)和移动终端(如ARM TrustZone)等平台获得广泛应用,支撑如移动支付、AI模型保护、数据加密等关键场景。蓬莱系统作为RISC-V平台上的开源TEE方案,集成了多种隔离抽象,包括:ARM风格的双世界模Intel SGX式的Enclave模型以及2020年以来主流的虚拟化模型(CVM)。蓬莱不仅支持多种TEE架构,还提供了研究友好性强的开放平台,成为探索下一代TEE的理想实验平台。

三、蓬莱TEE系统的关键技术创新

1. 安全内存的“懒检查”机制:降低25%开销

5.png

他指出传统TEE系统通常在每次内存访问时进行安全检查,而夏教授团队提出将安全检查前移到内存映射阶段,显著减少了频繁访问带来的性能负担。这一设计利用了映射操作远少于访问操作的特点,有效降低了整体系统开销,为大规模隔离域(超过16个)提供了可扩展的支持。

2. 多层哈希树优化:扩展Encrypted Memory容量

当前主流加密内存(如Intel SGX)受限于哈希树维护开销,通常仅支持256MB的受保护空间。蓬莱引入“multiple”哈希管理机制,动态调整哈希覆盖粒度与结构,在不牺牲安全性的前提下提升了加密内存的可扩展性。相关成果已发表于SDI顶会,显示其在理论和工程实践上的领先性。

3. MMT网络内存元数据机制:破解TEE间数据传输瓶颈

6.png

他指出从TEE到TEE或TEE到CPU/GPU间的数据传输,往往需进行两次加解密处理,极大影响性能。蓬莱提出将加密验证信息抽象为MetaData,可嵌入硬件中进行协同处理,从而实现端到端的安全性同时避免冗余的双重加解密,特别适用于AI芯片中CPU-GPU协同计算场景。

四、生态集成与社区贡献

他指出蓬莱不仅是一项学术研究成果,更在RISC-V生态落地方面取得了实质进展:如与OpenSBI协作:将关键安全接口集成到底层固件,提升部署便利性。进入UEFI机制:为下一代RISC-V平台提供可商用的启动时安全保障。支持主流国产芯片:已与立创Lilffive、阿里平头哥T-HEAD、中科芯N200等多家企业建立合作,助力产业化落地。

此外,蓬莱与OpenHarmony + OP-TEE等生态系统深度融合,便于从ARM生态迁移,降低学习与部署成本。

五、面向AI时代的安全推理平台构想

7.png

他指出随着边缘AI应用的快速兴起,TEE系统正在向“智能安全平台”转型。夏教授展示了团队构建的Powerinfer-2系统,在手机端运行大模型推理能力超越主流平台11倍。未来蓬莱将承载AI Agent本地推理与隐私数据保护的双重任务,实现AI能力释放与数据安全的双赢。

六、技术展望与挑战

夏教授在答问环节特别强调,TEE机制的安全不仅在设计阶段,更需覆盖实际运行阶段,如内存映射后的防篡改能力、运行时隔离保护机制等。未来的挑战包括:标准化与社区融合如将S-mode级别的SPMP机制推入RISC-V主线标准。推理计算与安全隔离并行优化,就是在保证安全的前提下支撑更高性能AI workload。开发者友好性,主要是提升接口透明度和工具链支持,吸引更多研发者参与生态建设。

8.png

蓬莱TEE系统展示了RISC-V软硬协同安全隔离的强大潜力。它不仅在体系结构、存储安全、网络加密等方面提供了原创性解决方案,更在生态建设与商业可行性上迈出了坚实步伐。随着AI与隐私保护需求的加速融合,蓬莱有望成为RISC-V时代可信计算的中坚力量。

围观 54
评论 0
路径: /content/2025/100593261.html
链接: 视图
角色: editor
winniewei的头像
winniewei

新型测量接收机将测试速度提高了三倍,提高了灵敏度,并加快了电磁干扰故障排除速度,从而加速合规性和工作流程的进程

是德科技(NYSE: KEYS )宣布对其PXE电磁干扰(EMI)测量接收机进行重大改进,将宽带时域扫描(TDS)的实时无间隙测量带宽扩展到1 GHz。与以前的三步式相比,新的PXE接收机使工程师只需一步即可完成从30 MHz到1 GHz的测量。这一进步提高了灵敏度,加快了诊断速度,并显著加快了电磁兼容性(EMC)和认证工作流程。

1.png

是德科技的增强型PXE EMI测量接收机具有实时、1 GHz无间隙宽带时域扫描功能,可将测试速度提高三倍,并加快电磁兼容性和工作流程。

随着产品开发周期和新产品推出数量的增加,EMC认证测试正迅速成为制造商的瓶颈。工程师们需要识别和解决复杂电子设计中产生的间歇性EMI问题,他们面临的挑战越来越大。是德科技的新型PXE EMI接收机通过显著提高测试吞吐量、最大限度地缩短调试时间和优化EMC暗室效率,直接应对了这些挑战。

PXE EMI接收机的优势包括:

  • 更快的测试和故障排除:1 GHz TDS带宽和独立流处理单元(N9048BSPU)加快了测量速度,并将故障排除时间从数小时缩短到几分钟。

  • 可靠的实时结果:1 GHz实时扫描带宽确保了无间隙测量功能,不会漏掉任何瞬态或低电平EMI信号。

  • 符合监管要求:完全符合CISPR 16-1-1:2019,与最新的全球EMC标准保持一致。

TOYO Corporation高级副总裁Yoshimichi Imaizumi表示:“作为是德科技的长期合作伙伴,Toyo很荣幸能够提供全面的EMI测试解决方案,该解决方案将是德科技PXE EMI接收机的先进功能与我们专有的EPX软件相结合。这些技术共同提供了一个无缝、高性能的解决方案,增强了测试自动化,加快了故障排除,并确保符合最新标准。”

是德科技高级副总裁兼电子工业解决方案集团总裁Jason Kary表示:“凭借先进的PXE EMI接收机,我们的客户,无论是独立的合规性测试实验室还是内部EMC团队,现在都能以更快的速度、更强的信心和更高的效率完成符合CISPR标准的测量。通过提供高灵敏度、卓越的动态范围和无间隙实时监测,我们使工程师能够更快地解决EMI问题,缩短开发周期,最终缩短产品上市时间,降低合规成本。”

是德科技的PXE EMI接收机在精度、性能和生产率方面树立了新标准,使工程师和测试实验室能够自信而快速地应对当今苛刻的EMC挑战。

PXE EMI接收机将在7月23-25日于东京举行的Techno-Frontier 2025上展示,TOYO Corporation展位号为3-GG04。

参考资料

关于是德科技

是德科技(NYSE:KEYS)启迪并赋能创新者,助力他们将改变世界的技术带入生活。作为一家标准普尔 500 指数公司,我们提供先进的设计、仿真和测试解决方案,旨在帮助工程师在整个产品生命周期中更快地完成开发和部署,同时控制好风险。我们的客户遍及全球通信、工业自动化、航空航天与国防、汽车、半导体和通用电子等市场。我们与客户携手,加速创新,创造一个安全互联的世界。了解更多信息,请访问是德科技官网 www.keysight.com/

围观 17
评论 0
路径: /content/2025/100593260.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

在人工智能加速发展的今天,通过大语言模型设计一款芯片已经不再是天方夜谭,在7月18日第五届RISC-V中国峰会前沿技术创新论坛上,北京大学集成电路学院助理教授、博雅青年学者贾天宇博士分享了他的团队在“大模型辅助的RISC-V SoC敏捷设计”方向的探索与突破。

1 (1).png

他的报告从Apple A18等商用SoC的高度集成出发,提出:如何利用开源与大语言模型技术,实现SoC芯片的敏捷设计、自动生成与高效验证,是面向未来AI算力平台的关键突破口。

一、SoC设计为何如此复杂?

现代SoC芯片集成了CPU、GPU、NPU、AI加速器、DSA(专用结构)以及复杂的片上互联系统。贾博士指出传统的设计流程涉及架构定义与设计空间探索(DSE)、手动 RTL 编码与代码实现、EDA流程、脚本开发、综合、布局布线、验证与物理版图生成等。这些流程需要大量工程师投入,周期长、成本高,设计效率难以满足快速迭代的AI应用需求。

贾教授指出,RISC-V开源架构为SoC设计提供了可重用的构件资源,降低重复开发成本。其团队早在海外期间就探索了基于开源IP实现10-100倍能效优化的设计流程,并延续到当前的大模型辅助研究。

2 (1).png

通过以“香山”RISC-V核为基础的仿真器(Gem5),搭建起可拓展的设计空间,实现架构到RTL的全链路流程,为后续引入大模型提供了数据与验证基础。

三、大语言模型赋能SoC敏捷设计的三大路径

3.jpg

贾天宇教授将整个SoC设计流程拆解为三大步骤,并依次引入大语言模型(LLM)进行协同探索:

1. 架构设计空间探索(DSE)

场景: 架构师需评估不同参数组合下的性能与功耗;

方法: 将Gem5仿真结果喂给大模型,提示其分析架构瓶颈,提出优化建议;

结果: 通过对南湖Tace CPU进行发射宽度、解码宽度等参数调整,得到更优帕累托前沿的设计点,物理实现后芯片面积和功耗均下降。

他指出大模型不仅能理解结构参数,还能指导修改,如:“减小解码宽度可节省面积但略微降低性能”,展示出“类架构师”的理解力。

2. 代码生成与集成验证

4.jpg

挑战: 单一模块可生成,但多个IP的复杂集成难以“一步到位”;

方法: 引入RAG(检索增强生成)技术,通过知识检索+大模型生成的组合,构建模块化模板;

应用案例: 给定AI加速器需求,模型能自动生成具有向量扩展功能的协处理器(Co-Processor)架构与代码片段;

他指出模型可以支持将多个IP(如香山CPU、开源DSP、NPU)集成为完整的AI SoC草图设计。

通过RAG方式解决了“复杂结构信息难直接生成”的问题,走向更精细化、可控的设计流程。

3. EDA流程与逻辑综合辅助

虽然EDA阶段目前仍需大量专家手动干预,但贾博士指出,大模型已开始介入脚本编写、综合参数配置、甚至逻辑验证策略的建议生成。他们的目标是实现设计流程的全覆盖与智能闭环。

四、从Demo到产品:LLM辅助芯片设计的挑战与展望

5 (1).png

他指出当前大模型能部分接替设计工程师完成参数调优、代码生成、结构分析等任务;在某些环节上显著降低设计复杂度与周期。但也面临幻觉问题(Hallucination),就是生成内容可能逻辑不一致或语义错误,所以生成之后仍需严密的仿真与验证流程闭环;此外,复杂SoC的集成要求模块之间接口与时序严格匹配。贾博士特别强调:“我们不是只让大模型生成,而是生成+验证+反馈再生成,构建类人闭环的协同工作机制。”

五、结语:开源 × 敏捷 × 大模型,开启芯片设计新范式

6 (1).png

贾天宇博士的报告展示了一种颠覆传统的SoC设计路径。开源IP提供资源基础,敏捷流程提供组织方法,而大语言模型则注入智能驱动。三者结合,正逐步催生一套全新的、以AI为核心的芯片设计范式。

虽然当前还只是起步阶段,但正如贾教授所说:“我们的Demo离产品还有距离,但这场技术革命已经开始了。”

围观 65
评论 0
路径: /content/2025/100593259.html
链接: 视图
角色: editor
winniewei的头像
winniewei

作者:电子创新网张国斌

1.png

在第五届RISC-V中国峰会前沿创新技术论坛上,西安交通大学人工智能学院李宝婷教授为带来了主题为《高能效具身智能计算架构与芯片》的精彩报告。在这个报告中,李宝婷深入分析了具身智能计算架构的发展趋势,围绕片上自学习、片上大模型推理等关键技术路径,提出具身智能时代计算芯片的新挑战与解决方案。

一、具身智能:AI发展的终极形态

李教授指出从图灵1950年首次提出“具身智能”概念开始,到CVPR 2024研讨会明确提出智能体需具备感知、语言、听觉、行动与推理等能力,具身智能逐步成为人工智能研究的核心方向。具身智能不仅仅是感知世界,更要求能与环境实时互动、自主学习与决策。这类智能系统将成为未来机器人、智能车、自动化系统的基础能力。

西交大在此领域的研究处于国内前列,在感知-决策-执行链条中的计算架构设计尤为突出。

二、传统架构的困境与新需求

传统AI架构(如CPU/GPU)在具身智能端侧部署中面临如下挑战:

多模态输入(图像、声音、语言等)的融合处理;

自主学习与持续在线训练;

实时推理与高效控制;

能耗与计算效率的矛盾。

特别是在开放环境中进行认知决策时,大模型的知识推理能力提供了新的路径,但也引发了大算力、低效率、高能耗等一系列现实问题。

三、大模型如何助力具身智能?

2 (1).png

李教授指出具身智能的核心痛点之一是缺乏常识推理与泛化能力,而大模型,尤其是语言/图文多模态模型,在理解与生成方面展现出前所未有的潜力。未来的具身智能体将不再是纯感知驱动的反应系统,而是具备推理、常识和自主适应能力的“思考型”机器。

四、计算架构创新一:片上自学习芯片

3.png

1. 自训练与强化学习两类范式

感知类任务:采用自监督、自训练等范式;

决策类任务:采用深度强化学习等技术。

李教授团队关注的是端侧训练的硬件实现问题。在分析训练流程的计算瓶颈后,提出两大轻量化优化方法:

2. BN反向传播轻量化

4 (1).png

传统BN层反向传播过程导致梯度图稀疏性丧失,计算开销大;

提出以最大/最小值替代均值/方差的近似统计策略;

显著提升特征梯度稀疏性、降低计算和访存需求。

3. 卷积核轻量化

5.jpg

她指出基于预训练模型的统计规律,发现权重变化范围有限;采用SVD分解,并将U向量量化为2的n次幂,极大减少乘法操作;最终整体训练计算量降低30%以上,存储访问减少45%。

4. 片上实现成果

面向稀疏计算设计了压缩编码 + 结构稀疏解码的定制电路;芯片面积效率提升2倍以上,能效提升1.8倍。

五、计算架构创新二:大模型推理芯片设计

李教授表示混合深度(MOD)模型面临的挑战是路由决策影响精度,Token乱序导致访存开销高;对此改进思路是重排计算顺序、本地化路由优化。

6 (1).png

在芯片级架构创新方面,引入融合归一化与路由的专用模块,增加Token重排序缓冲和动态访存模块;由此实现推理速度提升近3倍,面积效率翻倍,能效提升40%。

六、具身智能的未来:超异构架构+RISC-V指令扩展

面向未来,李教授团队计划基于RISC-V开放架构:为运动规划、定位建图等确定性任务设计专用指令集;构建超异构具身计算系统,实现不同算子间的最优调度;融合传统算法与深度学习,探索“混合AI”系统最优解。

七、结语:从实验室走向机器人

具身智能正在从理论探索走向实际落地,尤其是在服务机器人、自动驾驶、智能制造等领域。李宝婷教授的报告不仅揭示了当前AI芯片设计的技术挑战,更为业界提供了清晰的演进路线图。从自学习到大模型推理,再到超异构的RISC-V扩展架构,一幅全新的智能计算蓝图正在展开。在具身智能浪潮下,中国团队正站在全球AI芯片创新的前沿。

围观 102
评论 0
路径: /content/2025/100593258.html
链接: 视图
角色: editor
winniewei的头像
winniewei

Abracon全新的AK1B系列ClearClock™振荡器以超紧凑的2.0×1.6 mm封装实现卓越性能,为高速系统提供业界领先的精度。

该振荡器提供100MHz或156.25MHz两种频率选项,在156.25MHz频率下RMS抖动可低至34.2飞秒,100MHz频率下仅54.4飞秒,确保为各类应用场景提供纯净的时钟信号。

AK1B系列为实现多样化应用而设计,支持LVPECL、LVDS和HCSL输出,工作电压范围为1.8V至3.63V,为工程师在匹配不同系统需求时提供更高的灵活性。

其工作温度范围宽达-40°C至+105°C,具有出色的频率稳定性(±50ppm),足以适应数据中心、光通信、PCIe及网络等多种环境。

1.png

ClearClock™超低抖动差分振荡器 

Abracon新一代ClearClock™系列产品新增AK1B、AK2B和 AK3B差分输出晶体振荡器,旨在高速数据环境中提供卓越的信号完整性。Abracon的这些产品具备超低RMS抖动,在156.25MHz 频率下,AK1B抖动低至35飞秒,AK2B/AK3B可低至 54 飞秒,能够确保数据传输和处理所需的稳定时钟信号。AK1B 采用超小型2.0x1.6mm封装,非常适合光收发器和光模块等空间受限的应用场景;AK2B/AK3B 则提供行业标准尺寸,以实现更广泛的系统兼容性。所有型号均支持LVPECL、LVDS 和HCSL输出,并提供灵活的电压选项,可无缝集成于电信、工业和网络系统中。ClearClock™系列的工作温度范围扩展至最高+105°C,在性能、精度和多功能性方面均经过优化。

1 产品优势

- 超低抖动性能

- 紧凑、节省空间的设计

- 宽电压灵活性

- 行业标准输出兼容性

- 支持宽温工作

2 产品特点

- 封装尺寸:2016、2520、3225

- 相位抖动:低至35飞秒

- 宽工作温度范围:-40°C 至+105°C

- 频率稳定性:高达±20ppm

3 应用场景

- 光收发器与光模块

- 数据中心、存储设备及服务器

- 网络交换机与网关

- 100G/200G/400G/800G 以太网

- 光纤通道/SONET/SDH/PCIe

4 产品参数

2.png

来源:Abracon艾博康

围观 25
评论 0
路径: /content/2025/100593254.html
链接: 视图
角色: editor