【原创】从“通用算力”走向“领域算力”:DSA 处理器架构的设计挑战与工程化破局

作者:电子创新网张国斌

2017年3月,两位当年图灵奖获得者、计算机架构领域两位巨星级人物David Patterson与John Hennessy在斯坦福大学发表演讲时指出计算机体系结构将迎来一个新的黄金时代!

1.png

在这次图灵演讲中,David Patterson与John Hennessy还提到:“在摩尔定律走向终点的同时,体系结构正在闪耀新的活力——以TPU为代表的领域特定架构 (Domain Specific Architectures, DSA) 兴起,但CPU、GPU、FPGA仍然有用武之地,最终,市场会决定胜者。”

回望过去十年,半导体产业最重要的变化之一,并不是制程从 28nm 走向 3nm,而是计算架构的重心正在发生迁移。CPU 不再是唯一的主角,GPU 也不再是“万能加速器”。在 AI、通信、网络、存储、汽车电子等关键领域,一类更安静、却更高效的角色,正在快速走向舞台中央——DSA(Domain-Specific Architecture,领域专用架构)处理器。

这不是一次技术分支,而是一场算力范式的结构性转向。

然而,DSA架构处理器并没有像某些其他类型的处理器(如GPU)那样广泛流行,仅被少数大公司推崇,并没有被众多中小公司接纳。许多用户和开发者更倾向于使用成熟的通用处理器,如GPU和CPU。原因包括通用性较低、生态系统不完善、市场接受度低以及技术成熟度和可靠性不够等。

DSA为何没有走热?中国作为全球最大的电子产品与硬件方案产地,对DSA处理器的需求旺盛。国产厂商在DSA处理器的研发和应用方面具有广阔的发展空间,那本土厂商如何加速DSA处理器开发?

2.png

近日,隼瞻科技创始人兼CEO曾轶以及隼瞻科技联合创始人兼CTO姚彦斌做客贸泽电子芯英雄联盟直播间,就DSA架构处理器在中国的发展与广大网友展开了讨论。

曾轶指出如果把过去二十年的处理器演进浓缩成一句话,那就是:通用架构靠工艺红利扩张,专用架构靠算力效率突围。x86 时代通用 CPU 是算力的唯一中心;ARM 时代通用架构开始“带一点领域意识”;而今天,AI 把这条路线彻底推到了尽头。

所以,问题不在于“DSA 是否先进”,而在于“通用算力已经无法在功耗、成本与性能三者之间给出可持续解。”

他指出AI 的到来只是点燃引线。真正的根因有三点:

  1. 摩尔定律边际收益衰减单核性能曲线趋于平坦,靠制程换性能已难以为继。

    半导体的工艺红利正在逐步消退

  2. 3.png

  3. 算力需求的结构性变化模型不是“多算一点”,而是算力需求近似无上限,并且强烈结构化(矩阵、张量、向量、流式、稀疏)。

  4. 算力部署向专用场景迁移从云到边缘,从通用服务器到端侧设备,算力必须“贴着应用长”。

在这种背景下,DSA并不是一种激进创新,而是一种被现实逼出来的工程选择,“到专用领域里去找算力、找能效、找成本空间。”他指出。

二、DSA 的本质:异构处理器“集合体”,而非某一颗核

目前一个常见误解是:“DSA = 一颗很强的专用处理器。”事实上,真正的 DSA 系统几乎从来不是单一处理器,而是多处理器异构集合

  • CPU:控制流、系统调度(≈10%)

  • NPU / GPU:大规模并行计算(≈60–70%)

  • DSP / VPU / 专用加速核:结构化算子、流式处理(≈20–30%)

算力在不同单元之间的切分方式,本身就是架构设计的一部分

这意味着DSA 不是“设计一个核”,而是设计一整套算力分工体系

也正因为如此,DSA 天生面向具体应用,而非抽象算力。

三、DSA 为什么“大家都想要,却很少落地”

曾轶指出从理论到工程,DSA 面临的最大阻力从来不是价值,而是

复杂度。他细分为几个点:

1. 处理器设计是一项“系统级工程”

一个可落地的 DSA 处理器至少涉及:

  • ISA / 微架构设计

  • RTL 实现与验证

  • 编译器(前端 / 中端 / 后端)

  • 工具链、仿真器、调试器

  • 软件生态与应用迁移

每一项都高度依赖稀缺专家

结果是DSA 只有“大厂玩得起”,中小芯片公司望而却步。

2. 瀑布式开发流程与 DSA 的“探索性需求”天然冲突

DSA 的问题在于你无法在一开始就定义“最优架构”。

  • 应用在变

  • 模型在变

  • 数据类型在变

  • 算子在变

但传统处理器开发是典型的瀑布式流程:需求冻结 → RTL → 验证 → 软件 → 流片

这与 DSA 所需要的高频试错、快速迭代是根本冲突的。

3. 客户“提不出 DSA 需求”,并不等于没有需求

“我们的10 个客户,只有 1–2 个能清晰描述 DSA 架构需求。”他这样描述行业常见的现象。

但问题并不在客户,而在路径。

没有方法论、没有工具、没有可迭代模型时,大多数公司连“想象自己要什么架构”的能力都不具备。

四、隼瞻科技的核心判断:问题不在架构,而在“设计方式”

曾轶表示隼瞻科技对 DSA 的理解,有一个非常关键的转向,那就是“DSA 不是一个架构问题,而是一个“如何被设计出来”的问题。”

换句话说,真正的瓶颈不在于算法懂不懂、硬件强不强;而在于能不能把应用 → 架构 → 实现,这条链路压缩、抽象、自动化

这直接引出了隼瞻的两个核心工作方向。

五、以 RISC-V 为基座,但不被 RISC-V 限制

曾轶表示隼瞻选择 RISC-V,并非因为“开源”本身,而是因为它天然服务于 DSA,如可扩展 ISA、架构可裁剪以及无历史包袱等。

但值得注意的是:隼瞻并未将自己限制在“只做 RISC-V CPU IP”

隼瞻的核心认知是:“处理器是核心,但处理器的形态可以是 CPU / DSP / NPU / 专用核。”,所以,RISC-V 只是入口,不是终点。

六、ArchitStudio:把“处理器设计”变成一件可迭代的事

4.png

姚彦斌表示隼瞻真正试图解决的,是 DSA 的工程化问题。

1. 从“应用程序”出发,而不是从 ISA 出发

ArchitStudio的输入不是 RTL,也不是指令集,而是真实应用的 C/C++ 程序,系统会自动分析:

  • 算法特征(计算 / 访存 / 控制)

  • 指令级瓶颈

  • 流水阻塞点

  • 数据依赖关系

这一步本质上是把“应用需求”翻译成“架构信号”。

2. RISCAL:ISA、微架构、编译器的同源描述语言

5.png

姚彦斌表示RISCAL并不是“又一个 HDL”,而是一种架构描述语言

  • ISA 描述

  • 流水线结构

  • 功能单元扩展

  • 编译器语义绑定

核心价值在于“一份描述,生成 RTL + 编译器 + 仿真 + 验证环境”

从根本上消除“架构与实现不一致”的问题。

3. 从瀑布式开发,转向“敏捷处理器设计”

在 ArchitStudio 中,架构修改 → 自动生成全套后端;PPA 快速评估,快速回滚、快速迭代,这使得 DSA 从“重资产、长周期探索”,变成一种可被反复试错的工程过程

七、AI 的真正作用:不是目标,而是“放大器”

曾轶指出目前一个非常重要但容易被忽略的观点是“AI 并不是 DSA 的目的,而是 DSA 设计工具成熟的关键条件。”三年前,这套方法论难以落地的原因只有一个:

AI 还不够强。

今天,大模型使得架构空间搜索可行、设计模式可学习、性能预测可近似建模,这使得 DSA 设计第一次具备了EDA 化、模型化、自动化的现实基础。

他指出如果用一句话概括 DSA 的未来:那就是DSA 会从“架构创新”,变成“设计能力的普惠化”。DSA 的未来会从“少数人的武器”变成“行业基础设施”。

未来的分水岭不在于谁的核更复杂、谁的算力峰值更高

而在于谁能让更多公司“设计出自己的处理器”

从这个角度看,隼瞻科技真正押注的并不是某一颗处理器 IP,而是“DSA 时代的处理器设计基础设施。”

所以,当处理器设计不再是少数专家的手工艺术,而成为可工具化、可迭代的工程能力时,DSA 才会真正走向规模化,而那一天,才是“领域算力时代”的真正开始。

对于DSA的未来,大家怎么看?欢迎留言讨论!

注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利