深聪半导体:实现AI语音交互的本地识别和语义理解

作者:刘于苇

语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着智能手机、平板电脑等电子产品芯片集成度的加深,以及各种大数据学习、AI算法的进步,用户交互体验水平将得到大幅提升,用户认知和习惯得以培养。

2020年中国智能语音市场规模达到113.96亿元,同比增长19.2%。预期,中国智能语音市场规模将会继续保持稳步扩张态势,到2026年将达到326.88亿元。

上海深聪半导体有限责任公司联合创始人、 CEO吴耿源

在日前举办的第十一届松山湖中国IC创新高峰论坛上,上海深聪半导体有限责任公司联合创始人、 CEO吴耿源介绍了低功耗人工智能人机语音交互芯片太行二代TH2608。

据介绍,太行一代芯片TH1520已完成量产出货,在3大场景完成落地,即智能家居白电、黑电以及智能车载领域。并拥有3大核心客户,美的集团、海信集团、盯盯拍(其终端用户为国内智能终端第一品牌)。目前,太行系列已规划芯片融合AI、多模态、主控三合一,下一步计划整合多模态、类脑、存储芯片。

太行二代芯片TH2608实现了从协处理器到主控芯片的技术跃迁,内嵌基于Cortex-M ARM v8指令集主控CPU,配合内部SRAM和外部XIP Flash的资源,以及外设接口资源,给客户提供多种应用场景下的主控处理器解决方案。该芯片还拥有高度灵活可配置的神经网络加速器单元NPU,使能效比大幅度提升。

通过部署DNN/TDNN/FSMN/CNN等各种通用网络,TH2608能实现对INT8/4/1等数据格式的充分支持,借助特别优化的网络定制化的模式,达成高效率低能耗的复杂网络的组合与调度。

此外,TH2608提供多芯片合封、单芯片系统集成等多种灵活SIP方案,支持对不同类型的PSRAM和Flash的合封处理,并能整合Wi-Fi、Bluetooth等无线通信模块。同时借助内嵌的电源管理模块(PMU),实现了对客户BOM最精简方案的强力支持。

吴耿源还介绍了深聪半导体太行芯片技术路线图。第一代芯片TH1520具有全系列麦克风阵列、AI关键字和指令识别及低功耗唤醒等功能。相较于第一代,太行第二代产品TH2608增加了AI本地连续语音识别、语义理解及安全特性、声纹识别等功能,使用专用NPU,提升能效比,降低功耗。深聪半导体与中芯国际、台积电有着多年深度合作经验,并将继续深耕人工智能语音交互领域,预计第三代产品将运用多模态融合、1bit类脑智能和拟人化交流等技术,实现存储、工艺、封装融合和优化。

太行二代芯片TH2608面向全屋智能家居场景(全屋设备联动控制)、智能驾驶场景(车载设备控制)、智能办公场景(会议远场/近场高保真通话)持续提供功能和性能全面升级的解决方案,从算法整合到整体方案,全力打造“云+芯”一体化。

该芯片有几个特点,例如云+芯全链路语音交互,支持全双工、支持全屋智能、支持多语种支持远场通话,吴耿源指出,“通过长虹、海信美的等我们的产品已经输出到海外,也适应了各地的方言,各民族的语言。”

2018年,思必驰集团携手中芯聚源等知名机构成立深聪智能,专注于打造“算法+芯片”一体化的整体解决方案。公司创始团队曾在中芯国际、英特尔、Imagination等担任核心高管,团队有多名博士及博士后,拥有超过百项专利,整个团队具备丰富的半导体行业以及人工智能算法经验,不断加速产品在智能家居、智能车载、可穿戴设备、智能会议、智能空间等领域应用落地。通过算法、芯片、软硬件整合,多维度跨界技术融合,联合上下游生态伙伴,打通产品底层研究和人工智能发展。

据介绍,深聪智能2018年8月芯片成功流片,11月芯片一次性点亮验证,过去3年,公司的产品获得了客户的认可。2020年11月完成估值达数亿元的第二轮融资。

成立两年多时间里,公司获得了多个奖项。2020年7月入选了国家工信部AIIA的《AI芯片推荐目录》,通过了国际级SGS三体系认证。在2020年下半年,公司入选了毕马威KPMG的“芯科技50榜”,同时在2021年也成为首家通过亚马逊Alexa认证的智能语音芯片供应商。

来源:电子工程专辑

最新文章