现在全世界都在使用高清,是时候让语音编解码器与时俱进了!

winniewei 提交于 周五, 03/01/2019
现在全世界都在使用高清,是时候让语音编解码器与时俱进了!

不久前,通俗小说里还在把语音界面看作是一种未来的技术,但现在它已经成为现实。当我们使用电话与服务提供商交谈时,通常我们首先接触的是语音技术,其次才是与人交谈。同样重要的是,应急服务和安全系统现在使用语音作为主要界面接通各种设备,包括标准电话系统、私人对讲系统和数字移动无线电(DMR)。

以任何形式使用语音作为通信信道时,前提是在整个信号路径中保持信号的质量。如果一个接收端根本不是人来接听,这就更为重要了,但即使是人来接听,我们不会永远生活在一个过去的低分辨率时代吧?

你可能会这么认为,但事实是,在最近的研究中,绝大多数都是针对便携式(有时不是便携式)电子设备的编解码器,重点是多媒体,特别是针对音乐。信不信由你,语音和音乐之间有很大的区别,我不是在仅仅说卡拉OK。音乐往往具有更宽的带宽,与语音描述的波形不同,因此本质上它们是两种完全不同的信号。为音乐设计的编解码器并没有经过优化用以提供高质量的语音,这并不令人感到惊讶。

在信号链路中最关键的技术是编解码器,它能够在模拟域和数字域之间架起桥梁。编解码器能够接收麦克风产生的信号并在数字域中处理,然后再将数字信号转换成模拟信号以驱动扬声器。在麦克风之后,编解码器通常是信号链中的第一个和最后一个链接,因此它提供的质量将极大影响整体的用户体验。

多年来业界很少或根本没有在语音编解码器方面投资,使得这种技术停滞不前,从而设计师们别无选择,只能使用高带宽的通用音乐编解码器。这些编解码器不是为语音应用而设计,因此不支持基于MEMS技术的最新一代麦克风。

这正是高清、超低功耗和高度集成的语音编解码器可以大有作为之处。新一代语音编解码器可以直接支持最新的MEMS麦克风,这些数字式变体通常使用脉冲密度调制(Pulse-Density Modulation,PDM)或I2S(Inter-IC Sound)接口对数据进行编码。虽然麦克风最初确定了信号质量,但正是编解码器使用语音过滤、自动增益和自动电平控制以及噪声选通等信号处理,来获取并改善数据流。有些还可以在并行信号路径上使用双麦克风实现噪声消除,如果增加一个集成的放大器则可以使编解码器直接驱动扬声器。通过选择合适的器件,整个信号链可以有效地用单一器件实现,从而降低了设计的复杂性,降低了总体BOM成本。

CML MicrocircuitsCMX65D是目前市场急需的新一代语音编解码器技术的一个范例,它能够支持面向语音的最新应用,既可以用于传统电话线路(300Hz3.4kHz),也可以用于HD语音(50Hz to 7kHz),同时支持21kHz的音频带宽。此外,它还配备了一个完全集成的D类放大器,可以提供高达1W的功率,直接以无滤波器设计来驱动扬声器。这可以带来许多层面的好处。

该器件本身在监听模式下仅消耗300µA电流,因此可用于电池供电(可穿戴)应用。它的音频信号处理包括AGC/ALC和噪声选通,所有这些都使它成为一系列新兴应用的理想选择,包括“始终开启”的安全系统,例如用于检测玻璃破碎声音的系统。CMX65D支持高清语音,因此,也可以用于最新的语音控制设备,以及有线和无线移动电话。CMX65D有模拟和数字两种变体,可分别支持具有模拟或数字输出的MEMS传感器。事实上,由于其低工作电流和高输出功率,可直接驱动无滤波器扬声器,它甚至可被用作一个D类放大器。

毫无疑问,基于语音的界面正在经历一个高速增长阶段。自然语言接口和高清语音系统(有线和无线)将在物联网、智能家居和建筑、公共和私人对讲系统、以及自动驾驶汽车等领域发挥重要作用。在不久的将来,高清语音将显著改变用户体验,并使这种技术总体上进一步融入我们的日常生活。

相关文章