
作者:电子创新网张国斌
近日,有媒体报道英伟达欲以200亿美元收购初创公司Groq获并挖走其首席执行官,Groq周三在一篇博客文章中表示,Alphabet(GOOGL.O)旗下的谷歌(Google)已向其支付巨额费用。
近年来,全球最大的科技公司纷纷斥巨资收购有潜力的初创公司,以获取其技术和人才,但并未正式收购目标公司,这种做法屡见不鲜。
Groq 是一家专注于人工智能推理芯片和系统开发的公司,成立于 2017 年。Groq 的创始人是 Jonathan Ross,他曾在谷歌的 Tensor Processing Unit (TPU) 团队工作,负责 TPU 的设计和开发。Groq 的总部位于美国加利福尼亚州的圣克拉拉。
Groq 的主要产品是高性能的人工智能推理芯片。这些芯片专为加速深度学习模型的推理过程而设计,能够显著提高处理速度和能效。Groq 的芯片采用了独特的 Tensor Streaming Processor (TSP) 架构,这种架构能够实现高度并行的数据处理,从而提高推理速度和效率。
Groq 不仅提供芯片,还提供完整的系统解决方案,包括硬件和软件工具,以帮助客户快速部署和优化其人工智能应用。
Groq 的芯片和系统广泛应用于数据中心,用于加速各种人工智能工作负载,如图像识别、自然语言处理和推荐系统。Groq 的技术也适用于边缘计算场景,如智能摄像头、工业自动化和自动驾驶汽车,这些场景需要快速的实时处理能力。
此外,Groq 的芯片还被用于高性能计算领域,支持复杂的科学计算和工程模拟。

在产品方面,Groq100FFA 是 Groq 公司推出的一款高性能人工智能推理芯片,Groq100FFA 采用了独特的时序指令集计算机架构,与传统的 GPU 架构不同,它无需频繁从内存中加载数据,从而减少了数据传输的延迟和能耗。
该架构能够实现高度并行的数据处理,提高推理速度和效率。Groq 的芯片采用线性流水线架构,数据在芯片内部以线性方式流经各个处理单元,无需复杂的调度和仲裁机制,从而提高了数据处理的效率。
Groq100FFA 芯片在处理推理任务时表现出色,能够实现高吞吐量和低延迟的性能。例如,在处理大语言模型(LLM)时,Groq 的芯片每秒可以生成高达500个 token,远超其他同类产品。该芯片在 INT8 和 FP16 精度下能够提供高达 188 TFLOPs 的算力。Groq100FFA 配备了容量为 230MB 的 SRAM,带宽高达 80TB/s,这使得数据能够快速传输和处理。
Groq100FFA 芯片在软件层面与英伟达架构兼容,开发者无需大幅修改代码即可将现有基于 PyTorch、TensorFlow 的模型迁移至 Groq 芯片。Groq100FFA 芯片适用于数据中心的推理任务,能够显著提高处理速度和能效。
目前,Groq 已经与多家科技公司和研究机构建立了合作关系,共同推动人工智能技术的发展。例如,Groq 与沙特的 HUMAIN 合作,扩大其在沙特国内的推理基础设施容量。
随着大型语言模型推理任务加速对AI加速芯片的需求激增,Groq今年的目标营收为5亿美元。据悉,英伟达主动接洽时,Groq并未有出售意向。
据悉,Groq 正在开发新一代的推理芯片,这些芯片将具备更高的性能和更低的功耗,进一步提升其在市场中的竞争力。

据外媒报道称,英伟达已同意以200亿美元(约合人民币1400亿)现金收购Groq,但英伟达和Groq均未对此报道置评。Groq在其博客文章中表示,公司将继续作为一家独立公司运营,由西蒙·爱德华兹(Simon Edwards)担任首席执行官,其云业务也将继续运营。
在近期类似的交易中,微软的人工智能高管与一家初创公司达成了一项价值6.5亿美元的交易,该交易被宣传为授权费;Meta斥资150亿美元聘请了Scale AI的首席执行官,但并未收购整个公司。亚马逊从Adept AI挖走了创始人,英伟达今年也进行了类似的交易。这些交易都受到了监管机构的审查,但目前尚未有任何交易被撤销。
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利