微软和NVIDIA共同推出迄今为止训练的最大且最强的语言模型

winniewei -- 周二, 10/12/2021 - 14:34

10月11日——微软和英伟达今天宣布了由DeepSpeed和Megatron驱动的Megatron-Turing自然语言生成模型（MT-NLG），这是迄今为止训练的最大和最强大的解码语言模型。这个模型包括5300亿个参数，与现有最大的模型GPT-3相比，参数数量是其3倍。

训练这样的大型模型涉及各种挑战，沿着所有的人工智能轴线进行了许多创新和突破。例如，通过紧密合作，英伟达和微软将最先进的GPU加速训练基础设施与尖端的分布式学习软件堆栈相融合，实现了前所未有的训练效率。

微软与NVIDIA建立了高质量的自然语言训练语料库，其中包含数千亿个标记，并共同开发了训练配方，以提高优化效率和稳定性。

Adobe 携手 NVIDIA 释放生成式 AI 的力量	芯原和微软携手为边缘设备部署Windows 10操作系统	微软宣布开源可扩展存储引擎已服役超25年
NVIDIA携手谷歌云提供强大的新生成式AI推理平台，基于全新L4 GPU和Vertex AI构建	博世与微软携手探索生成式人工智能应用新领域：更安全的道路行驶	微软新一轮20亿美元投资Cruise 押注自主汽车解决方案

最新文章