官方于 3 月 22 日宣布,微软正在使用一组称为 Z-code 的 AI 模型更新其翻译器和其他 Azure AI 服务。这些更新将提高机器翻译的质量,并帮助这些服务支持的不仅仅是最常见的 可用训练数据较少的语言。
新的 Z-code 模型使用稀疏的“专家混合”方法,微软高管称这种方法运行效率更高,因为它只需要让模型的一部分参与即可完成任务。 根据微软的说法,结果是:在保持计算量不变的同时,模型参数的数量大幅增加。
微软最近部署了 Z-code 模型,以改进其各种 Azure AI 服务中常见的语言理解任务,例如名称实体识别、文本摘要、自定义文本分类和关键短语提取。 但今天的发展标志着“一家公司首次公开展示它可以使用这种新型专家混合模型来为机器翻译产品提供动力。”
Z-code 是微软更大的 XYZ-code 项目的一部分,该项目旨在结合文本、视觉、音频和多种语言的模型,以创建更强大的集成 AI 系统,可以更好地说、听、看和理解。 Z-code 模型属于 Microsoft AI at Scale 和 Turing 计划,这些计划旨在开发使用大量文本数据进行预训练的大型模型,并且可以直接集成到 Microsoft 和客户开发的产品中。
官方表示,为了将这些模型投入生产,微软正在使用 NVIDIA GPU 及其 Triton 推理服务器来高效地部署和扩展它们。
说到 NVIDIA,微软今天宣布它正在与 NVIDIA 合作,将其机密计算能力引入 NVIDIA GPU。
Azure 首席技术官兼技术研究员 Mark Russinovich 在 3 月 22 日的博客文章中解释了其重要性:
“对于机密 GPU,当数据通过 PCIe 总线在 CPU 和 GPU 之间传输时,使用在 NVIDIA 的设备驱动程序和 GPU 之间安全交换的密钥进行加密。唯一解密数据的地方是在硬件保护、隔离的 GPU 包中的环境,可以在其中对其进行处理以生成模型或推理结果。与其他 Azure 机密计算解决方案非常相似,机密 GPU 支持基于 NVIDIA 在制造过程中提供的唯一 GPU 身份的加密证明。使用远程证明,组织可以独立验证 他们的数据仅在真正且正确配置的机密 GPU 中处理。”