Meta 的最新人工智能模型将以数百种语言提供内容

2023-05-13 0 614

Meta 的最新人工智能模型将以数百种语言提供内容

该公司周三宣布,Meta 已经开源了一个可以翻译 200 种不同语言的人工智能模型——此举应该向更广泛的受众开放不同的技术和数字内容。 该模型名为“不遗余力”,可以翻译 200 种语言,包括 55 种非洲语言,并具有高质量的结果。

“少数几种语言——包括英语、普通话、西班牙语和阿拉伯语——主导着网络,”该公司在一篇博文中指出。 “以这些广泛使用的语言为母语的人可能会理所当然地认为用自己的母语阅读东西是多么有意义。NLLB 将帮助更多的人用他们喜欢的语言阅读东西,而不是总是需要一种经常能表达情感的中间语言 或内容错误。”

Meta 当然使用 NLLB 来改进自己的产品,但是通过开源模型,技术人员可以使用它来构建其他工具——比如在爪哇语和乌兹别克语等语言中运行良好的 AI 助手,或者斯瓦希里语或 用于宝莱坞电影的 Oromo。

NLLB 几乎使单个最先进的 AI 模型涵盖的语言数量翻了一番。 Meta 表示,现有翻译工具无法很好地支持或根本无法支持其中的许多语言,例如 Kamba 和 Lao。 目前得到广泛使用的翻译工具支持的非洲语言不到 25 种。

与之前的人工智能研究相比,该模型还将翻译质量平均提高了 44%。 对于一些基于非洲和印度的语言,NLLB-200 的翻译准确度提高了 70% 以上。 为了确定翻译质量,Meta 进行了自动度量评估和人工评估。

为了帮助确保翻译质量,Meta 研究人员构建了 FLORES-200,这是一个帮助他们评估 NLLB 在 40,000 种不同语言方向上的表现的数据集。

除了开源 NLLB-200 模型外,Meta 还向开发人员提供 FLORES-200 数据集,以及模型训练代码和用于重建训练数据集的代码。

此外,该公司将向研究人员和非营利组织提供高达 200,000 美元的赠款,以表彰其对 NLLB-200 的有效使用,这些组织的举措侧重于可持续性、食品安全、基于性别的暴力、教育或支持联合国可持续发展目标的其他领域 .

在其自己的产品中,Meta 预计该模型每天可支持超过 250 亿次翻译。 除了翻译内容和提供更好的广告外,该模型还将用于发现有害内容和错误信息。

Meta 的 NLLB 研究也被应用于维基百科编辑使用的翻译系统。 Meta 与托管维基百科和其他免费知识项目的非营利组织维基媒体基金会合作,帮助改进维基百科上的翻译系统。 维基百科有 300 多种语言的版本,但大多数文章的数量远远少于英文的 600 万多篇文章。

编辑们可以通过维基媒体基金会的内容翻译工具,使用 NLLB-200 背后的技术,将文章翻译成 20 多种低资源语言(那些没有大量数据集来训练 AI 系统的语言)。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 Meta 的最新人工智能模型将以数百种语言提供内容 https://www.7claw.com/56369.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务