人工智能驱动的语音识别正在进入一个新阶段:全面的全球理解

2023-05-13 0 1,192

人工智能驱动的语音识别正在进入一个新阶段:全面的全球理解

一家语音识别初创公司刚刚获得 6200 万美元的 B 轮融资。 这笔钱将如何使用? 为了让计算机能够理解世界上的每一种声音。

如果这没有让您觉得雄心勃勃,那么您还没有花足够的时间让 Siri 撰写短信。 语音识别一直是开发人员面临的巨大挑战,也是各行各业密切关注的难题。 该技术对机器人、自动驾驶汽车和个人计算等领域的人机界面产生了影响,所有这些都将受益于能够准确解释自然语音的计算机。

因此,语音识别是一种技术切入点,一种可以帮助刺激技术发展的市场需求,这些技术将对我们与机器的交互方式产生广泛的共鸣和不可估量的影响。

这也是一个股权问题。 毫不奇怪,语音识别目前适用于全球一小部分人口。

挑战的很大一部分是训练模型。 大多数训练数据需要手动分类,这意味着准确性只能在非常窄的一组说话者中实现(毫不奇怪,该窄组恰好对应于最有价值的消费者)。 Speechmatics 正在采取不同的方法来争取更具代表性的语音识别。

根据斯坦福大学“语音识别中的种族差异”研究中使用的数据集,与谷歌 (68.6%) 和亚马逊 (68.6) 相比,Speechmatics 记录的非裔美国人声音的总体准确率为 82.8%。 这种准确度相当于语音识别错误减少 45%——相当于平均句子中的三个词。

它的引擎使用不需要人工干预的未标记的、更具代表性的语音数据,暴露在数十万个单独的声音中。 这有助于将覆盖范围扩大到讲英语的人之外。

“我们在过去几年取得的进步让投资者对我们的 B 轮融资充满了兴趣,”首席执行官 Katy Wigdahl 说。 “Speechmatics 团队雄心勃勃。我们在语音技术方面拥有真正的传统,并结合了一些世界上最有才华的语音和机器学习专家。”

目前,该引擎可以理解 34 种语言,这只是很大的语言桶中的一小部分(全世界有 7,000 多种语言)。 但该平台在标点符号、数字、货币和地址方面取得了令人瞩目的进步,这些传统上阻碍了语音识别引擎。

所有这些都引起了这家英国公司的极大兴趣。 3Play Media、Veritone、Deloitte UK 和 Vonage 等公司以及世界各地的政府部门都在使用该平台。

根据其全球目标,Speechmatics 总部位于英国,但在波士顿(美国)、钦奈(印度)和布尔诺(捷克共和国)设有办事处。 该公司将利用这笔投资支持在美国和亚太地区的全球扩张。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 人工智能驱动的语音识别正在进入一个新阶段:全面的全球理解 https://www.7claw.com/56371.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务

  • ¥1.00 购买了 【企业内训系统】员工培训/在线考试/学习统计/学习证明(电脑端+手机端)
  • ¥1.00 购买了 【企业内训系统】员工培训/在线考试/学习统计/学习证明(电脑端+手机端)
  • ¥1.00 购买了 【企业内训系统】员工培训/在线考试/学习统计/学习证明(电脑端+手机端)