H2O.ai 将 AI 大师驱动的 NLP 引入企业

2023-05-20 0 455

H2O.ai 将 AI 大师驱动的 NLP 引入企业

世界上大约有 1200 名国际象棋大师,而 AI 大师只有 250 名。 在国际象棋中,就像在 AI 中一样,特级大师是为顶级职业棋手保留的荣誉。 在 AI 领域,这一荣誉授予 Kaggle 进程系统中表现最好的数据科学家。

H2O.ai 是一家人工智能云公司,在 2021 年底的 E 轮融资中筹集了 1 亿美元,目前估值为 16 亿美元,雇用了全球 10% 的人工智能大师。 该公司刚刚发布了 H2O Hydrogen Torch,该产品旨在为企业带来图像、视频和自然语言处理 (NLP) 的 AI 精通技术。

我们与 H2O 首席执行官兼创始人 Sri Ambati 取得了联系,我们讨论了从 H2O 的起源和整体产品到 Hydrogen Torch 以及它在 AI 领域中的位置等方方面面。

H2O:人工智能堆栈
几十年前,Ambati 首次开始使用 AI 为印度太空研究计划进行语音到文本的翻译。 随后,他偶然发现了当时处于早期阶段的神经网络。 作为硅谷的移民,他花时间在初创公司工作。 他还在伯克利和斯坦福大学休假期间结识了数学家、物理学家和计算机科学家。

Ambati 与他们合作,为 H2O 的开源基金会奠定了基础。 但直到他的母亲得了乳腺癌,他才“受到启发,要为每个人普及机器学习”。

正如他所说,Ambati 着手将 AI 带到每位医生或数据科学家的指尖,以解决对社会有价值的问题。 为此,他继续补充说,必须重新发明大规模的数学和分析。 这导致了 H2O,汇集了编译器工程师、系统工程师、数学家、数据科学家和大师,以便非常快速地轻松构建高价值和高精度的模型。

多年来,H2O 建立了一条完整的产品线来实现这一点。 Ambati 说,当 H2O 于 2012 年启动时,可扩展的开源 AI 基础存在差距。 有像 R 和 Python 这样的语言允许人们构建模型,但它们非常慢或脆弱或功能不全。 按照 Ambati 的说法,H2O 的贡献在于他们构建了“世界上最快的距离计算器”。

这是对深度学习中用于矩阵乘法的核心数学的引用。 当你可以计算两个长张量之间的距离时,Ambati 继续补充说,你可以开始在高维和低维数据中生成丰富的线性和非线性数学。

该贡献是 H2O 开源框架的一部分。 Ambati 将这种低级基础称为“AI 的汇编语言”。 然后是 H2O 集成框架和开源社区,例如 Scikit-learn、XGBoost、Google 的 TensorFlow 或 Facebook 的 PyTorch。 H2O 团队开始为这些做出贡献,同时最终在后来被称为 AutoML 的地方整合了一个集成框架。

H2O 在该领域的产品是 H2O AutoML,基于 H2O 开源和 XGBoost,以及更广泛的产品,称为 Driverless AI,它是闭源的。 两者都以时间序列数据为目标,这些数据是许多企业用例的支柱,例如客户流失预测、欺诈预防或信用评分。

根据 Ambati 的说法,在过去四年中,无人驾驶 AI 一直是“H2O 经济的引擎”。 它帮助 H2O 获得了数百家客户,占财富 500 强的一半以上,包括 AT&T、花旗、第一资本、葛兰素史克、日立、Kaiser Permanente、宝洁、贝宝、普华永道、利洁时、联合利华和沃尔格林。

Ambati 将这一层称为“人工智能的编译器”。 这就是 H2O 开始使用大师级方法的地方:将问题空间划分为许多菜谱,为每个菜谱分配 Kaggle 大师级大师,目的是提炼他们的知识,使地面团队的工作变得更容易。

建立良好的机器学习模型后的下一阶段是安全地运行该模型。 数据本身就存在偏差,而有偏差的模型不应在没有受到质疑的情况下投入生产。 找到盲点并进行对抗性测试和模型验证,部署模型,然后将其集成到软件构建的 CI/CD 中,这就是 Ambati 所说的“AI 的中间件”。

这通过 H2O(AI 云)提供的混合云、内部部署和边缘产品来解决。 客户通过应用程序使用它:有一个 AI 应用程序商店、一个预建模型商店和功能商店,从模型构建中获得的见解具体化。 AI Cloud 也是多云的,因为客户需要选择。 然后还有 H2O Wave——按照 Ambati 的说法,这是一个用于构建应用程序的 SDK。

站在网络巨人的肩膀上
Hydrogen Torch 是 H2O 产品组合的最新成员,专为图像、视频和 NLP 处理用例的应用程序量身定制,包括识别或分类对象、分析情绪或在文本中查找相关信息。 这是一种无代码产品,Ambati 对此表示:

“它走进了谷歌、微软、亚马逊和 Facebook 等网络巨头的传统领域,并使用了他们的一些创新,但通过让客户更轻松地使用深度学习来挑战他们,既可以采用预先构建的模型,也可以将它们转化为 本地使用。”

Ambati 提到了 Hydrogen Torch 的一些早期采用者用例,例如实时视频处理。 在新加坡,这样做是为了确定交通是否畅通,或者某些情况是否会导致事故。 使用的方法是采用“传统的”大型机器学习模型,然后根据手头的特定数据对其进行微调。

Hydrogen Torch 在底层使用了 Facebook 的 PyTorch 和谷歌的 TensorFlow。 H2O 采用它们并添加了大师级专业知识以及集成环境。 这还包括 H2O 的 MLOps 产品,它为生产中的数据和机器学习管道提供支持。

正在对模型进行持续监控,以确定其准确性是否发生了变化。 这可能是因为传入数据的模式发生了变化,或者因为最终用户的行为发生了变化。 无论哪种方式,模型都会被重建和重新部署。

此外,Hydrogen Torch 无代码产品的一部分是自动生成文档,这样数据科学家就可以深入探索选择了哪些数据以及应用了哪些转换。 Ambati 声称,与基准模型相比,Hydrogen Torch 模型的准确度最高可提高 30%,达到 90 个百分点。

当然,他继续补充说,人工智能在准确性、速度和可解释性之间存在着众所周知的权衡。 根据用例要求,必须做出选择。 然而,速度在某种程度上是一种普遍要求。

就速度而言,H2O 的内存处理在确保 Hydrogen Torch 能够按图像、视频和 NLP 处理用例的需要执行方面发挥着关键作用。 在相关方面,H2O 也将机器学习模型小型化提上了日程。 这将使模型能够部署在更多边缘设备上,并具有更好的性能。

Hydrogen Torch 还与 H2O 产品组合中的另一个产品 Document AI 具有协同作用。 Document AI 可以处理传入的文档,结合图像和 NLP 方法。 然后是来自 Zoom 通话和播客等来源的音频和视频数据正在激增,H2O 旨在帮助其客户跟上。

H2O 与 CommBank 和 AT&T 等知名客户持续合作。 H2O 和客户组织的专家共同创建了机器学习模型,并制定了收益分享计划。

Ambati 还确定了 H2O 产品组合未来增长的更多领域:联邦人工智能、内容创建、合成数据生成、数据叙事,甚至数据新闻等领域都在 H2O 的关注范围内。 Ambati 说,目标是建立对 AI 服务社区的信任。 这确实是一个宏伟的愿景,其进展难以衡量。 然而,就产品路线图而言,H2O 似乎走在了正确的轨道上。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 H2O.ai 将 AI 大师驱动的 NLP 引入企业 https://www.7claw.com/56640.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务