微软一直在大型语言模型方面进行重大投资,从在 Azure 中运行这些模型的硬件(它称之为“AI 超级计算机”)到可加速训练和运行具有数十亿参数的机器学习模型的 DeepSpeed 库 将它们分散到多个 GPU 上。 2020 年,微软从 OpenAI 获得了强大的(有时是有争议的)GPT-3 自然语言生成模型的独家许可,该模型使用 1750 亿个参数来生成看起来非常像人写的东西。
OpenAI 有一个在 Azure 上训练和运行的 GPT-3 API,但它处于私人测试阶段,研究人员和学者必须单独申请才能加入候补名单。 (尽管有这些限制,微软最近宣布 Azure 上的 GPT-3 平均每天为多个客户在生产环境中使用的数百个应用程序生成 45 亿个单词。)
同样,微软甚至还没有开始开放 AI GPT 和 Azure 服务的私人预览,并且注册通知的页面显示还没有发布日期。 但微软已经在其产品中使用 GPT-3 和其他自然语言生成功能,这些功能比为图像编写自动字幕复杂得多。
首先是微软的低代码 Power Platform,该平台越来越多地使用人工智能来帮助未经培训的开发人员的用户分析数据、提取信息并在自定义应用程序和自动化工作流程中使用这些信息。
强大的语言
当您在 Power BI 中创建报表时,图表和可视化效果可能是不言自明的,但您通常希望对趋势或重要结果进行评论。 Power BI 中的智能叙述功能可让您为整个报表添加叙述,或右键单击特定可视化并选择汇总。 无论哪种情况,该服务都会分析数据以生成趋势、增长、异常值以及常见值等见解,然后生成描述这些内容的文本。
如果数据集更新为新数字,或者您过滤视觉效果以深入了解数据的某一方面,则叙述会更新以匹配。
您可以编辑文本或将自己的观点添加到有关报告的叙述中,使用动态值来引用报告中的字段和度量(如果数据集发生变化,也会更新)。 您可以使用 Power BI 中问答视觉效果中已使用的相同类型的自然语言来执行此操作,但您得到的不仅仅是答案,而是可以在句子中使用的值。 Power BI 在后台为您编写数据分析表达式 (DAX) 查询。
目前尚不清楚 Smart Narrative 是在幕后使用 GPT-3 还是只是 Power BI 中现有的问答技术,但微软已宣布正在构建一项 Power BI 功能,该功能将使用 GPT-3 生成更复杂的 DAX 表达式 ,称为简单措施。 这与智能叙述的工作方式类似:您用自己的话输入想要在报告中看到的内容,Power BI 会弹出一个建议列表,它可以使用数据集中的信息构建表达式。 当您选择一个时,您可以预览查询结果以及 DAX 代码。 您可能会获得多个不同的 DAX 公式可供选择,并且您可以选择最佳结果并将其添加到报告中。
使用 GPT-3 来构建 DAX 计算,让您描述您想要的内容,而不是需要手动编写代码,这意味着更多的人将能够将业务逻辑和复杂的计算添加到他们的数据分析中。 如今,业务用户经常从其他地方复制和粘贴 DAX 代码; 生成它应该可以避免复制粘贴中的错误(以及节省使公式适用于稍微不同的数据集的时间)。
Power Apps 还将使用 GPT-3 根据您想要用日常语言执行的操作的描述生成代码,但对于 Power Fx(新开源的 Power Platform 语言)而言。
虽然 Power Apps 和 Power Automate 是用于将组件和连接中的应用和工作流连接在一起的低代码服务,但有时您希望通过添加一些代码来筛选或转换数据来自定义它们。 Power Fx 基于 Excel 函数,但添加了一些 SQL 和命令式编程命令,用于处理数据并使按钮和图库等交互式元素正常工作。
随着编程语言的发展,许多人已经对 Power Fx 有了一定的熟悉,但正确编写函数仍然很复杂。 编写“显示产品名称中带有婴儿车的 10 个订单,并按购买日期排序,最新的位于顶部”或“显示订阅已过期的客户”比在此处获取语法要容易得多:Filter(‘BC 订单’Left(‘产品名称’,4)=”Kids”) 或 FirstN(Sort(Search(‘BC Orders’, “stroller”, “aib_productname”), ‘购买日期’, 降序), 10)。
Power Apps Ideas 允许您从数据集中输入要在应用程序中显示的信息。 与 Power BI Easy Measures 一样,Ideas 使用 IntelliSense 在您键入时建议匹配数据源以及表、列和控件名称的值,以便 GPT-3 生成的代码将包含正确的引用。
Power Apps Ideas 还使用机器教学或“示例编程”技术(PROSE 或使用示例的程序综合已在 Visual Studio 中,并支持 Excel 自动填充功能)。 如果要格式化 Power Fx 代码检索到的数据,您可以输入示例(例如 Mary B. 显示名字和首字母而不是全名)来获取执行该数据转换的公式:Concatenate( Text(First(Split(ThisItem.’帐户名称’, ” “)).Result), ” “, Left(Text(Last(Split(ThisItem.’帐户名称’, ” “)).Result), 1)) 。
该功能将于 6 月底为美国 Power Platform 用户提供英语预览版。 最初,Ideas 最适合与 Search()、Sort()、SortByColumns()、Filter()、FirstN() 和 LastN() 公式配合使用。
由于其他 Power Platform 工具和服务(例如 Power Virtual Agents 和 Power Platform 的 Dataverse 数据存储)支持 Power Fx,GPT-3 功能也将添加到其中。
清理 GPT-3
Power Platform GPT-3 模型使用新的托管端点在 Azure 中的 Azure 机器学习服务上运行。 这意味着 Power Platform 团队不必管理底层集群基础设施,但他们仍然可以选择要使用的 CPU 和 GPU 资源、尝试新模型并监控延迟和吞吐量等指标。
GPT-3 的问题之一是它可以生成有意义、读起来非常清晰并且技术上正确的文本,但实际上并不能回答问题。 另一个原因是,当它接受广泛使用的内容(例如网页)的训练时,它会识别出该内容的偏见和偏见,并可能生成攻击性言论。
改变模型的训练方式和训练数据使 GPT-3 更加准确,而微软拥有这种控制能力,而调用 OpenAI GPT-3 API 的人却无法做到这一点:微软表示,GPT-3 中使用的 Power BI“已经接受了内置安全控制的广泛培训,以确保不会生成有害输出”。 同样,Power Platform 和 Azure AI 团队致力于调整 Power Fx 的 GPT-3 模型,并添加过滤器以删除结果中的“敏感或不当内容”。
Power Platform 功能通过查看您开始输入的内容并建议发送到 GPT-3 的自然语言来限制模型正在回复的“提示”。 这将有助于提高准确性,因为有多个选项可供选择。 Power Platform 用户在决定使用之前还会看到为他们生成的 DAX 和 Power Fx 结果,因此您不会向客户或员工展示由 AI 生成的、组织中没有人首先检查过的内容 。 由于您会看到生成的 DAX 或 Power Fx 代码,因此这也将成为学习更多语言、同时快速构建报告和应用程序的一种方式。