对于搜索引擎和企业写作辅助,最大的竞争者是 OpenAI,该公司昨天发布了其语言模型的最新模型 GPT-4。
GPT-4 现已在 ChatGPT Plus 上提供并作为 API 提供,开发人员可以加入等待名单。 它为人工智能战争注入了一种新武器,在这场战争中,组织竞相提供最好、最灵活的写作人工智能。
GPT-4 提高推理能力
OpenAI 展示了新的自然语言模型,并提出了一个挑战:“用一个句子解释灰姑娘的情节,其中每个单词必须从 A 到 Z 的下一个字母开始,不能重复任何字母。” 这是一个巧妙的谜语,表明人工智能可以执行一些推理并生成简单的文本,但它在办公室里做什么呢?
OpenAI 在其声明中表示,GPT-4 的创意和技术任务都已摆在桌面上。 新模型能够匹配个人的写作风格,并接受有关声音和语气的指示。 GPT-4 在演示中的一些答案更简单,采用奥卡姆剃刀来解决调度问题。 新的细微差别部分来自于在定制的 Microsoft Azure AI 超级计算机上进行的训练。
具体来说,GPT-4 被称为大型多模态深度学习模型,这意味着它接受图像和文本输入并创建文本输出。 请注意 OpenAI 其产品的各个迭代之间的区别。 ChatGPT 是基于 GPT-3 的流行聊天机器人。 同时,GPT-3.5 是 GPT-4 的初稿,大约一年前开始训练。
GPT-3 和 GPT-4 功能之间的确切差异可能很难衡量。 OpenAI 自己承认,差异是“微妙的”。 OpenAI 通过对 GPT-4 和 GPT-3 进行各种学术测试来跟踪 GPT-4 的进展,例如在 AP 高中课程结束时进行的测试或统一律师考试,GPT-4 的得分通常更高。 有关这方面的更多信息可以在完整的技术报告中找到。
OpenAI 如何努力实现更多“事实回应”
对此类自然语言人工智能的常见批评之一是,它们产生的结果听起来像人类语音,但并非基于内容的实际事实——它们不检查准确性。 OpenAI 似乎意识到了这一点,并指出“根据我们的内部评估,GPT-4 产生事实反应的可能性比 GPT-3.5 高出 40%”。
GPT-4“响应禁止内容的请求”的可能性也降低了 82%。 不允许的内容包括仇恨言论、淫秽内容、伤害威胁或模型可能从接受训练的互联网文本中获取的其他不适合工作场所的对话主题。 “高风险政府决策”和执法决策也被正式禁止。
为了避免这些问题,OpenAI 利用了 ChatGPT 用户提交的反馈; 它还聘请了安全和安保领域的人工智能专家。 然而,OpenAI 指出,该模型的主要问题之一仍然是它倾向于吐出“社会偏见、幻觉和对抗性提示”。
有趣的是,其中一些过程涉及人工智能本身。
“我们使用 GPT-4 来帮助创建用于模型微调的训练数据,并在训练、评估和监控中迭代分类器,”OpenAI 写道。
OpenAI 还发布了 OpenAI Evals 的开源代码,这是用于评估人工智能性能的框架,任何人都可以查看他们的标准并报告问题。
GPT-4 对企业领导者意味着什么?
企业领导者可能想要决定允许或鼓励员工使用多少以及哪种自然语言人工智能服务。 到目前为止,ChatGPT 已向使用其产品的多家公司征求反馈,例如语言学习应用程序 Duolingo、视觉辅助应用程序 Be My Eyes 和财富管理公司摩根士丹利。
微软已经在 Bing 搜索引擎的幕后运行 GPT-4 大约五周了。
GPT-4 是一个巨大的飞跃,还是一个新衣服的旧想法?
在将人工智能添加到搜索功能方面,谷歌和微软正在展开正面交锋。 谷歌的 Bard AI 将很快提供给测试组,而微软的 Bing 从 2 月份开始与 ChatGPT 合作。 Anthropic 是一家由谷歌资金支持的生成人工智能公司,也凭借名为 Claude 的自然语言模型加入了竞争。
谷歌处于领先地位,但也感受到了压力,很难说人工智能的下一步趋势将走向何方。 您应该加入还是等待? 也许这取决于人工智能助手的用途。 它可以在哪些方面节省时间,或者在哪些方面会造成阻碍? 毕竟,其中一些功能听起来就像是微软失落且备受人们津津乐道的 Clippy 的更灵活、更资源密集的版本。