Generative AI 和 ChatGPT 的炒作机器是真实的,如今它们在科技领域似乎无处不在。 因此,我们开始听到有关改进后的新 Siri 的议论声也就不足为奇了。 事实上,9to5Mac 已经发现了一个新的自然语言系统。
你会说我的语言吗?
声称 tvOS 16.4 beta 上的 Siri 具有新的“Siri 自然语言生成”框架。 如上所述,它听起来并不令人印象深刻,因为它似乎主要专注于讲(爸爸?)笑话,但也可能让您使用自然语言来设置计时器。 它的代号为“山猫”。
这些窃窃私语是在纽约时报最近报道苹果 2 月份的 AI 峰会之后发出的。 该报告称,该活动在一定程度上关注了 ChatGPT 使用的生成内容和大型语言模型 (LLM)。 它还表示,随着苹果寻求推动人工智能向前发展,苹果的工程师每周都会推出新的语言概念,从而“积极测试”语言生成概念。
[ Bing 的 AI 聊天机器人来为我工作。 我不得不解雇它。 ]
那么,它是在构建 ChatGPT 竞争对手吗? 据彭博社报道,并非如此。
“嘿 Siri,‘赶上’怎么拼?”
虽然 Siri 首次出现时看起来非常复杂,但发展并没有跟上步伐,让 Apple 厚颜无耻的语音助手与 MobileMe 和 Ping 相呼应。 就像 Apple 的两次失败一样,Siri 曾承诺它从未完全实现并且现在落后于谷歌和亚马逊的助手,尽管它更加私密。
Siri 缺乏语境感意味着它实际上只擅长它被训练要做的事情,这限制了它的能力; GPT 似乎远远落后于它。 随着最近的 GPT-4 更新,OpenAI 正在快速创新。 我们已经可以看到,这已经点燃了大型科技公司的热情。 微软在 Bing 内部采用了 ChatGPT,谷歌在 Palm 开发上的快速推进,亚马逊正在大力推动 AWS Chat(后者现在集成在 Microsoft Teams 中)。
苹果——和 Siri——似乎岌岌可危。
不是唯一的
当然,Siri 并不是 Apple 致力于的唯一机器智能 (MI)。 在某些领域,例如可访问性和图像增强,它已经取得了 MI 正确完成的非常好的例子。 但是,不知何故,Siri 仍然会出错。
我不完全确定苹果公司的史蒂夫乔布斯会如何处理这个问题——当他的 HomePod 告诉他找不到他的 Dylan 曲目时,我看不出他会高兴。 这两个具有语音功能的 AI 之间的区别在于,我可以要求 GPT 创建一张他将智能扬声器扔到墙上的照片。
在某种程度上,这是因为 Siri 的构建方式。
他们是如何打造 Siri 的
Siri 是一个巨大的数据库,包含不同知识领域的答案,并辅以 Spotlight 中的搜索结果和自然语言解释,以便您可以与之交谈。 当发出请求时,Siri 会检查它是否理解问题,然后使用深度/机器学习算法来识别适当的响应。 为了获得该响应,它会对其获得正确答案的可能性进行数值评估(置信度得分)。
这意味着当你问 Siri 一个问题时,它首先会快速查看这是否是一个简单的请求(“开灯”),它是否可以根据已知信息迅速完成,或者它是否需要咨询 更大的数据库。 然后它会按照您的要求执行(有时),为您提供所需的数据(经常)或告诉您它不理解您的意思或要求您更改隐藏在系统某处的设置(太频繁)。
从理论上讲,Siri 与其数据库一样好,这意味着它弹出的答案越多,它就变得越好、越有效。
但是,有一个问题。 正如前 Apple 工程师 John Burkey 所解释的那样,Siri 的构建方式意味着工程师必须重建整个数据库才能对其进行升级。 这个过程最多可能需要六周时间。
微软 CEO 萨蒂亚·纳德拉 (Satya Nadella) 表示,缺乏真正的学习让 Siri 和其他语音助手“像石头一样笨”。 当然,你会希望他说出类似的话,因为微软已经在 ChatGPT 上投资了数十亿美元,并将其融入其产品中。
另一方面,生成式 AI
生成式 AI(ChatGPT、Midjourney、Dall-E 和 Stable Diffusion 中使用的那种智能)也使用自然语言、它自己的数据库和搜索结果,但也可以利用算法来创建看似原创的内容,例如音频、图像 , 或文字。
你可以问它一个问题,它会浏览所有可用数据并做出一些决定来得出结果。
现在,正如人们开始探索该技术以来经常注意到的那样,这些结果并不总是很好或原创,但它们通常看起来确实令人信服。 要求它生成 deepfake 视频和照片的能力更进一步。
在使用中,查看两种 AI 模型之间差异的一种方法是思考它们可以实现什么。
因此,虽然使用 Siri,您可以询问葡萄牙里斯本的地图,甚至可以获取该地图上某处的路线,但生成式 AI 可以让您提出更细微的问题,例如它推荐的城市的哪些部分,以编写 一个以那个城市为背景的动作故事,或者甚至制作一张你坐在 Largo dos Trigueiros 那个非常可爱的酒吧里的诡异准确的假照片。
很明显哪种 AI 最令人印象深刻。
接下来发生什么?
它不需要是这样的。 开发人员已设法创建应用程序以将 ChatGPT 添加到 Apple 的产品中。 watchGPT 最近因商标原因更名为 Petey – AI Assistant,就是一个很好的例子。
Apple 不太可能愿意将如此具有竞争力的重要技术拱手让给第三方,因此它可能会继续努力寻找自己的解决方案,但这可能需要数年时间——在此期间 Siri 可能仍无法打开舱门。
然而,鉴于 GPT-4 每千次提示的成本高达 12 美分,Apple 极不可能将其直接融入其操作系统。 拥有超过 10 亿用户的安装基础,这样做将非常昂贵,而微软已经在那里了。
在这种情况下,Apple 可能会硬着头皮让开发人员轻松地在他们制作的应用程序中添加对 OpenAI 技术的支持,从而有效地将成本转嫁给他们和他们的客户。
这可能在短期内有所帮助,但我相信这对 Apple 的机器智能团队来说是火上浇油。 现在,他们将加倍决心在作为这两种技术核心的自然语言处理领域进一步创新。
但在现阶段,在实施方面,他们确实显得落后了。 尽管如 GPT 生成的图像所示,外表可能具有欺骗性。