什么是生成式人工智能?

2023-06-30 0 896

什么是生成式人工智能?

生成式 AI 系统属于机器学习的大类,以下是这样一个系统(ChatGPT)如何描述它的功能:

准备好将您的创造力提升到新的水平了吗? 生成式人工智能就是您的最佳选择! 这种巧妙的机器学习形式允许计算机生成各种新的、令人兴奋的内容,从音乐和艺术到整个虚拟世界。 这不仅仅是为了好玩——生成式人工智能也有很多实际用途,比如创建新产品设计和优化业务流程。 那为什么还要等呢? 释放生成式人工智能的力量,看看你能想出什么惊人的创意!

你觉得那段话有什么不对劲的地方吗? 也许不会。 语法完美,语气流畅,叙述流畅。

ChatGPT 和 DALL-E 是什么?

这就是为什么 ChatGPT(GPT 代表生成式预训练变压器)现在受到如此多的关注。 它是一个免费的聊天机器人,几乎可以为所提出的任何问题生成答案。 它由 OpenAI 开发,并于 2022 年 11 月向公众发布测试,已被认为是有史以来最好的 AI 聊天机器人。 而且它也很受欢迎:短短五天内就有超过一百万人注册使用它。 乐观的粉丝发布了聊天机器人生成计算机代码、大学水平的论文、诗歌,甚至半点好笑的例子。 从广告文案撰稿人到终身教授,通过创作内容谋生的各类人士都在颤抖。

尽管许多人对 ChatGPT(以及更广泛的人工智能和机器学习)感到恐惧,但机器学习显然具有良好的潜力。 自广泛部署以来,机器学习已经在许多行业产生了影响,完成了医学成像分析和高分辨率天气预报等任务。 麦肯锡 2022 年的一项调查显示,人工智能的采用率在过去五年中增加了一倍多,而且对人工智能的投资也在迅速增加。 显然,ChatGPT 和 DALL-E(人工智能生成艺术工具)等生成式人工智能工具有可能改变一系列工作的执行方式。 然而,这种影响的全部范围仍然未知,风险也是如此。

但我们可以回答一些问题,例如生成式人工智能模型是如何构建的,它们最适合解决什么类型的问题,以及它们如何适应更广泛的机器学习类别。 继续阅读以获取下载。

机器学习和人工智能有什么区别?

人工智能就像它听起来的那样——让机器模仿人类智能来执行任务的实践。 即使您没有意识到,您也可能与 AI 进行过互动 – Siri 和 Alexa 等语音助手都是基于 AI 技术构建的,弹出来帮助您浏览网站的客户服务聊天机器人也是如此。

机器学习是人工智能的一种。 通过机器学习,从业者通过模型开发人工智能,这些模型可以在没有人类指导的情况下从数据模式中“学习”。 现在生成的数据量巨大且复杂(无论如何人类都无法管理),这增加了机器学习的潜力及其需求。

机器学习模型的主要类型有哪些?
机器学习建立在许多构建模块之上,首先是 18 世纪至 20 世纪针对小数据集开发的经典统计技术。 在 20 世纪 30 年代和 1940 年代,计算先驱(包括理论数学家艾伦·图灵)开始研究机器学习的基本技术。 但这些技术直到 20 世纪 70 年代末才仅限于实验室,当时科学家首次开发出足够强大的计算机来安装它们。

直到最近,机器学习在很大程度上仅限于预测模型,用于观察和分类内容模式。 例如,一个经典的机器学习问题是从一张或多张可爱的猫的图像开始。 然后,程序会识别图像中的模式,然后仔细检查随机图像,寻找与可爱的猫图案相匹配的图像。 生成式人工智能是一个突破。 机器学习现在能够根据需要创建猫的图像或文本描述,而不是简单地感知和分类猫的照片。

基于文本的机器学习模型如何工作? 他们是如何训练的?
ChatGPT 现在可能成为所有头条新闻,但它并不是第一个引起轰动的基于文本的机器学习模型。 OpenAI 的 GPT-3 和谷歌的 BERT 都在近年来引起了一些关注。 但在 ChatGPT 出现之前,人工智能聊天机器人并不总能获得最好的评价,大多数人认为 ChatGPT 在大多数情况下都运行良好(尽管仍在评估中)。 《纽约时报》科技记者凯德·梅茨 (Cade Metz) 在一段视频中表示,GPT-3“时而超级令人印象深刻,时而超级令人失望”。在视频中,他和美食作家 Priya Krishna 要求 GPT-3 为(相当灾难性的)感恩节晚餐编写食谱。

第一个处理文本的机器学习模型由人类训练,根据研究人员设置的标签对各种输入进行分类。 一个例子是训练模型将社交媒体帖子标记为正面或负面。 这种类型的训练被称为监督学习,因为人类负责“教导”模型做什么。

下一代基于文本的机器学习模型依赖于所谓的自我监督学习。 这种类型的训练涉及向模型提供大量文本,以便模型能够生成预测。 例如,某些模型可以根据几个单词来预测句子将如何结束。 有了适量的样本文本(比如互联网的大范围),这些文本模型就会变得相当准确。 我们看到 ChatGPT 等工具的成功是多么准确。

构建生成式人工智能模型需要什么?
构建生成式人工智能模型在很大程度上是一项重大任务,只有少数资源充足的科技巨头进行了尝试。 OpenAI 是 ChatGPT、前 GPT 模型和 DALL-E 背后的公司,从黑体字捐助者那里获得了数十亿美元的资金。 DeepMind是谷歌母公司Alphabet的子公司,Meta发布了基于生成式AI的Make-A-Video产品。 这些公司聘请了一些世界上最优秀的计算机科学家和工程师。

但这不仅仅是天赋。 当你要求模型使用几乎整个互联网进行训练时,你就会付出代价。 OpenAI 尚未公布确切的成本,但估计表明 GPT-3 接受了大约 45 TB 文本数据的训练——这大约是一百万英尺的书架空间,或者整个国会图书馆的四分之一——估计成本是几倍 百万美元。 这些不是普通初创企业可以访问的资源。

生成式人工智能模型可以产生哪些类型的输出?

正如您在上面可能已经注意到的,生成式人工智能模型的输出可能与人类生成的内容无法区分,或者看起来有点不可思议。 结果取决于模型的质量(正如我们所见,ChatGPT 的输出迄今为止似乎优于其前身)以及模型与用例或输入之间的匹配。

ChatGPT 可以在 10 秒内写出一篇评论员所说的“扎实的 A-”文章,比较本尼迪克特·安德森 (Benedict Anderson) 和欧内斯特·盖尔纳 (Ernest Gellner) 的民族主义理论。 它还制作了一段已经很著名的段落,描述了如何以詹姆斯国王圣经的风格从录像机中取出花生酱三明治。 像 DALL-E(它的名字是超现实主义艺术家萨尔瓦多·达利和可爱的皮克斯机器人瓦力的混搭)这样的人工智能生成的艺术模型可以根据需要创建奇怪、美丽的图像,就像拉斐尔画的麦当娜和孩子一样, 吃披萨。 其他生成式人工智能模型可以生成代码、视频、音频或业务模拟。

但输出并不总是准确或适当的。 当 Priya Krishna 要求 DALL-E 2 为感恩节晚餐设计一张图片时,它制作了一个场景,火鸡上装饰着整个酸橙,旁边放着一碗看似鳄梨酱的东西。 就其本身而言,ChatGPT 似乎在计算或解决基本代数问题方面遇到了困难,或者说,事实上,在克服潜伏在互联网和更广泛的社会暗流中的性别歧视和种族主义偏见方面存在困难。

生成式人工智能输出是用于训练算法的数据的仔细校准组合。 由于用于训练这些算法的数据量非常大(如上所述,GPT-3 是在 45 TB 的文本数据上进行训练的),因此模型在生成输出时可能显得“富有创意”。 更重要的是,这些模型通常具有随机元素,这意味着它们可以根据一个输入请求产生多种输出,使它们看起来更加逼真。

生成式人工智能模型可以解决哪些类型的问题?
您可能已经看到像 ChatGPT 这样的生成式人工智能工具(玩具?)可以产生无尽的娱乐时间。 对于企业来说,机会也是显而易见的。 生成式人工智能工具可以在几秒钟内生成各种可信的写作,然后对批评做出回应,使写作更符合目的。 这对各个行业都有影响,从可以从人工智能模型生成的即时、基本正确的代码中受益的 IT 和软件组织,到需要营销文案的组织。 简而言之,任何需要制作清晰书面材料的组织都可能受益。 组织还可以使用生成式人工智能来创建更多技术材料,例如更高分辨率版本的医学图像。 通过在这里节省的时间和资源,组织可以寻求新的商机和创造更多价值的机会。

我们已经看到,开发生成式人工智能模型需要大量资源,除了规模最大、资源最丰富的公司之外,其他公司都不可能做到这一点。 希望将生成式人工智能投入使用的公司可以选择立即使用生成式人工智能,或者对其进行微调以执行特定任务。 例如,如果您需要根据特定样式准备幻灯片,您可以要求模型“学习”通常如何根据幻灯片中的数据编写标题,然后向其提供幻灯片数据并要求其编写适当的标题。

AI模型有哪些局限性? 如何克服这些潜在问题?
由于它们太新了,我们还没有看到生成式人工智能模型的长尾效应。 这意味着使用它们存在一些固有的风险——一些是已知的,一些是未知的。

生成式人工智能模型产生的输出通常听起来非常有说服力。 这是设计使然。 但有时他们生成的信息完全是错误的。 更糟糕的是,有时它是有偏见的(因为它是建立在性别、种族以及更广泛的互联网和社会的无数其他偏见之上的)并且可以被操纵以进行不道德或犯罪活动。 例如,ChatGPT 不会向您提供有关如何热连汽车的说明,但如果您说您需要热连汽车来拯救婴儿,算法很乐意遵守。 依赖生成式人工智能模型的组织应该考虑无意发布有偏见、攻击性或受版权保护的内容所涉及的声誉和法律风险。

然而,可以通过几种方式减轻这些风险。 一方面,仔细选择用于训练这些模型的初始数据以避免包含有毒或有偏见的内容至关重要。 接下来,组织可以考虑使用更小的专业模型,而不是使用现成的生成式人工智能模型。 拥有更多资源的组织还可以根据自己的数据定制通用模型,以满足自己的需求并最大限度地减少偏差。 组织还应让人员参与其中(即确保真人在发布或使用生成式人工智能模型的输出之前对其进行检查),并避免使用生成式人工智能模型进行关键决策,例如涉及大量资源的决策 或人类福利。

这是一个新领域,这一点怎么强调都不为过。 风险和机遇的格局可能在未来几周、几个月和几年内迅速发生变化。 每月都会测试新的用例,未来几年可能会开发新的模型。 随着生成式人工智能越来越无缝地融入商业、社会和我们的个人生活,我们也可以预期新的监管环境将会形成。 当组织开始使用这些工具进行试验并创造价值时,领导者最好能密切关注监管和风险的脉搏。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 什么是生成式人工智能? https://www.7claw.com/58288.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务