Amazon Web Services、DeepLearning.ai 和 Coursera 正在寻求弥合创建和测试机器学习和模型之间的差距,并通过三门课程的专业化将它们扩展到生产中。
DeepLearning.AI 的创始人兼 Coursera 的顶级讲师 Andrew Ng 解释说:“机器学习在概念证明与生产之间存在差距。” 该专业旨在帮助开发人员将模型从笔记本电脑上的原型转移到云端。 “当用户从 10 个增加到 100 万时,要做的事情太多了,”Ng 补充道。
AWS 副总裁兼机器学习服务总经理 Bratin Saha 表示,在短短几年内,客户已经从部署少数几个模型发展到数百万个模型。 “ML 不再是一个利基市场,”SageMaker 的负责人 Saha 说,SageMaker 是 AWS 增长最快的机器学习平台。
专业化课程概述了将模型投入生产所需的移动部分(MLOps、DevOps),以及涵盖准确性、成本和优化的主题作为原型规模。
入门:什么是人工智能? | 什么是机器学习? | 什么是深度学习? | 什么是通用人工智能?
在对 Ng 和 Saha 的采访中,我们谈到了关于模型的几个值得注意的点。 我们聊天的一些亮点:
模型是否应该从一开始就在云中开始考虑规模? Ng 说他对机器学习模型的方法是基于“为正确的工作使用正确的工具”。 “在笔记本电脑上进行概念验证很好。你需要概念验证来决定走还是不走,”Ng 说。
Ng 补充说,在概念验证之前就进行规模规划可能会使整个过程变得混乱。
缩放需要技巧。 Saha 表示,专业化课程旨在拓宽机器学习的人才基础。 Saha 和 Ng 都表示,缺乏了解如何扩展模型的人才。 “两年前,我们会训练具有 2000 万个参数的模型。今天是 1 亿个。我们每个月都会做出数千亿次预测,”Saha 说。
Ng 表示,对熟练的机器学习从业者的需求很高,而那些在云中部署了有意义的服务的人则更加供不应求。 因此,Saha 表示,所有加入亚马逊的工程师都必须参加机器学习课程。
机器学习处于其发展的早期阶段。 Ng 表示,机器学习在很多方面都与早期的软件开发押韵。 “我依稀记得什么时候软件工程一团糟,而现在版本控制更加成熟,”Ng 说。 “我从软件如何成为一个行业中汲取灵感。”
实用数据科学专业化
Coursera 课程
至于实用数据科学专业,这里是重点。
该专业专为熟悉 Python 和 SQL 编程语言并希望构建端到端机器学习管道的以数据为中心的开发人员、科学家和分析师而设计。
用于自然语言处理和自然语言理解的算法,包括 BERT、GLoVe、ELMo 和 FastText。
第一门课程介绍了使用 Amazon SageMaker Studio 以及其他 SageMaker 服务进行的基本概念和探索性数据分析。 将涵盖自动机器学习。
在第二门课程中,学习者将构建、训练和部署端到端的机器学习管道。
第三门课程将涵盖高级模型训练、调整和部署技术。 将涵盖分布式训练、超参数调整和 A/B 测试。
托管在线实验室环境由 AWS 合作伙伴 Vocareum 提供。