作为一名数据科学家应该是“21 世纪最性感的工作”。 2012 年著名的《哈佛商业评论》格言是否站得住脚有些主观,取决于您如何解读“性感”。 然而,围绕数据科学家以及相关数据工程和数据分析师角色的数据开始敲响警钟。
HBR 格言的主观部分是您是否真的喜欢查找和清理数据、构建和调试数据管道和集成代码,以及构建和改进机器学习模型。 按顺序排列的任务列表是数据科学家花费大部分时间的地方。
有些人被工作描述真正吸引到以数据为中心的职业; 需求和工资的增长更能吸引其他人。 虽然职位描述本身的阴暗面并不为人所知,但增长和薪水部分并没有太多争议。 然而,这种情况可能正在改变:数据科学家的角色仍然有需求,但也不能免受市场动荡的影响。
混合信号
2022 年初,事情可能正在发生变化的第一个迹象开始显现。 在线招聘公司 Dice 发布的 IEEE Spectrum 数据分析显示,2021 年,人工智能和机器学习的薪水下降了,尽管美国技术人员的薪水平均上涨了近 7%。
总体而言,2021 年对美国的科技专业人士来说是丰收的一年,平均工资增长 6.9% 至 104,566 美元。 然而,正如 IEEE Spectrum 指出的那样,机器学习、自然语言处理和人工智能专家的竞争有所缓和,平均工资分别下降了 2.1%、7.8% 和 8.9%。
这是近年来首次出现这种情况,例如,美国具有机器学习专业知识的软件工程师的平均工资在 2019 年比 2018 年增长了 22%,然后在 2020 年又增长了 3.1%。与此同时,需求 数据科学家的角色并没有显示出任何消退的迹象——恰恰相反。
开发人员招聘平台报告称,对数据科学相关 IT 技能的需求急剧上升。 开发人员筛选和面试平台 DevSkiller 发布的最新 IT 技能报告显示,招聘人员在 2021 年的面试过程中为候选人设置的数据科学相关任务数量增加了 295%。
CodinGame 和 CoderPad 的 2022 年技术招聘调查还将数据科学与 DevOps 和机器学习专家一起确定为供不应求的职业。 因此,ZDNet 的 Owen Hughes 指出,如果雇主希望保持竞争力,他们将不得不重新评估他们为员工提供的薪水和福利待遇。
此外,2021 年出现了后来被称为“大辞职”或“大洗牌”的时期——每个人都在重新思考一切,包括他们的职业生涯。 从理论上讲,让一部分员工重新定义他们的轨迹和目标和/或辞职应该会增加需求和薪水——关于数据科学家为什么辞职以及雇主可以做些什么来留住他们的分析开始进行。
然后是裁员,包括数据科学家、数据工程师和数据分析师角色的裁员。 正如 LinkedIn 对最新一轮裁员的分析所指出的那样,科技行业动荡的一年每天都在宣布裁员、冻结招聘和取消工作机会。
5 月份,全球 70 多家科技初创公司的约 17,000 名员工被解雇,比 4 月份激增 350%。 这是自 2020 年 5 月疫情最严重以来该行业失业人数最多的一次。 此外,Netflix 和 PayPal 等科技巨头也在裁员,而 Uber、Lyft、Snap 和 Meta 则放缓了招聘步伐。
根据科技裁员跟踪网站 Layoffs.fyi 共享的数据,在所跟踪的公司中,裁员比例从 7% 到 33% 不等。 深入研究公司特定的数据表明,这些数据也包括面向数据的角色。
例如,查看金融科技 Klarna 和保险初创公司 PolicyGenius 裁员的数据表明,初级和高级的数据科学家、数据工程师和数据分析师角色都受到影响。 在这两家公司中,这些职位约占裁员人数的 4%。
高科技苦力编码自己脱离工作
那么我们要如何处理这些混合信号呢? 对数据科学相关任务的需求似乎持续强劲,但薪水正在下降,而且这些角色也不能幸免于裁员。 这些信号中的每一个都有其自身的背景和含义。 让我们试着拆开它们,看看它们的汇合对求职者和雇主意味着什么。
正如 Dice 首席营销官 Michelle Marian 告诉 IEEE Spectrum 的那样,有多种因素可能导致机器学习和 AI 工资的下降,其中一个重要的考虑因素是越来越多的技术人员正在学习和掌握这些技能:
“随着时间的推移,人才库的增加可能导致雇主需要支付的费用至少略微减少,因为技能组合更容易找到。我们已经看到这种情况发生在一系列认证和其他高度专业化的技术技能上,”说 玛丽安。
这似乎是一个合理的结论。 然而,对于数据科学和机器学习,可能还有其他因素在起作用。 数据科学家和机器学习专家不仅相互竞争,而且越来越反对自动化。 正如驻香港的量化投资组合经理 Peter Yuen 指出的那样,量化分析师之前已经看到了这一切。
受顶级人工智能研究人员薪水在 100 万美元范围内的消息的推动,Yuen 写道,这“应该更准确地解释为在全球人工智能供过于求的背景下,高科技苦力将自己辞掉工作的长期趋势的延续。 技术工人”。
Yuen 写道,如果可以借鉴三代宽客在金融市场自动化方面的经验,那么许多行业的普通人工智能从业者的自动化可能只需要十年左右的时间。 他补充说,在那之后,一小群精英 AI 从业者将获得管理或所有权地位,而其余人则停留在平均薪水的工作岗位上,负责监控和维护他们的创造。
我们可能已经处于这个周期的初始阶段,正如 AutoML 和现成机器学习模型库等发展所证明的那样。 如果历史是可以借鉴的,那么 Yuen 所描述的情况也可能会发生,这将不可避免地引发关于下岗工人如何“晋升”的问题。
AI泡沫破灭
但是,可以安全地假设数据科学角色在不久的将来不必担心太多。 毕竟,关于数据科学项目的另一个经常被引用的事实是,大约 80% 的项目仍然由于多种原因而失败。 Zillow 是最公开的数据科学失败案例之一。
Zillow 的业务开始严重依赖数据科学团队为其购房服务构建准确的预测模型。 事实证明,这些模型并不那么准确。 结果,公司的股票在 5 天内下跌了 30% 以上,CEO 将很多责任推给了数据科学团队,25% 的员工被解雇了。
Zillow 的数据科学团队是否有过错还有待商榷。 至于最近的裁员,它们可能应该被视为经济大转变的一部分,而不是数据科学团队本身的失败。 正如 Data Science Central 社区编辑 Kurt Cagle 所写,有人在谈论 AI 冬天即将来临,这让人回想起 1970 年代 AI 风险投资完全枯竭的时期。
Cagle 认为,虽然 AI 寒冬不太可能发生,但可以预期 AI 的秋天,该领域的顶级风险投资领域将会降温。 1970 年代的 AI 寒冬很大程度上是因为技术不能胜任这项任务,而且没有足够的数字化数据可供使用。
如今,可用的计算能力要强大得多,数据量也在猛增。 Cagle 认为,问题可能在于我们正在接近当前使用的神经网络架构的极限。 Cagle 补充说,一个聪明的头脑可以真正休息和创新而不是简单地应用既定思维的时期可能会给这个行业带来一些好处。
和其他许多人一样,Cagle 指出了“深度学习无所不能”这一思想流派的缺陷。 这种批评似乎是有道理的,采用当今被忽视的方法可能会推动该领域的进步。 但是,我们不要忘记,技术方面的事情在这里并不是最重要的。
也许最近的历史可以提供一些见解:软件开发和互联网的历史可以教给我们什么? 在某些方面,我们现在所处的位置让人想起互联网泡沫时代:资本可用性增加、过度投机、不切实际的期望以及估值过高。 今天,我们可能正走向 AI 泡沫的破灭。
这并不意味着数据科学角色会在一夜之间失去吸引力,或者他们所做的事情没有价值。 毕竟,软件工程师仍然需要软件工程在过去几十年中取得的所有进步和自动化。 但这可能意味着需要进行重新校准,并且应该相应地管理预期。