尽管在 COVID-19 大流行期间世界上大部分地区都关闭了,但为数据和人工智能领域的早期和后期初创企业提供资金的大门敞开了。 由合伙人 Matt Turck 领导的 FirstMark Capital 团队发布了最新的年度百科全书数据和 AI 景观。 图尔克及其同事写道,一方面,Snowflake 和 Confluent 的突破性 IPO 证明了成熟,这让风险投资界放心,收入和增长是真实的,资金的涌入不会引发市场的重演。 .com 泡沫。
是的,该报告指出人工智能的前景正在得到证实。 我们看到它突然出现,不仅出现在业务分析师使用的工具中,例如 BI,而且数据库内机器学习正在成为一个复选框功能,更不用说 Oracle、SAP、Salesforce 和其他公司现在经常合并 机器学习融入企业应用。 因此,我们看到的关于无人驾驶汽车的头条新闻越来越少,世界也没有等待自动驾驶的优步出现,以证明人工智能是真实的。
几个月前,FirstMark 变得疯狂——它引入了公开上市的机器学习、人工智能和数据公司的 MAD 指数。 重要的是,现在有足够多的公司可以单独列出,而不是被归入更通用的技术保护伞下。 这份名单——当时大约有十几家公司——最近(在过去五年内)公开了。
当然,让这一切成为可能的是风投界。 引用 CB Insights 的数据,到今年第二季度,风险投资同比增长 157%,而通过 IPO、直接上市或 SPAC 进行的公共融资在 2021 年上半年比去年同期增长了 6 倍以上。 下降的一个指标很可能是收购,因为风投推高的估值使得像 Databricks(价值 380 亿美元)这样的公司收购成本太高,即使对微软这样的公司来说也是如此。
该报告首先概述了生态系统,讨论了融资活动,然后重点介绍了数据基础设施、分析和人工智能方面的关键技术趋势。 内容太多,我们无法逐行查看,但您可以在此处查看完整报告。 上面显示了风景的缩略图。 可以在此处找到更清晰的再现,如果您想要所有详细信息,FirstMark 团队整理了一个详细的电子表格,您可以在此处访问。
我们将坚持一些压倒一切的印象。
正如我们(和其他人)之前讨论过的,我们不再认为大数据有什么特别之处。 当您可以使用 PB 级数据启动 Snowflake 数据仓库并启用自动缩放时,突然之间,您就可以利用云来执行以前需要数据工程师设置 Hadoop 集群、运行 Zookeeper,然后手动编写 MapReduce(或更高版本)代码 星火)例程。 并且由于能够分析关系表之外的数据,例如 JSON、Parquet 文件和项目图视图,突然间,您的云数据仓库或 lakehouse 支持那些本应定义大数据的 3 V。 将其描述为“现代数据堆栈”,或将其称为作者命名为“大解锁”的现象。
我们一直在阅读 Snowflake 的数据,并听到有关 Databricks 何时最终 IPO 的传言,但 Amazon Redshift、Azure Synapse Analytics 和 Google BigQuery 仍然是各自云服务中增长最快的服务之一。
由于 AutoML,以及涵盖构建和运行这些模型的整个生命周期的工具和服务的出现,您可以对 AI 说同样的话。 不断有玩家在转变为通用平台。 ML 平台,从 SageMakers 和 Vertex AI 到世界上的 Dataikus 和 Data Robots,正在将自己扩展到完整的生命周期服务。 您也可以对数据生态系统的其他部分说同样的话。 Confluent 不仅要运行你的 Kafka 流,还要运行你的实时数据仓库。
尽管如此,作者引用了通常的离心力,并且越来越关注数据网格成为中心舞台(我们将在即将发表的文章中对此进行更多讨论)。 但向整合的转变几乎没有阻止风险投资活动。 根据 CB Insights 的数据,有 380 亿美元流入了 AI 初创公司,这与 2020 年全年的流入量差不多; 在最初的六个月里,有超过 50 轮超过 1 亿美元的融资。 融资界已经从风险投资公司扩展到对冲基金,而这个可爱的风险投资首字母缩写诗意地缩写为 SPAC。 其中许多融资不是由饥饿的初创公司发起的,而是由渴望进一步介入的金融家发起的。
作者总体上看好分析和人工智能的前景。 但该报告还提到了爆炸性增长,不是在收入方面,而是在反向 ETL、数据质量、数据目录、数据注释和 MLOps 等利基领域的初创公司数量,这些领域的投资似乎领先于市场的吸收准备。
所以,那里有很多疯狂的现金。 我们有几个反问。 像 Databricks 这样的公司真的需要银行存款 35 亿美元吗? 随着估值超过 10 亿美元的风险投资初创公司的激增,“独角兽”一词是否过时了? 金融家是否因为 FOMO 而涌入——害怕错失良机?
但我们的主要问题是我们是否正在进入另一个泡沫? 我们与主要作者 Matt Turck 就这个问题进行了离线电子邮件交流。 他的看法是“优质公司比以往任何时候都多”。 有重复的创始人拥有良好的业绩记录。 Dataiku 联合创始人 Florian Douetteau 就是一个很好的例子,他之前的行为是成功退出 Exalead 搜索引擎,大约十年前被 Dassault Systemes 收购。
该报告还提到了紧俏的就业市场。 在某种程度上,这已经是老新闻了——自从我们开始谈论“大数据”这个词以来,数据科学家和数据工程师就一直短缺。 就像.com 时代的 Java 开发人员短缺一样,这些问题在很大程度上是可以解决的; 见证大学数据科学项目的招生潮。 我们对人才的关注存在于食物链的其他部分——经验丰富的经理、高管、销售和营销。 我们一直听到许多供应商告诉我们填补这些空缺的挑战。 在大多数情况下,这与学校培养出具有合适学位的毕业生无关。 我们的感觉是,缺乏管理和进入市场的人才可能会阻碍增长。
图尔克还指出,其中许多初创公司的年度经常性收入稳步增长,而且与互联网时代不同的是,互联网时代是关于承诺的,而当前时代是关于部署的。 我们同意。 我们的看法是,云在这里产生了很大的不同。 在过去的时代,组织不得不花钱购买、部署和维护更多的服务器。 相反,云几乎允许即时横向扩展,而无需资本预算的繁文缛节。
在整体经济中,潜在的乌云即将出现,例如随着美联储最终开始加息,资金可能会变得更加昂贵,更不用说全球供应链中断所带来的结构性障碍。 我们确实认为,就目前而言,我们正处于创业融资的高峰期。 我们不会对未来 12 个月内出现的大量 IPO 或其他退出以及随后的风险投资和其他形式的融资放缓感到惊讶。 新企业可能会出现某种程度的市场震荡——我们在 2015/16 年的时间框架内看到了最初大量的大数据初创公司。 但话又说回来,我们也期待许多当前的数据和人工智能初创公司取得成功,因为经济动荡正是它们旨在应对的问题。