谷歌在 Cloud Next 上推出无服务器 Spark、AI 工作台和新数据产品

2023-05-30 0 930

谷歌在 Cloud Next 上推出无服务器 Spark、AI 工作台和新数据产品

虽然云非常适合数据和分析——鉴于其无限的存储和计算能力——但它也导致了数据专业人员生产力的真正倒退。 其原因,简单地说,是主要的云提供商在市场上投入了大量的数据平台,让客户选择正确的服务组合,然后将它们集成。 不管你对守旧的企业软件巨头有何看法,但他们确实为客户省去了云超大规模应用程序今天强加的许多“需要组装”的体验。

那么,Gerrit Kazmaier 直到最近才担任 SAP 专注于数据和分析的执行副总裁,现在是 Google Cloud 新任命的副总裁兼总经理,负责数据库、分析和 Looker,这也许是合适的。 如果有的话,SAP 是一家企业软件公司。 无论是因果现象在起作用,还是只是巧合,Kazmaier 向 ZDNet 简要介绍了今天在 Google 的 Cloud Next ’21 数字活动上宣布的一些新功能,这些功能正在将企业软件风格的“交钥匙”操作带到 谷歌云的数据平台。

在人工智能和分析的顶点
谷歌云的第一个重大披露是其 Vertex AI 服务中的一项新产品,称为 Vertex AI Workbench。 Workbench 本质上是一种托管笔记本体验,可作为机器学习和 AI 工作的 IDE(集成开发环境)。 它将 Vertex AI 的核心组件(如其训练和预测服务)与数据平台的关键组件(如 BigQuery、Dataproc 和 Dataplex)联系在一起。

这正是云分析环境中很大程度上缺失的一种集成,将它们放在一起可以帮助数据科学家、机器学习工程师和数据工程师避免不得不换档和失去思路,从一个服务跳到另一个服务。 在不同的浏览器选项卡中打开多个服务的 UI 并不是集成; 在另一个互补的服务范围内提供一系列服务。

全向,现在
谷歌云今天发布的另一项重要公告是 BigQuery Omni 的普遍可用性 (GA),它允许 BigQuery 用户获取他们在 Amazon Web Services (AWS) 或 Microsoft Azure 中的数据。 这是通过在这些竞争云中运行 BigQuery 实例、在那里执行查询并将结果编组回谷歌云基地来实现的。 我在 2020 年 7 月推出预览版时详细介绍了 Omni。

Kazmaier 告诉 ZDNet,包括 Electronic Arts 和 Johnson & Johnson 在内的客户一直在使用 BigQuery Omni 获得巨大优势。 很明显,从这个和其他公告来看,BigQuery 是谷歌“数据云”战略的核心。 提供 BigQuery 访问存储在其他云中的数据是谷歌的必备条件,而 Omni 的 GA 是一个重要的里程碑。

上升到 Spark,下降到服务器
下一个公告是对其他公告的高度补充:Apache Spark 的自动缩放、无服务器实现,称为 Google Cloud 上的 Spark,可作为预览服务使用。 Spark 已成为整个行业中用于各种分析、数据工程和机器学习工作负载的无处不在的商品环境。 是的,云提供商已经为自己构建了无服务器的 Spark 服务; 例如,Azure 数据工厂上的数据流在 Spark 集群上执行,客户永远不必自行配置,而 Amazon Glue 生成的代码同样如此。 但是使用 Spark 在大多数数据和 AI 管道中执行特定步骤需要明确配置 Spark 集群,并处理集群启动所需的延迟。

借助 Google Cloud 上的无服务器 Spark,就像 BigQuery 本身一样,客户只需提交他们的工作负载以供执行,而 Google Cloud 会负责其余的工作,执行作业,而不会打扰客户需要调整大小,甚至不需要考虑离散的 星火集群。 该服务将集成到——你猜对了——BigQuery、Dataproc、Dataplex 和 Vertex AI,允许这些服务的用户利用 Spark,而无需承担基础设施配置和管理的负担。

云 (Spanner) 和 (Google) 地球
接下来:谷歌在其地理分布式关系数据库服务 Cloud Spanner 上实现了一个 PostgreSQL 接口。 虽然不是 Postgres 本身的实现(Cloud SQL 上可用的东西),但此产品允许使用 Postgres 的 SQL 方言和有线协议的代码在 Spanner 上运行。 将此产品与 AWS 的 Aurora 数据库服务或 Azure Database for PostgreSQL Hyperscale 上的 Postgres 接口进行比较。 在这两种情况下,与 Spanner Postgres 界面一样,具有 Postgres 技能集的人可以使用云托管、水平扩展的数据库。 Spanner Postgres 产品以预览版提供。

还有更多的集成:50 多 PB 的 Google 地球数据可供 BigQuery、Google Cloud 的 ML 技术和 Google 地图的用户使用。 这项名为 Google Earth Engine 的服务正在以预览版形式推出。

旁观者在这里
万一您忘记了,Google Cloud 现在拥有 Looker。 哎呀,Looker 的名字甚至出现在 Kazmaier 的头衔中。 是的,虽然 Looker 本身就是一个 BI 前端,但 Google 似乎在 LookML 建模语言中看到了同样多的价值,Looker 可以使用它定义语义模型,使 BI 用户更容易分析数据。 为此,Google 的 Connected Sheets 技术允许 Google Sheets 的用户在 BigQuery 中查询数据,该技术将与 LookML 兼容,Google Cloud 表示将在今年年底发布预览版。

不过,除了 Connected Sheets 之外,Google 还宣布与 Salesforce 的 Tableau 建立合作伙伴关系,后者将很快通过 LookML 为这个非常受欢迎的商业智能平台提供访问 Looker 语义模型的权限。 虽然 Databricks、Informatica、Trifacta、Fivetran 和 Collibra 等其他行业参与者也将成为 Cloud Next 的焦点合作伙伴,但与 Tableau 的这种合作伙伴关系是前所未有的,而且非常有趣。 它表明,谷歌云知道,如果不寻求来自整个分析领域的合作伙伴的帮助,它就不可能成为一个占主导地位的数据云提供商。 它还再次表明,谷歌对 Looker 的收购与其前端数据可视化和仪表板功能一样重要。

把东西挂在一起?
哀叹目前存在的云服务相对缺乏集成并不仅仅是抱怨。 对于客户来说,通过所有的复杂性进行集成和破解是一项大量的工作,随之而来的是大量的风险和费用。 微软一直在解决与 Azure Synapse Analytics 的集成真空,有人可能会争辩说,AWS 已经尝试通过其 Lake Formation 产品来做到这一点。

随着谷歌云今天的发布,三大云提供商都认识到了集成其服务的重要性。 这很好,但在他们的数据和分析产品易于使用、完全合理化和无缝集成之前,这三者还有很长的路要走。 不过,最终,超大规模企业将能够合法地说云是新的企业堆栈。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 谷歌在 Cloud Next 上推出无服务器 Spark、AI 工作台和新数据产品 https://www.7claw.com/57130.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务