Opendoor 是一家拥有 7 年历史的初创公司,去年 12 月通过与一家特殊目的收购公司 (SPAC) 的合并而上市,它相信自己拥有人工智能能力来优化目前非常繁琐的房屋销售任务。
在回答了应用程序中的几个问题后,公司会给你现金,这样你就可以开始卸货,而无需与经纪人和买家打交道数周或数月的单调乏味。 这一切都是为了增加房屋的流动性,并使住宅房地产市场上线。 据该公司称,就在线销售而言,该市场仅“渗透”了 1%。
据该公司称,实现所有这些都涉及健康剂量的人工智能机器学习形式。
但究竟是哪种 ML? 细节有些模糊。 在公司的 IPO 招股说明书中,Opendoor 描述了在一个独特的房屋销售数据集上使用 ML 来推导出定价预测,这将有助于它决定向房主支付的价格:
我们进行了超过 150,000 次家庭评估,在此期间我们收集了每个家庭及其周围环境的 100 多个数据点。 利用这一独特的离线数据基础,我们的算法使用机器学习通过需求预测、异常值检测、风险定价和库存管理来推动定价决策。
为了试图揭开这些算法的本质——可以说是秘密武器——ZDNet 通过 Zoom 采访了该公司的数据科学负责人 Kushal Chakrabarti。 Chakrabarti 仅在一年前以顾问身份任职后才加入 Opendoor。
Chakrabarti 走上了机器学习的道路。 十年前,作为加州大学伯克利分校的一名研究科学家,Chakrabarti 致力于人类基因组计划,这是我们这个时代典型的大数据应用。 “在它有名字之前,我就一直在研究数据科学,”他说。
在伯克利之后,Chakrabarti 担任过许多职位,既有在亚马逊等知名公司担任工程主管,也有他帮助创建的初创公司,如小额贷款公司 Vittana。
在其中的许多情况下,他都在使用机器学习技术,例如 2005 年在亚马逊的推荐系统。
尽管如此,“我对早期出现的许多深度学习工作持怀疑态度,”Chakrabarti 回忆道。 最终,他回过神来。 “在这一点上毫无疑问,它在很多事情上显然做得更好,”他说。
深度学习是一个“非常非常好的工具,可以用来理解大量不同的信息是如何相互作用的,并且比人类以往任何时候都更擅长梳理这些相互作用。”
Opendoor 问题的规模,即调整整个房地产市场的规模,是吸引 Chakrabarti 的重要因素之一
Chakrabarti 观察到:“那里没有那么多价值万亿美元的问题。” “这是我遇到过的最具挑战性的问题之一。”
Chakrabarti 说,深度学习是“我们正在使用的一种工具”来探索这个价值数万亿美元的问题的深度。
解决房屋销售问题的难点在于问题的本质。 它由许多变量组成,这些变量的相互依赖性必须从数据中推断出来。
“我们必须考虑数以千万计的家庭,”Chakrabarti 解释说。 他说,常见的误解是,在房地产中,一切都是“位置、位置、位置”。 事实上,在任何时刻都不仅仅是一个点,而是有多个点。
Chakrabarti 解释说:“有位置,但还有三间、四间和五间卧室,还有风景是否有朝北等等。”
“如果每个家都是独一无二的,那你怎么说呢?” 成为问题。
“所有这些都是说,这些相互作用真的、真的、复杂,”他说。 “这些家庭中的任何一个之间都有成百上千和数百万次互动,以及哪些信息是相关的或不相关的。”
他说:“我们基本上所做的是使用深度学习来更好地了解一所房屋与另一所房屋之间的联系可能是什么可能是最好的价格。”
据推测,秘诀就是如何将多变量、组合问题转化为一种能够自信地得出价格的算法。
至于该算法是什么,“由于您可以想象我们的知识产权,我很难深入了解全部细节,”Chakrabarti 说。
换句话说,秘方在很大程度上仍然是一个秘密。 为了梳理出一些细节,ZDNet 询问了 Opendoor 使用的深度学习的“目标函数”是什么。 有时称为目标函数或损失函数,指的是任何深度学习算法寻求优化的分数。
按理说,发现合适的价格是目标函数的一部分。 但也可以想象目标函数是一些非直观的东西,一些不太明显的东西,正确的价格可能是副产品。
那么,这个目标函数到底是什么?
“这是一个很好的问题,”Chakrabarti 说。 他说:“我怀疑我无法深入了解,”并再次解释说,此类细节是公司受保护的知识产权的一部分。
Chakrabarti 能够描述的是整个努力的广义目标。 总体目标是让房主“获得他们信任的价格”,意思是,可以感到舒适是可以获得的最佳交易,“对他们来说有意义”的价格。
考虑到微薄的利润率,人们会想象优化差价可能是目标函数的一部分,这意味着 Opendoor 购房成本(包括利息和持有期成本)与公司可以扭亏为盈的价格之间的差异 并出售。
Opendoor 在最近一个季度的毛利润仅占收入的 13.4%,扣除持有和销售成本的“贡献利润”仅为 10.8%。 因此,一个或两个百分比的差价可能会在 Opendoor 的利润图上产生很大的差异。
Chakrabarti 在谈到目标函数时说:“这绝对不是关于最大化传播。” 但这确实涉及了解如何优化价差,他说,这可能包括减少价差。
“这正是许多技术投资的目的,为了更好地理解,为了减少我们收取的费用——正如我们一直以来所做的那样——为房屋销售商提供更值得信赖的价格,”是如何 Chakrabarti 描述了它。
“我认为我的团队中的很多人以及公司所关注的是我们如何将这种情况最小化,以便随着时间的推移我们能够接触到最多的人,”当然,同时平衡公司的利益 股东谋利。
Chakrabarti 在帮助 Opendoor 时面临的最具挑战性的问题之一是知道如何衡量成功。 一方面,进步是成功的标志。 Chakrabarti 指出,该公司在过去五个月中在 18 个新的住宅市场开展业务,因此它现在在总共 44 个市场开展业务,该公司告诉 ZDNet。
Opendoor 在最近一个季度售出了近 4000 套房屋,比去年同期增长 19%,而它获得的平均价格上涨了 35%。
“证据就在布丁中,”Chakrabarti 谈到公司的进展时说。 “我们的表现优于市场。”
然而,这并不是全部答案。 当 Opendoor 在新市场开展业务时,它可能必须花费一年的时间来完善其定价模型。 成功在一开始并不确定,必须随着时间的推移得到证明。
此外,获得正确的深度学习的最终回报不会出现在一个季度的财务业绩中。 相反,它将以 Opendoor 的总财务回报和股东回报来衡量多年。
因此,回报实际上就是机器学习中所谓的稀疏奖励,它会及时发送信号,提供关于现在要采取什么行动的非常有限的信息。
人们如何知道将指导 Opendoor 今天采取行动的未来信号是什么?
“这是一个很好的问题,但我无法回答,”Chakrabarti 说。 “这是我们考虑的价值数万亿美元的问题之一,”他说,并补充说,“这正是我每天都在思考的问题。”
“这些信号是积极工作和积极研究的关键领域,”Chakrabarti 补充道。 “深度学习和机器学习中稀疏信号的挑战是一项迷人的挑战。”
稀疏性的挑战告诉 Chakrabarti 他正在做一些重要的事情。 “著名数学家保罗·埃尔多斯 (Paul Erdős) 有一句名言,”Chakrabarti 回忆说,“值得解决的问题通过反击来证明它们的价值。”
“这是一个拥有如此丰富景观的问题,这是一个你必须不断思考的问题,否则它就是行不通的,”他说。 对于那些喜欢沉迷于这些值得反击的问题的人来说,“这将是开始解决其中一些问题的一个了不起的地方,”他说,意思是在 Opendoor。
稀疏性和深度学习的其他方面让 Chakrabarti 不仅仅是一个皈依者。 他相信他不仅在解决一个特定的问题,而且他正处于更重要的事情的门槛上。
他说,有一个潜在的结构被揭示出来,一组模式对 Chakrabarti 来说证明了“世界有更深层次的机制,世界有一种运作方式。”
“这一切都是为了揭示这种机制,”他说。
他建议说,这种机制对公司有利。 Opendoor 的技术,如果在一个市场的房屋上进行训练,可以很好地扩展到另一个市场的房屋——算法“概括”,使用机器学习中的技术术语。 Chakrabarti 说,这是因为“与另一个市场相比,关于一个市场正在发生的事情的共享信息更多。”
Chakrabarti 解释说,“这是深度学习中的一个基本问题 […] 结果表明,人类行为方式、价格行为方式等的基础知识太多了,共享的基础知识是一种非常强大的东西, 如果你随后只调整一些特定数据,你的算法性能就会得到巨大的加速。”
Chakrabarti 说:“对我来说,数据科学、运筹学、机器学习——所有这些东西,实际上都是关于重建这种机制的艺术和科学,考虑到数据和机制引发的故事。” “能够瞥见底层事物的真实面目是一件非常美妙的事情。”
那一瞥是什么?
“我在某个时候想,好吧,这是我最接近上帝的想法,”Chakrabarti 说。 “对我来说,这实际上是一种精神上的东西。”