谷歌为什么输给了OpenAI？科技公司创始人兼谷歌前员工带你一探究竟-51CTO.COM

在当今的人工智能浪潮中，OpenAI这样的新兴公司引领了革命。

——而GPT的一些关键部分：Transformer、强化学习（AlphaGo ）和多模态（Flamingo）却都是由Google发明的。

那么为什么，作为科技领域巨无霸的Google，却在如今的群星闪耀中稍显黯淡？

最近，Jim Fan转发了Socratic公司创始人Shryans Bhansali的一篇博客，我们也许可以从Shryans的文字中一窥缘由。

Socratic创建于2013年，主要产品是一款「拍照搜题」的应用，公司在2018年被谷歌收购。

在那个互联网产业空前繁盛的年代，数不清的创业者心怀梦想、雄心勃勃，投身于浪潮之中。Shryans是其中之一，同时也是成功者之一。

而今天，我们谈论更多的，可能是经济形势、市场预期和求职情况。

同样的，当Socratic被谷歌收购，Shryans成为公司员工之后，他又是怎样看待自己的工作，并推进自己的梦想呢？

创业者的独白

2017年，当我们开始为Socratic筹集B轮融资时，我们很快意识到，以牺牲收入为代价来获取使用率的做法会让我们吃亏。

每家风险投资公司都要求我们提供货币化计划，于是我们得出结论，一个专注于没有信用卡的高中生的教育应用不会成为一个大企业。

公司的联合创始人Chris Pedregal曾在谷歌工作过，他重新联系了他过去的经理，我们对一个以学习为中心、由人工智能驱动的家庭教师的愿景是完全重合的。

也许是因为我们刚刚赢得了谷歌2017年度「最佳应用」，那次会面后不久，我们就启动了一个流程，最终，谷歌在2018年3月收购了Socratic。

我们与现有的一个同样规模的团队合并，该团队由多名长期在谷歌工作的人员组成。Chris和我成为产品和工程负责人，负责打造人工智能驱动的辅导员，并将这些功能引入谷歌最大的产品中。

在接下来的三年中，我们重建了Socratic，将其重新命名为「Socratic by Google」，并且在搜索和Lens中提供了Socratic功能，还发布了数学求解器和逐步数学辅导原型等功能。

在谷歌工作

一路走来，我学到了一些东西：

在谷歌工作就像拥有了第二本护照。到世界上任何一个大城市，你的胸卡都能打开一个漂亮的办公室，里面有美味的食物、办公桌，还能高速连接谷歌20多万人网络中的每一个人。

包括访问他们的巨型monorepo，其中包含数十亿行代码，几乎涵盖了他们所有的产品。遍布全球的数据中心的实时状态。跨越二十年历史的战略文件。

谷歌以谷歌的方式做事。谷歌使用的几乎所有软件和基础设施都是在谷歌建立的，这是比大多数公司更早面对最棘手的工程问题的自然结果。

在谷歌这样的规模中，外部世界已不复存在，只有在极少数情况下，才会被小心翼翼地允许进入他们的围墙。

这意味着我们不可能保留现有的代码库。我们需要从头开始，与新团队一起重新开发我们的产品，然后在谷歌的堆栈上重建我们的应用程序。

我们的应用程序吉祥物「Ceebo」打破了谷歌的固有模式。看看谷歌的应用程序图标集，你会发现只有四种颜色和简单的形状。这对他们来说是可行的，但对我们来说却是无趣的。

他们反对（「我们不会拟人化」），我们也反对（「你们安卓系统就会拟人化！」），直到最后我们终于如愿以偿，因为我们太小了，根本不重要。

Ceebo作为我们的应用程序图标继续存在，并在谷歌内部绽放光彩，谷歌已经为其设计了数十种变体，Ceebo也出现在谷歌的文档和网站中。

简单的事情重复做就会感觉很神奇。与搜索领域的资深人士一起重新构建我们的查询分类系统，让我们对搜索本身的构建过程有了更深入的了解。

一方面，信息检索工具的深度令人难以置信，而计算并为互联网上的每个页面添加新信号的能力也令人匪夷所思。

另一方面，我们发现大多数搜索改进都是由工程师通过「并排」比较新旧结果......在电子表格上进行人工审核的！

人们可能会认为谷歌的工程设计主要是实现博士级的算法，虽然有时确实如此，但搜索或人工智能工程师的大部分工作都涉及查看示例、发现模式、手工标注数据以及在杂乱的数据中进行分析。这似乎是最优秀的人工智能团队的普遍真实写照。

我注意到的一个模式是，优秀的人工智能研究人员愿意手动检查大量数据。不仅如此，他们还建立基础设施，使他们能够快速手动检查数据。手动检查数据虽然并不光彩，但却能为问题提供有价值的直觉。

大多数1000万至5000万用户的问题都不值得Google花时间，也不符合他们的战略。但对于那些符合其本质、战略和某人推广目标的问题，他们会花大力气去解决。

其中一个例子是：计算机视觉是Socratic界面的重要组成部分，特别是能够读取图像中的文字和数学。

作为一家初创公司，我们使用了第三方工具，但在谷歌内部使用该工具太困难了，因为会暴露敏感数据、对规模的期望以及复杂的供应商审查流程。

有时，收购一家公司将技术引进公司内部会更容易。还有一些时候，就像我们的情况一样，雇佣了一个顶尖的博士人才来研究这个问题，并在6个月内提供了一个世界级的数学识别API。

谷歌是一个目标和努力不断变化的网络。在谷歌，只要有合适的人关注，就有可能实现令人惊叹的成就。

一个能理解的副总裁，一个有相关章程的研究团队，或者一个与组织目标相匹配的人。处理好这些混乱的利益关系是项目经理的一半工作。然后，你还需要得到隐私、信任、安全和基础设施等审批者的支持。要知道一个想法是否可行，需要数十次对话，而要实现它，则需要数百次对话，但这个过程是快乐的。

团队目标在任何一个季度都可能发生变化，整个团队也可能在重组中消失，这种现象如此普遍，以至于谷歌人可以透过悲剧看到喜剧。

假设你解决了所有这些问题，一觉醒来，你可能还是会发现，当你在为自己的项目工作时，两个遥远的团队也在为同样的想法工作，现在到了一决雌雄的时候了，因为只有一个团队可以继续工作。

Googler们想做伟大的工作，但往往做不到。毫无疑问，有些人是为了吃饱饭，每天工作3小时，然后享受提前退休的待遇，但我遇到的所有人都是认真、勤奋、想做伟大工作的人。

打败他们的是审查的重重关卡、频繁的重新修订、过去失败留下的制度疤痕，以及在世界舞台上做简单事情的复杂性。初创公司可以忽略很多问题，而谷歌人却很少能做到。

人本身也是一个问题——所有聪明的人都能反驳任何事情，却不能支持某件事情；所有领导者都没有勇气说出令人不舒服的真相；所有被雇用的人都没有明确的工作项目，但仍然必须通过有晋升价值的虚构工作来留住他们。

头重脚轻的组织很难引导：一个由多名成功的联合创始人和在谷歌工作了10-20年的资深员工组成的团队，听起来可能是成就大事的秘诀，但也是陷入僵局的秘诀。

如果有多个领域需要探索，有明确的目标，并且有很强的自主性去追求这些道路，那么这种结构可能会奏效。

但如果你想开发一个统一的产品，就需要有一个明确的领导者，明确的方向，以及更多的实践者而不是思考者。与直觉相反的是，为早期项目增加人手并不会让项目进展得更快。

另外，技术债务是真实存在的。优秀的团队会定期在平静的日子里清理工作，从而偿还债务。

流程债务也是如此：因为发布出错而增加的审查、为防范可能的诉讼而新增的法律检查、在文档模板中添加一个部分。多年来，层层累积，直到一项新功能准备就绪数月后仍无法发布，因为它被卡在审核之间，出路不明。

谷歌最近改变了他们繁琐的绩效考核流程，从一年两次改为一次，问卷从长变短，希望能从占经理一年30%以上的时间减少到10%以下。

有时，外部威胁会迫使公司做出改变，或者促使公司走向衰落。谷歌发明了ChatGPT背后的技术，却并不是发布该产品的公司。现在，谷歌希望重新夺回在人工智能领域的领先地位，同时还需要防范一切可能的麻烦。

谷歌的「游戏」

在谷歌，只要你玩对了游戏，就有可能实现令人惊叹的成就。

谷歌曾经有一套内部价值观，他们称之为「三个尊重」：尊重用户、尊重彼此、尊重机会。前两个很容易理解，但第三个却让大多数人感到困惑。

我的解释是：你在谷歌，这是一家利润丰厚、充满天才的企业。你收入丰厚，衣食无忧，生活在永恒春天的天堂硅谷。在这种疯狂的运气下，你能做的最好的事情是什么？

——你必须找到自己领域中最重要的问题，并不惜一切代价去解决它。

实际上，这意味着首先要完成交给你的工作。一旦这些工作都在掌控之中，你就必须深入到庞大的谷歌网络中，了解正在计划和发明的东西，凝聚一个清晰的未来形象，通过文档和演示使其成型，找到目标与这个形象一致的领导者，并尽可能坚持不懈地推销你的想法。

曾经，我们三个人花了几个月的时间，在新的数学求解器基础上制作了一个循序渐进的数学辅导演示。这个演示为我们的智能辅导愿景提供了一个具体的形式——它有一个链接，可以使用，可以分享。它使对话接地气，让人们做出一些具体的反应，并在我们团队之外传递，独立讨论，然后引导我们。

许多收购都以失败告终。Socratic的故事喜忧参半。一方面，我们成功地融合了两种截然不同的文化，我们的产品得以延续，并发展到每年为约50亿次查询提供服务，Socratic团队的事业也得到了蓬勃发展。

另一方面，Chris和我都离开了谷歌，创办了创业公司，而无论是Socratic团队还是整个谷歌，都还没有开发出与谷歌能力相匹配的人工智能辅导工具。不过，几个Socratic团队的谷歌员工可能会让它成为现实。