流动的硅谷:AI 大潮、大厂探秘及华人国际化

'硅谷流动:AI、大厂探秘及华人国际化'

硅谷AI浪潮:疫情过后的人力短缺和远程工作

我在硅谷逗留了六周的时间,从盛夏到立秋,加州的阳光永远灿烂。在这个科技的前沿,AI的浪潮正如涌动的浪花。为了更深入地了解AI的发展和方向,我见了不少人,参加了许多线上线下的活动,亲身感受到了大潮初起时的澎湃。接下来,我将选取一些重要的信息与大家分享。

疫情已经是过去时,但对我这个初来乍到的人来说,看到三年来留下的痕迹格外清晰。其中,我对人力短缺和远程工作的影响印象深刻。

在硅谷,人力短缺是显而易见的,加之近来的通货膨胀,人工费用非常昂贵。有一次我通过Uber Eats叫了一份Subway的外卖,三明治本身只有8美元,但外卖费用加起来一共17美元,涨了一倍还多!之前我在西雅图生活多年,一直知道美国人工不如中国便宜,但看到这个差距仍然让我吃惊。我了解后得知,疫情期间,担心传染等原因,很多人离职或提前退休。再加上政府发放钱财的影响,工作人数也减少了很多。我曾和一位从事AI教育的创业者聊天,他说教师短缺非常严重。这是整个美国面临的问题,我们不知道该如何解决。

而疫情期间远程工作的影响更大,尤其是对刚毕业的大学生们来说。我有两个朋友创业,他们都跟我提到了这个问题。疫情要求大家隔离,大学生在校期间几乎没有机会去公司实习。毕业后的工作也都变成了远程工作,没有与同事相处的经验。这导致他们不知道如何进行团队合作,远程指导也存在困难。他们曾经招聘过一些来自好学校的毕业生,包括斯坦福的学生,他们的潜力都非常好,但由于缺乏合作能力,最终不得不离开,这真是非常可惜的事情。

目前,大型企业已开始要求员工返回办公室上班,但恢复到疫情前的状态还需要一段时间。多年前,我在Expedia招聘的毕业生现在已经成为一家AI公司的创始人。他觉得远程工作很影响效率。疫情期间,他不敢要求员工来公司上班,担心会导致员工离职。目前,他正在观察大公司的步调,一旦大公司明确要求返工,他也会跟上。在我观察的大公司和创业公司中,实际上来办公室上班的人还是相对有限的。我和朋友们讨论过,大家对这个问题的态度也不完全一致。总体而言,管理较大团队的人越多,对远程工作的方式就越不满意。大家觉得慢慢会恢复到从前的状态,但不太可能一蹴而就。

有一个有趣的观察是,Google、Meta等大公司在LianGuailo Alto和Mountain View等地设立总部,导致附近房价很高,而远一点的地方房价则便宜得多。由于远程工作不需要去公司,这两年远离公司总部的地方房价也出现了大幅上涨。

AI大潮:格局初定,仍然处于非常早期

我的关注重点是AI。在硅谷关于AI的观察和判断中,我总结了一些观点。

关于大模型和GPU方面,行业的格局已经初定。与中国的百模千模大战不同,硅谷的几个大模型已经胜出,其中闭源的主要有OpenAI和Google,而开源的主要是Meta Llama-2等。由于通用大模型需要投入大量的人力、算力和资金,格局看上去基本确定,没有新的参与者进入。

GPU仍然供不应求,无论是大公司还是创业公司,大家都在寻找GPU资源。我的一位朋友在NVIDIA工作,他给我介绍了GPU的生产过程,从矿石的准备开始。虽然硬件不是我的关注重点,但听上去,由于生产周期很长,短期内GPU供应仍然紧张,不过长期来看应该会稳定。

说到AI领域的现状,一位投资人朋友用生动的比喻形容。他说现在就像天还没亮,每个人都拿着手电在四处寻找方向,远没有移动互联网兴起时那种热闹场景。我和许多朋友聊过,包括从事大模型开发的人、使用大模型的中小公司,以及围绕大模型提供产品服务的基础设施/工具创业公司。总体判断是大模型的应用仍处于非常早期的阶段。

有一个很有代表性的例子。我有一个朋友,之前是一家非常有名的上市公司的工程副总裁;近几年开始创业,做与电子商务平台相关的业务,拥有100多名员工,并得到了几家知名基金的投资支持。她的业务需要大模型的支持,最近她在探索如何使用大模型。她进行了两个尝试:一个是在MosaicML模型上,对私人数据进行拟合训练(fine tune);另一个是使用GPT-4,将私人数据放入向量数据库,通过搜索检索将相应信息放入提示窗口。两者对比后,令她感到意外的是GPT-4的效果竟然比fine tune的结果要好。她对此感到困惑,不知道如何才能有效地进行fine tune。她对数据的要求、使用多少数据以及如何进行fine tune,这些问题都不太清楚。此外,大模型就像一个黑盒子,她觉得那些懂得如何构建大模型的人也未必对此了解透彻。此外,她还提到MosaicML的使用体验不佳,但目前没有其他选择。虽然GPT-4效果不错,但她的私人数据无法公开,只能用于测试,而无法成为正式产品。她认为现有团队在这方面的技术能力有限,计划招聘AI工程师来解决这个问题。

我听了感到有些惊讶。因为她在业界经验丰富,整个创业团队的背景也很出色,技术实力也不错。如果连她都不清楚如何有效地进行fine tune,那其他公司可想而知。她的例子并不是个别案例,我听到了很多类似的例子。我还有一个朋友的创业公司专门提供AI工具,为大企业客户提供服务。他告诉我,大模型对大企业来说是一项全新的技术,他的客户们才刚刚开始考虑应用大模型,他们特别关注模型的准确性、速度、所需数据的质量和隐私问题。客户们还在探索AI能够解决哪些具体的业务问题。他估计至少需要6-12个月的时间,大企业才有可能在内部开始使用大模型。

可见,这一轮AI仍然处于非常早期的阶段,C端市场还没有出现真正的杀手级应用(除了ChatGPT),B端市场的落地也需要时间,AI基础设施和工具领域仍然有很大的发展空间。比如,Databricks花费13亿美元收购MosaicML,就是希望能够尽快建立起AI能力来服务客户。

至此,我观察到两个积极的信息:

首先,正是因为还处于早期阶段,工具尚不完善,大企业没有现成的技术可以使用,这为创业公司提供了机会。如果大公司迅速开始使用AI,他们拥有自己的数据和场景,创业公司的机会就会减少很多。这正是我在与硅谷专家Howie讨论时,他提出的观点,我非常赞同。

其次,大企业迫切希望利用AI,至少有一些危机感。据我了解,为了应对这一轮AI浪潮,许多公司内部已经设立了专门的预算。预算已经准备好了,即使发展进展较慢,AI的前景仍然光明,也不太容易被轻易抛弃。

为何近两个月AI发展节奏明显放缓?

不知道大家是否有相同的感觉,我觉得近两三个月以来,AI领域的发展节奏明显放缓了。为何会这样呢?通过观察,我总结了以下几点:

首先,这与OpenAI的策略有关。这一波的节奏主要由OpenAI引领,之前它一直在酝酿大动作,将过去两三年积累的成果(如GPT-3)集中在去年底的两三个月时间内发布,让人们感到目不暇接。经过这么一个追赶阶段,Google成为了强大的对手,现在的OpenAI也不敢随意推出没有准备好的产品,否则得不偿失。所以,最近没有特别大的变化,感觉上可能比之前慢了。实际上,我认为这才是技术发展的正常节奏,本来就没有那么快。

其次,创业者正在忙于构建产品。我在硅谷的AI社区做了一个讲座,谈到了这个问题。社区的反馈是,年初时创业者们都在忙着参加各种会议、讲座和聚会,试图弄清楚GenAI到底是什么。最近,大家对大模型技术已经基本了解,开始忙于花时间构建自己的产品。从外部来看,好像没有之前那么热闹了。

在研究领域,论文还在不断发表,速度并没有放慢。

另外,整体一级市场的投资节奏似乎有所减缓。这主要与大环境有关。人们对未来经济走势感到不明朗,而俄乌战争增加了不确定性,影响了人们的投资信心。此外,疫情期间政府大规模刺激导致许多创业项目估值飙升,现在正在经历估值回调的过程。在这样的背景下,AI领域的一级市场相对来说算是好的。然而,由于仍处于早期阶段,我观察到除了那些拥有竞争力的大模型项目(包括character.ai,实际上也在开发大模型)获得了大量投资外,其他的AI创业项目目前融资并不容易,许多投资人都在观望。

探秘大厂:OpenAI、Google和NVIDIA

在这波AI的大潮中,OpenAI & Microsoft、Google和NVIDIA成为时代的引领者。其中,三家总部位于硅谷的企业引起了我的特别关注,我特地去了解了一下它们的情况。

首先是OpenAI。OpenAI非常注重信息的保护,员工们对此也非常敏感。我了解到的信息有限,但其中几点给我留下了深刻的印象。

首先,与OpenAI合作过的人都提到,他们的员工非常能干,非常高效。他们在系统性能和监控方面做得尤为出色,工程能力非常强。可能正是由于技术基础设施的工程能力,如如何更高效地利用硬件、提升性能等方面,成为OpenAI的核心竞争力之一。

其次,OpenAI非常坚持AGI的发展。只有工作能帮助到AGI的发展,他们才会予以重视。如果某项工作能够更好地训练模型、帮助模型学习,他们就会全力以赴;否则,他们不会浪费时间。举个例子,他们之前做过机器人项目,但后来发现受到实际物理世界的限制较大,对AGI的帮助有限,因此他们就停止了这个项目。根据这个判断,他们很可能不会去涉足垂直领域。

除了AGI,ChatGPT和API也是OpenAI的重点关注的领域。

接下来是Google。之前在AI方面,Google的推进速度相对较慢,这一方面是因为与广告业务的冲突,另一方面则与两起事件有关。一是因为一位研究员认为大模型具有意识而被解雇。再之前,一位黑人女性员工因为某论文被拒而告上了Google。这些事件让Google对AI变得非常谨慎,减缓了AI的进程。

Google一直认为自己处于领先地位,直到ChatGPT出现,给Google带来了很大的压力。从去年12月开始,Google内部启动了code red(最高优先级),这在公司内部是比较罕见的。目前,公司上下都非常重视GPT,设立了专门的团队(DeepMind和Google Brain合并),同时鼓励其他团队尽快开始应用AI。我有很多在Google工作的朋友,他们对Google充满信心,认为Google在这方面至少不会落后。

最后是NVIDIA。这一轮LLM浪潮中,NVIDIA是最大的赢家。我之前对这家公司关注不多,因为我的经历和兴趣都集中在软件方面。这次我了解到了很多有趣的事情,下面分享一下。

NVIDIA的风格可以概括为一个人的创业公司。在NVIDIA工作的朋友们都非常佩服创始人黄仁勋(Jason),他在公司内的地位就像超级英雄一样。黄仁勋一直相信计算,不管股价如何波动,从2012年开始一直坚持下去,从未动摇过。黄仁勋对技术有着深刻的理解,对项目的实际情况了如指掌,同时又平易近人。如果有什么事情需要决策,大家都会去向黄仁勋请教,因为他能够快速而准确地做出决策。

黄仁勋非常同情他人。比如,疫情刚开始时,原定9月份才进行员工评估的公司决定提前进行。结果,全公司在3月份完成了评估,给了提薪和奖金,让大家提前拿到了钱。同时,黄仁勋对于公司的发展也有着敏锐的洞察力和危机感,深受员工欢迎。即使在之前股价低迷的时候,员工对他的评价也很高。

NVIDIA强调技术,组织扁平。作为一家拥有近3万员工的公司,NVIDIA至今没有设立人力资源管理职位。公司非常强调技术能力,无论级别高低,管理者都拥有非常强的技术能力。

此外,NVIDIA构建了一个强大的生态系统。我之前听说过NVIDIA的生态,这次我特别去了解一下。我的一位朋友给了我几个关于NVIDIA生态的特点:

首先,他们提供了完备的工具。硬件方面,芯片从底层到顶层构成一个深度堆栈,需要有各种支持的工具,包括编译器、调试器、性能分析器等等。研发人员的需求各不相同,比如有人希望进行深度优化,这仅仅将功能封装成API远远不够。

其次,NVIDIA注重系统的速度和易用性。

最后,NVIDIA公司内部和外部的沟通非常良好。比如,公司有专门的团队负责与客户沟通,这些团队既了解客户需求,又能及时与内部研发团队沟通。软件团队与硬件部门密切合作,而不是等硬件完成后再开发软件,这种密切的协作方式显而易见。

华人企业的国际化进程

中美关系的变化对硅谷有着深远的影响。在这次访问中,我注意到两个明显的变化。创业者在市场选择上更专注,要么专注于美国市场,要么专注于中国市场,很少有人兼顾两者。国内一些优秀的创业者和基金也在硅谷寻找新的机会。

华人企业如何做好国际化是大家共同关心的问题。我参加了一个闭门沙龙,讨论的主题正是这个。我觉得与会嘉宾都很有代表性,其中包括全球市场上市公司的华人CEO、专注于投资中国企业走出国门的基金合伙人,以及管理着中国和美国两边团队的创业者,而我本人也是其中的一员。大家分享了许多洞察。中国在研发成本、供应链的完备性、互联网产品的运营和勤奋程度等方面具有优势,但出海市场面临着完全不同的挑战,涉及市场销售、产品、团队文化和管理等诸多方面。与会嘉宾达成的共识是,如果要开展国际化业务,创始人的思维必须首先国际化。

对我来说,这讨论之外有更多的感慨。国际化这个话题我并不陌生,多年前我们讨论的是美国企业如何进入中国市场,而今天我们谈论的是中国企业如何走向国际市场。世界的重心正在发生变化,经过这些年的努力,中国变得更加强大,真是令人自豪。

流动的硅谷

我一直非常羡慕硅谷的人才资源和自由交流的文化氛围。这里人才聚集,我经常与一些人聊天时,发现原来他们都是清华校友。当时我大学本科班级只有30人,然而在硅谷我已经遇到了六位同班同学、同校校友。上周末参加了一个朋友组织的烧烤聚会,聊天的时候才发现,其中好几个都是非常成功的人士。

由于是在硅谷,创业风气一直很高涨。随之而来的是各种讲座、论坛等活动。我刚来的时候,朋友给我提供了一个Google doc,上面密密麻麻列出了旧金山地区的AI线下活动,几乎每天都有。由于我来去不便,只选择性地参加了几次活动。之后我自己搜索,发现无论是关于我感兴趣的话题还是从业方向,几乎都能找到各种线上Webinar和社群讨论。后来我熟悉了一些人,发现湾区这边也有很多活动。无论是线上还是线下,这些活动的质量普遍非常高,有大公司或头部创业公司的核心成员参与,也有年轻的创业者参与。分享的信息密度大、更新快,讲者们独立思考,态度真诚,并且紧跟技术前沿。我一直喜欢学习新事物,在这里度过的每一天都让我兴致勃勃。

硅谷是一个流动的地方,人才、信息和资金都在流动。这股流动带来了活力和创新,使这里变化无穷,给人以年轻的感觉。