简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Mercor 高速增长的秘诀与其中的聪明人|42章经

2025-09-14 20:38

来源:42章经

这次去美国,我的一大收获就是认识了 Mercor 的首位中国工程师(节目录制时也是全司唯一的中国员工)虞快。他是前金融科技独角兽工程总监,Google、Two Sigma、Citadel 工程师,也是我这次硅谷行遇到的最聪明的人之一。

本期播客对谈原文约 16000 字,本文经过删减整理后约 8000 字。

曲凯:Mercor 今年很火,国内也有不少分析和报道。我发现大家对你们的认知大致经历了两个阶段:

一开始很多人觉得你们是 AI 招聘公司,但后来发现,你们本质上是在做数据标注。

在你看来,Mercor 到底是一家什么公司?

虞快:我们的核心业务,是帮顶尖 AI 公司招各行各业的专家。

大家可能对数据标注有刻板印象,觉得就是从欠发达地区找廉价劳动力做些基础活。

但现在完全不同了。

AI Labs 需要的是医生、律师、投行顾问,甚至细分到专门写 Swift 的工程师、俄罗斯的生物学家。

因为模型已经进化到了只有专家才能标注的地步。大多数人会的题,它早就会了。再想提升模型智能,就必须请特定专家提供系统性反馈,告诉模型什么是好答案、什么是差答案。

曲凯:那这些 AI Labs 拿到你们的专家标准后,还需要再去找 Scale AI、Surge 这样的平台做人工标注吗?

虞快:不需要。某种程度上讲,我们已经完全替代了传统的数据标注平台,因为模型可以直接基于我们提供的评估标准做强化学习。

曲凯:也就是说,随着模型变强,过去的标注方式不够用了,出现了市场空白,而你们正好抓住了这个机会。

那你们是一开始就这么定位的,还是在过程中逐渐调整出来的?

虞快:我们的目标一直没变,就是「帮客户找到他们需要的任何人」。

只是我们发现,眼下最急迫、最愿意花钱的客户,正是 AI Labs。虽然 AI Labs 没有那么多,但是他们的预算很高,因为对他们来说,这笔投入非常划算:

算法的突破要靠顶级研究员,但这些人很贵,而且随时可能被竞对挖走;算力的竞争更残酷,OpenAI 也未必能打过 Google。那要让模型真正进步,数据依然是一大突破口。而为数据花的钱和模型能带来的回报相比,几乎不值一提。

曲凯:明白。那你们帮客户找到人之后,他们是自己去和这些专家谈薪资之类的吗?会不会出现飞单的问题?

虞快:客户会把钱给我们,再由我们支付给专家。

目前我们没遇到过飞单的情况。因为这件事的难点不只是「找到人」,更在于后续的管理。一个项目可能需要上百个分布全球的工程师,怎么和这些人沟通?怎么评估他们的产出?怎么结算?出了问题怎么协调?

这些琐事,AI Labs 并不想自己操心,都需要我们来帮忙打理。

曲凯:听起来你们有点像一家大型第三方人力外包公司?

虞快:其实不是。先不谈使命和愿景,单从业务层面来看,我们和外包商就有很大差别:

我们能评估人才质量。

比如一家公司要招工程师,可能会收到一万份简历。我们能用更科学的方法,帮客户筛出最优秀的那一小撮。

曲凯:这里正好可以捋一下你们的业务流程。比如你说可能会有一万人来申请,这些人都是主动来的吗?

虞快:对。我们业务流程的第一步是获客,主要方式有熟人推荐、广告投放、AI 自动发私信等。我们内部也有一个团队,会去主动搜罗一些特别难找的人。

目前我们平台上超过一半的专家都是靠熟人推荐来的。推荐人可以拿推荐费,所以甚至有人会全职在我们平台上帮忙找人,赚的还挺多的。

曲凯:相当于这些人来你们这做猎头了(笑)。

虞快:是的哈哈。专家被吸引到 Mercor 后,会上传简历、选择岗位并投递申请。过程中我们也会用一些自动化流程,规避简历造假等问题。

简历过了的人,就会进入 AI 视频面试环节。面试问题都是由 AI 基于简历和 JD 自动生成的,比如要招一个数学 PhD,AI 就会问研究方向、论文细节等问题。

面试过程也可以人工干预。像我自己在用 Mercor 招人时,就会告诉 AI 我想重点问什么,并设定评分标准,让它帮我执行。

曲凯:那如果有很多人面试,我要把每个视频都看完吗?

虞快:不用。创建岗位时,我们会请你先定义好目标和要求,相当于一套评分标准。面试结束后,AI 会根据候选人的表现自动打分并排序,方便你快速筛选。

曲凯:那把人招来之后,你们怎么评估他们的标注结果?如果有人乱做标注怎么办?

虞快:这很容易分辨。同一套题我们可能会问 50 个专家,如果有一个人的解法每次都和别人不一样,那这个项目做到一半 ta 就会被开掉。

曲凯:合理。那结算呢?你们平台上的报酬区间大概是怎样的?

虞快:我们按时薪结算,各种岗位的平均时薪超过 90 刀,但不同职业差别很大。我们会根据找人的难度、紧急程度等因素,与甲方协商定价。

比如英文语音训练的时薪大约是 21 刀,因为几乎所有英语母语者都能做。软件工程师的时薪一般在 100-200 刀之间。最夸张的一个案例,是我们招过时薪 400 刀、推荐费 5000 刀的皮肤科医生,因为人真的很难找。

曲凯:你们这真是个太好的生意了…我都想上去接单了哈哈。

那 AI Labs 会同时把需求发给很多平台吗?不同平台最后拼的是什么?

虞快:如果我是 AI Lab 的决策者,最多只会找两三家合作。只找一家风险太大,比如 Scale AI 被收购后,他们的客户就很被动;但找太多家又很麻烦,因为每家的流程都不同,结算起来很复杂,出了问题还很难归因和追责。

而不同平台最后拼的,就是谁能又快又好地找到合适的专家、赢得客户的信任。如果你找来的人靠谱,AI Labs 就更愿意与你长期合作。

曲凯:说到 Scale AI,听说他们被收购之后,业务下滑得很厉害?

虞快:对。其实在被收购之前,Scale AI 就遇到了问题。他们靠给 OpenAI 做标注起家,但随着模型能力提升,他们原来找的标注员的水平不够用了,OpenAI 的反馈也变差了。

收购之后,大家又觉得它成了 Meta 的一部分,不太敢继续跟它合作。

曲凯:所以 Meta 这次收购真就是「人才收购」?花了这么多钱,结果业务还跌了。

虞快:我个人猜测,扎克伯格主要是为了收编 Alex Wang。

Alex 很有抱负,两三年后大概率还会再创业。如果只是给他高薪,很难把他挖来,因为他很难向团队和投资人交代,等他未来再创业时,融资和组团队都会遇阻。Windsurf 创始人的经历就是前车之鉴。

所以扎克伯格干脆花 150 亿,把 Alex 的团队和投资人都安顿好,替他解决了后顾之忧。

曲凯:所以现在 Scale AI 对你们已经没什么威胁了?虽然这么说有点奇怪,毕竟他们体量还是比你们大。

虞快:从增长来看,我不觉得 Scale AI 是我们的对手,反而是 Surge 更值得警惕。

曲凯:那市场对 Mercor 的理解形成共识了吗?大家是不是普遍把你们看成数据标注公司?

虞快:我不觉得我们是数据标注公司,而是一家 Eval Provider。

其实我们核心交付给 AI Labs 的东西,就是 Evaluation 和 Benchmark 的标准,或者说是一份模型的 PRD。

我们的专家会帮模型公司设定目标,让研究员去推动模型实现那些暂时还不具备的能力。

曲凯:理解。

但我觉得 Mercor 一开始在讲的是一个很性感的平台型故事。虽然现在数据标注这条线从赚钱角度看可能更性感,增长也快,但相比之下,平台故事的想象空间是不是更大?你们现在做的,会不会只是阶段性的事情?

虞快:其实 Mercor 一直在坚持同一个愿景,就是我们相信随着 AI 能力提升,未来的工作形态会改变:

全职岗位会减少,项目制会成为主流。

所以我们现在看似是在阶段性地满足 AI Labs 的需求,本质上是在押注未来的工作方式。

未来,「用 AI 来衡量一个人」不只适用于面试,还能拓展到更多场景。比如我是 VC,要和上千个创业者交流,我也可以先设几个问题,定义什么是好答案、什么是差答案,然后让 AI 帮我去问。

曲凯:所以 Mercor 这套模式未来可以推广到更多行业?

虞快:可以复用到所有行业,因为任何行业最终都离不开「挑选」这个环节。

曲凯:明白了。也就是说,Mercor 并不是中途转型成数据标注公司,而是一直在讲同一个故事、做同一件事。只是你们在做的过程中,发现了最有钱的客户和他们最痛点的需求,然后先把资源集中到了这个方向,跑起来后,未来可以再慢慢扩展。

那你觉得国内能复制出一个 Mercor 吗?

虞快:关键要看国内的 AI 公司愿不愿意在数据上花钱。只要有预算,就一定有人能把这件事做出来,而且可以做得很成功。

曲凯:但国内外还是有差距。

比如国内的模型公司估值可能也就三四十亿美金,而美国这边已经到三四千亿美金了。

曲凯:那在你看来,数据标注的市场规模有多大?

虞快:现在看,大概有 50 - 100 亿美金。

只要 OpenAI、Anthropic 这些公司还在,这个市场就会继续扩大,因为他们会持续砸钱来换取模型的领先地位。而只要他们投入,那 Google、Meta 这些不差钱的大厂也会跟进,所以市场还会进一步扩大。

曲凯:确实。如果 Meta 在一个人身上都能花 1 亿美金,在数据上肯定更舍得花钱。

那你当时为什么选择加入 Mercor?

虞快:原因很多。

第一,我觉得好的创始人至少要在某个领域特别强,而 Mercor 的三位创始人有个共同特长:辩论(笑)。他们是全美顶尖高中辩论队的队友,反应快、说服力强。

会辩论其实很有价值。比如几个月前,我们招人时还没什么筹码,全靠创始人把 vision 卖出去,说服大家加入。再比如我要是自己做产品,也会想让他们去帮我卖,因为我相信无论客户问什么,他们都能讲到对方信服。

第二,Mercor 的增长势头实在是太好了。从 100 万到 1 亿美金 Run Rate,Mercor 只用了 11 个月,比 Cursor 12 个月的纪录还短。而公司跑得越快,就越能吸引好的人才;好的人才来了,效率更高,增长也会更快。

第三,我认为在这个时代,有特点、有话题性的创业公司更容易成功,或者更容易拿到溢价,而 Mercor 的三位创始人就很有话题性:他们都是拿到 Thiel Fellowship(Peter Thiel 创办的项目,非常难获得,其中一个条件就是必须退学)的 college dropouts,二十出头就创立了 Mercor。

其实我们团队整体都很年轻,平均年龄只有 22 岁,很多人都是 dropouts,一半的人之前都创过业。

曲凯:这里我很想和你探讨一个问题,就是中美年轻人创业的区别。

在国内,现在很多人不太看好年轻人创业。大家会觉得这波 AI 是移动互联网的延续,所以经验丰富的人更懂怎么避坑,也有更多的资源。而年轻人需要不断试错,就算拿到融资,也可能不敢花、不会花,很难做出结果。

那在你看来,为什么 Mercor 能在平均年龄这么小的情况下,跑出这么快的增长?

虞快:我觉得中美创业氛围的差别很大。归根结底,这是个 sample size 的问题。

在中国,创业失败对一个人职业生涯的打击远比在美国大,所以愿意尝试的人本身就少,成功案例就更少。而因为大家看不到太多成功的故事,所以就更不愿意选择这条路。

而硅谷有很多「创二代」。很多人从小就听着父母辈的创业故事长大,所以他们甚至会把创业当成是毕业之后的默认选项。

曲凯:确实。而且这边很多人很小就在街边卖柠檬水,上大学后也经常做 presentation,所以他们讲故事和 pitch 的能力,甚至可能强过国内一些很 senior 的创始人和高管。

虞快:是。在美国,sales 和 marketing 是非常核心的能力,而且大家也很愿意去提升这些技能,比如在美国亚马逊畅销榜上,就常年有一本叫《How to Win Friends and Influence People》的书。

曲凯:那总结下来,你觉得 Mercor 增速这么快,最核心原因是什么?

虞快:首先我们在对的时间,选中了一个特别好的赛道。而且我们一上来就从 Scale AI 招了一些核心人才,帮我们少走了很多弯路。

除此之外,最关键的一点就是快。

我们的决策速度和执行速度都很快。

曲凯:「决策快」是不是意味着,你们必须有更高效的评估和反馈机制?

虞快:对。创始人最在意的就是「what's working & what's not」。

曲凯:但你们快速做出的决策,很多时候真的是对的吗?

虞快:对错没那么重要,只要不是大错就行。

Mercor 并不是特别 data-driven,很多时候都依赖创始人和管理层的直觉。因为市场变化太快,我们没时间做特别科学的判断,所以关键是快速行动。

就算错了,能及时意识到问题、立刻修正就行。

曲凯:也就是你说的「执行快」?

虞快:对。这是我们最核心的竞争力,别人很难复制。

最直观的体现,就是我们能「说到做到」。我们一旦定下一个目标,就一定能按时交付。而且整个团队都是这样,所以大家彼此信任,也敢对客户做出承诺。

曲凯:你们是怎么做到的?我觉得很重要的一点,是你们可能比其他硅谷公司要卷。

虞快:确实很卷(笑)。我们团队里绝大多数人都是每天 7 点半上班,凌晨 1 点下班。

但工作时长不是关键,关键是我们真的在乎自己做的事,所以都是心甘情愿地在拼。

在一家每月营收都能涨 50% 的公司里,你根本不会纠结那些有的没的,只会越做越有劲。

曲凯:所以增长就是最大的激励。

那像你们这样勤奋的公司,在硅谷 AI 创业圈里大概有多少?

虞快:十几人的团队很多都是这种状态,等团队扩张到一百人,还能保持这种强度的就不多了。

曲凯:但这可能已经超出很多国内公司对硅谷努力程度的预期了。国内很多人以为美国公司很悠闲,但其实这边的很多团队也很拼。所以大家还是不能小看硅谷公司。

那你现在在 Mercor 负责 Engineer Management,也在招人,能不能讲讲你招人的一些标准?

虞快:首先技术肯定要强。

比如我们招 PM 时,也很看重候选人的技术能力,经常会问「你最近 build 过什么」,哪怕是个网站也可以,只要你能讲清楚过程中你的一些思考就行。现在 AI 工具这么多,如果一个候选人什么都没 build 过,就是个 huge red flag。

另外,我个人更看重的一个品质是 Agency。

曲凯:这个词在美国很火,有点像是「主动性」的意思,就是你能不能克服一切困难,拿到最终的结果。

虞快:对。如果我要把一个任务事无巨细地拆解给你、还要给你设定每天的工作量,那我就会觉得你没有足够高的 Agency。团队里可以有一两个只会埋头干活的人,但前提是他们的沟通和学习能力也要过硬,否则就会拖慢整个团队。

另外,我特别看重一个人是不是足够聪明。

怎么判断呢?

我常用的方法是:先抛一个新概念,然后看这个人能多快理解并融会贯通。

学习有不同层次,最基础的是机械背诵,再高一层是能理解原理,但没有内化、讲不清楚。

更高级且轻巧的思维方式,是能拿熟悉的东西去类比。举个例子,你不知道 MCP 是什么,但你很懂 API,能立刻看出 MCP 和 API 的相似点与不同点,那你就能通过类比的方式,快速消化新概念,而且理解得会比较深刻。

曲凯:其实好的哲学家、诗人都有这种能力。他们很擅长解构,然后在底层找到不同事物之间的联系。

不过你举的 MCP 的例子还挺有趣的,因为大多数人学新概念可能就是看介绍、读文章,而你的第一反应是去找类比?

虞快:对。我会在 Google 里输入「MCP vs」,看自动补全是什么。

曲凯:如果只是想粗浅地了解 MCP,用你这种方法可能只需要 1 秒钟。因为大家只要能看到自动补全的「MCP vs API」的词条、认知到 MCP 可以类比 API,那就已经很够用了。

虞快:是。另外,对我来说,学习新东西最有效的方式是看别人的评价。比如搜完「MCP vs API」,我会优先去看 Reddit 上的帖子。再比如我想快速了解 A 产品,我也不会先看官网,而是会想它的竞品是谁,然后搜索「A vs B」,看大家对这两个产品的评价。

曲凯:你的学习方法有个前提,就是脑子里得有一套结构化的框架,这样遇到新概念时,才知道该放在哪一块。不然就算能想到做类比,脑子里的知识也是一盘散沙。

然后你刚才说面试会用新概念来考察一个人聪不聪明,能举个例子吗?

虞快:比如我可能会介绍一个概念,叫「parking function」:

假设有三个人要停车,只有 3 个车位,如果这三个人都能停到自己想停的位置,就算满足条件;而只要有一辆车停不下,就不满足。

举几个例子:

如果三个人分别想停在 1、2、3 号位,显然都能停下,所以「123」是一个满足条件的 parking sequence;

如果三个人都选 1 号位,那后面的人看到 1 号位被占之后,可以向后顺延、停进后面的车位,所以「111」也满足条件;

但如果三个人都想停 3 号位,且车不能后退时,那第一个人占了 3 号位之后,后面的人既不能退回到 1、2 号位,也没有 4 号位可选。所以「333」不是一个 parking sequence。

讲完定义,我会给候选人一个数组,让 Ta 判断这个数组是不是 parking sequence。

比如我给出的数组是「231」,大多数人都会老老实实按照定义去模拟:第一辆车去 2 号位能停下,第二辆车去 3 号位也能停,而第三辆车本来就想去 1 号位,所以大家都能停下,因此这个数组是对的。

曲凯:大多数人可能这会儿已经晕了(笑)。

虞快:哈哈,而且这种列举的方式很慢。更好的做法是 take a step back,思考「在什么情况下会有人停不下」。

曲凯:稍等啊,给我几秒钟。

(大家也可以一起停下来想一想 :P)

……

我在想,如果后面的车想停下,前面的车位必须先被占满。

虞快:对,这是一个很好的观察。所以你希望大家优先选择停在靠前的车位。那么如果没有人选择 1 号位呢?

曲凯:那车位的数量就一定要大于车的数量,否则就必须得有人选 1 号位。

虞快:那需不需要一定有人选 2 号位?

曲凯:不需要,因为可以有两个人选 1 号位。

虞快:对。所以要么得有两个人选 1 号位,要么得有一个选 1 号、另一个人选 2 号。

这里还有一个观察,就是数组的顺序其实无所谓,比如「321」和「123」,最后结果是一样的。

所以最后能推出的规律就是:一个数组从小到大排序之后,第一个数必须 ≤ 1,第二个数必须 ≤ 2,第三个数必须 ≤ 3。只要满足这个条件,就是一个 parking sequence。

但很多人不会这样思考问题,而是会花很多时间去硬生生地模拟。这时我也会给大家一个 hint,比如:如果我给你一个随机数组,你觉得它大概率能不能满足条件?

曲凯:很有意思。有没有更简单的题?

虞快:我面试其实也会问一些很简单的题,但往往能从细节里看出很多问题。

比如我会给候选人「123」和「456」这两个字符串,然后让 ta 写段代码,把这两个字符串相乘的规则表示出来。有的人会卡半个小时,最后说「我忘了乘法怎么算了」。

其实忘记乘法没关系,毕竟大家现在都会用计算器。但我介意的是:你不记得规则,为什么还要在那硬耗半个小时?这半小时你在做什么?既然你不会,那为什么不直接问?

不过有时候我自己也不知道某道题的答案是什么。这种情况,我会一边听候选人推理,一边在心里想「如果是我,我会怎么做」,然后和候选人的答案做对比。如果 Ta 答得太离谱,那我可能就会直接拒掉。

曲凯:明白。前面你聊到的这些框架和思路,是什么时候开始形成的?

虞快:其实是做管理之后才开始形成的。我大概做了四五年管理,很多想法都是和我在 Two Sigma 的老板学的。

另外说起来,让我快速成长的,是在 Google 的那段时间。

我刚参加工作的第二个月,需要做一个项目,涉及到一项全新的技术。我对那个技术一无所知,所以就有点沮丧,觉得自己对团队没有贡献。但我的 Tech Lead 和我说了一番话,让我茅塞顿开,他说:

如果真有人知道该怎么做,这个项目早就做完了。所以第一,别把别人想得太强,不要以为 senior 的人一看就能搞定,其实大家都要摸索;第二,你的工作之一就是主动去搞明白这件事到底该怎么做,如果你能啃下来,那你就是组里第一个会做的人,还能去教别人。

这件事对我影响很大。在那之前,我会觉得自己只是 L3,而组里全是 L5、L6,所以自己就是不如别人。但其实很多时候不是这样的。

曲凯:所以从 Google、Two Sigma、Citadel,再到初创公司,你在各种类型的公司都待过。你感受到的核心区别是什么?

虞快:我觉得公司类型不重要,重要的是赛道。

我当时去金融公司,是因为发现周围厉害的人都在做金融。而现在,很多厉害的人都会优先去搞 AI。

你想想,未来十年,是金融更可能涨 100 倍,还是 AI?

答案显然是 AI。

所以真正值得思考的问题不是要选大厂还是创业公司,而是你要不要做 AI。

曲凯:最后,你觉得未来 AI 公司的组织形态会是什么样?PM 和工程师的角色会发生什么变化?

虞快:随着 AI Coding 能力提升,写代码会越来越省时间。比如我现在在通勤路上想到一个点子,就会把需求丢给 Cursor,等到家时,它可能已经生成了一个初版。

所以未来,工程师更重要的能力不是写代码,而是要想清楚该做什么、方向对不对。这种判断往往来自客户反馈,所以工程师也应该重视和客户的交流。

反映到组织架构上,就是工程师和 PM 的边界会越来越模糊,组织也会趋向扁平化。

这就要求公司有健康的激励机制,管理层也要有识人能力,能看出谁真的在为公司思考。

42章经

思考事物本质

(声明:本文仅代表作者观点,不代表新浪网立场。)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。