繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Mercor 高速增長的祕訣與其中的聰明人|42章經

2025-09-14 20:38

來源:42章經

這次去美國,我的一大收穫就是認識了 Mercor 的首位中國工程師(節目錄制時也是全司唯一的中國員工)虞快。他是前金融科技獨角獸工程總監,Google、Two Sigma、Citadel 工程師,也是我這次硅谷行遇到的最聰明的人之一。

本期播客對談原文約 16000 字,本文經過刪減整理后約 8000 字。

曲凱:Mercor 今年很火,國內也有不少分析和報道。我發現大家對你們的認知大致經歷了兩個階段:

一開始很多人覺得你們是 AI 招聘公司,但后來發現,你們本質上是在做數據標註。

在你看來,Mercor 到底是一家什麼公司?

虞快:我們的核心業務,是幫頂尖 AI 公司招各行各業的專家。

大家可能對數據標註有刻板印象,覺得就是從欠發達地區找廉價勞動力做些基礎活。

但現在完全不同了。

AI Labs 需要的是醫生、律師、投行顧問,甚至細分到專門寫 Swift 的工程師、俄羅斯的生物學家。

因為模型已經進化到了只有專家才能標註的地步。大多數人會的題,它早就會了。再想提升模型智能,就必須請特定專家提供系統性反饋,告訴模型什麼是好答案、什麼是差答案。

曲凱:那這些 AI Labs 拿到你們的專家標準后,還需要再去找 Scale AI、Surge 這樣的平臺做人工標註嗎?

虞快:不需要。某種程度上講,我們已經完全替代了傳統的數據標註平臺,因為模型可以直接基於我們提供的評估標準做強化學習。

曲凱:也就是説,隨着模型變強,過去的標註方式不夠用了,出現了市場空白,而你們正好抓住了這個機會。

那你們是一開始就這麼定位的,還是在過程中逐漸調整出來的?

虞快:我們的目標一直沒變,就是「幫客户找到他們需要的任何人」。

只是我們發現,眼下最急迫、最願意花錢的客户,正是 AI Labs。雖然 AI Labs 沒有那麼多,但是他們的預算很高,因為對他們來説,這筆投入非常划算:

算法的突破要靠頂級研究員,但這些人很貴,而且隨時可能被競對挖走;算力的競爭更殘酷,OpenAI 也未必能打過 Google。那要讓模型真正進步,數據依然是一大突破口。而為數據花的錢和模型能帶來的回報相比,幾乎不值一提。

曲凱:明白。那你們幫客户找到人之后,他們是自己去和這些專家談薪資之類的嗎?會不會出現飛單的問題?

虞快:客户會把錢給我們,再由我們支付給專家。

目前我們沒遇到過飛單的情況。因為這件事的難點不只是「找到人」,更在於后續的管理。一個項目可能需要上百個分佈全球的工程師,怎麼和這些人溝通?怎麼評估他們的產出?怎麼結算?出了問題怎麼協調?

這些瑣事,AI Labs 並不想自己操心,都需要我們來幫忙打理。

曲凱:聽起來你們有點像一家大型第三方人力外包公司?

虞快:其實不是。先不談使命和願景,單從業務層面來看,我們和外包商就有很大差別:

我們能評估人才質量。

比如一家公司要招工程師,可能會收到一萬份簡歷。我們能用更科學的方法,幫客户篩出最優秀的那一小撮。

曲凱:這里正好可以捋一下你們的業務流程。比如你説可能會有一萬人來申請,這些人都是主動來的嗎?

虞快:對。我們業務流程的第一步是獲客,主要方式有熟人推薦、廣告投放、AI 自動發私信等。我們內部也有一個團隊,會去主動蒐羅一些特別難找的人。

目前我們平臺上超過一半的專家都是靠熟人推薦來的。推薦人可以拿推薦費,所以甚至有人會全職在我們平臺上幫忙找人,賺的還挺多的。

曲凱:相當於這些人來你們這做獵頭了(笑)。

虞快:是的哈哈。專家被吸引到 Mercor 后,會上傳簡歷、選擇崗位並投遞申請。過程中我們也會用一些自動化流程,規避簡歷造假等問題。

簡歷過了的人,就會進入 AI 視頻面試環節。面試問題都是由 AI 基於簡歷和 JD 自動生成的,比如要招一個數學 PhD,AI 就會問研究方向、論文細節等問題。

面試過程也可以人工干預。像我自己在用 Mercor 招人時,就會告訴 AI 我想重點問什麼,並設定評分標準,讓它幫我執行。

曲凱:那如果有很多人面試,我要把每個視頻都看完嗎?

虞快:不用。創建崗位時,我們會請你先定義好目標和要求,相當於一套評分標準。面試結束后,AI 會根據候選人的表現自動打分並排序,方便你快速篩選。

曲凱:那把人招來之后,你們怎麼評估他們的標註結果?如果有人亂做標註怎麼辦?

虞快:這很容易分辨。同一套題我們可能會問 50 個專家,如果有一個人的解法每次都和別人不一樣,那這個項目做到一半 ta 就會被開掉。

曲凱:合理。那結算呢?你們平臺上的報酬區間大概是怎樣的?

虞快:我們按時薪結算,各種崗位的平均時薪超過 90 刀,但不同職業差別很大。我們會根據找人的難度、緊急程度等因素,與甲方協商定價。

比如英文語音訓練的時薪大約是 21 刀,因為幾乎所有英語母語者都能做。軟件工程師的時薪一般在 100-200 刀之間。最誇張的一個案例,是我們招過時薪 400 刀、推薦費 5000 刀的皮膚科醫生,因為人真的很難找。

曲凱:你們這真是個太好的生意了…我都想上去接單了哈哈。

那 AI Labs 會同時把需求發給很多平臺嗎?不同平臺最后拼的是什麼?

虞快:如果我是 AI Lab 的決策者,最多隻會找兩三家合作。只找一家風險太大,比如 Scale AI 被收購后,他們的客户就很被動;但找太多家又很麻煩,因為每家的流程都不同,結算起來很複雜,出了問題還很難歸因和追責。

而不同平臺最后拼的,就是誰能又快又好地找到合適的專家、贏得客户的信任。如果你找來的人靠譜,AI Labs 就更願意與你長期合作。

曲凱:説到 Scale AI,聽説他們被收購之后,業務下滑得很厲害?

虞快:對。其實在被收購之前,Scale AI 就遇到了問題。他們靠給 OpenAI 做標註起家,但隨着模型能力提升,他們原來找的標註員的水平不夠用了,OpenAI 的反饋也變差了。

收購之后,大家又覺得它成了 Meta 的一部分,不太敢繼續跟它合作。

曲凱:所以 Meta 這次收購真就是「人才收購」?花了這麼多錢,結果業務還跌了。

虞快:我個人猜測,扎克伯格主要是爲了收編 Alex Wang。

Alex 很有抱負,兩三年后大概率還會再創業。如果只是給他高薪,很難把他挖來,因為他很難向團隊和投資人交代,等他未來再創業時,融資和組團隊都會遇阻。Windsurf 創始人的經歷就是前車之鑑。

所以扎克伯格乾脆花 150 億,把 Alex 的團隊和投資人都安頓好,替他解決了后顧之憂。

曲凱:所以現在 Scale AI 對你們已經沒什麼威脅了?雖然這麼説有點奇怪,畢竟他們體量還是比你們大。

虞快:從增長來看,我不覺得 Scale AI 是我們的對手,反而是 Surge 更值得警惕。

曲凱:那市場對 Mercor 的理解形成共識了嗎?大家是不是普遍把你們看成數據標註公司?

虞快:我不覺得我們是數據標註公司,而是一家 Eval Provider。

其實我們核心交付給 AI Labs 的東西,就是 Evaluation 和 Benchmark 的標準,或者説是一份模型的 PRD。

我們的專家會幫模型公司設定目標,讓研究員去推動模型實現那些暫時還不具備的能力。

曲凱:理解。

但我覺得 Mercor 一開始在講的是一個很性感的平臺型故事。雖然現在數據標註這條線從賺錢角度看可能更性感,增長也快,但相比之下,平臺故事的想象空間是不是更大?你們現在做的,會不會只是階段性的事情?

虞快:其實 Mercor 一直在堅持同一個願景,就是我們相信隨着 AI 能力提升,未來的工作形態會改變:

全職崗位會減少,項目制會成為主流。

所以我們現在看似是在階段性地滿足 AI Labs 的需求,本質上是在押注未來的工作方式。

未來,「用 AI 來衡量一個人」不只適用於面試,還能拓展到更多場景。比如我是 VC,要和上千個創業者交流,我也可以先設幾個問題,定義什麼是好答案、什麼是差答案,然后讓 AI 幫我去問。

曲凱:所以 Mercor 這套模式未來可以推廣到更多行業?

虞快:可以複用到所有行業,因為任何行業最終都離不開「挑選」這個環節。

曲凱:明白了。也就是説,Mercor 並不是中途轉型成數據標註公司,而是一直在講同一個故事、做同一件事。只是你們在做的過程中,發現了最有錢的客户和他們最痛點的需求,然后先把資源集中到了這個方向,跑起來后,未來可以再慢慢擴展。

那你覺得國內能複製出一個 Mercor 嗎?

虞快:關鍵要看國內的 AI 公司願不願意在數據上花錢。只要有預算,就一定有人能把這件事做出來,而且可以做得很成功。

曲凱:但國內外還是有差距。

比如國內的模型公司估值可能也就三四十億美金,而美國這邊已經到三四千億美金了。

曲凱:那在你看來,數據標註的市場規模有多大?

虞快:現在看,大概有 50 - 100 億美金。

只要 OpenAI、Anthropic 這些公司還在,這個市場就會繼續擴大,因為他們會持續砸錢來換取模型的領先地位。而只要他們投入,那 Google、Meta 這些不差錢的大廠也會跟進,所以市場還會進一步擴大。

曲凱:確實。如果 Meta 在一個人身上都能花 1 億美金,在數據上肯定更捨得花錢。

那你當時為什麼選擇加入 Mercor?

虞快:原因很多。

第一,我覺得好的創始人至少要在某個領域特別強,而 Mercor 的三位創始人有個共同特長:辯論(笑)。他們是全美頂尖高中辯論隊的隊友,反應快、説服力強。

會辯論其實很有價值。比如幾個月前,我們招人時還沒什麼籌碼,全靠創始人把 vision 賣出去,説服大家加入。再比如我要是自己做產品,也會想讓他們去幫我賣,因為我相信無論客户問什麼,他們都能講到對方信服。

第二,Mercor 的增長勢頭實在是太好了。從 100 萬到 1 億美金 Run Rate,Mercor 只用了 11 個月,比 Cursor 12 個月的紀錄還短。而公司跑得越快,就越能吸引好的人才;好的人才來了,效率更高,增長也會更快。

第三,我認為在這個時代,有特點、有話題性的創業公司更容易成功,或者更容易拿到溢價,而 Mercor 的三位創始人就很有話題性:他們都是拿到 Thiel Fellowship(Peter Thiel 創辦的項目,非常難獲得,其中一個條件就是必須退學)的 college dropouts,二十出頭就創立了 Mercor。

其實我們團隊整體都很年輕,平均年齡只有 22 歲,很多人都是 dropouts,一半的人之前都創過業。

曲凱:這里我很想和你探討一個問題,就是中美年輕人創業的區別。

在國內,現在很多人不太看好年輕人創業。大家會覺得這波 AI 是移動互聯網的延續,所以經驗豐富的人更懂怎麼避坑,也有更多的資源。而年輕人需要不斷試錯,就算拿到融資,也可能不敢花、不會花,很難做出結果。

那在你看來,為什麼 Mercor 能在平均年齡這麼小的情況下,跑出這麼快的增長?

虞快:我覺得中美創業氛圍的差別很大。歸根結底,這是個 sample size 的問題。

在中國,創業失敗對一個人職業生涯的打擊遠比在美國大,所以願意嘗試的人本身就少,成功案例就更少。而因為大家看不到太多成功的故事,所以就更不願意選擇這條路。

而硅谷有很多「創二代」。很多人從小就聽着父母輩的創業故事長大,所以他們甚至會把創業當成是畢業之后的默認選項。

曲凱:確實。而且這邊很多人很小就在街邊賣檸檬水,上大學后也經常做 presentation,所以他們講故事和 pitch 的能力,甚至可能強過國內一些很 senior 的創始人和高管。

虞快:是。在美國,sales 和 marketing 是非常核心的能力,而且大家也很願意去提升這些技能,比如在美國亞馬遜暢銷榜上,就常年有一本叫《How to Win Friends and Influence People》的書。

曲凱:那總結下來,你覺得 Mercor 增速這麼快,最核心原因是什麼?

虞快:首先我們在對的時間,選中了一個特別好的賽道。而且我們一上來就從 Scale AI 招了一些核心人才,幫我們少走了很多彎路。

除此之外,最關鍵的一點就是快。

我們的決策速度和執行速度都很快。

曲凱:「決策快」是不是意味着,你們必須有更高效的評估和反饋機制?

虞快:對。創始人最在意的就是「what's working & what's not」。

曲凱:但你們快速做出的決策,很多時候真的是對的嗎?

虞快:對錯沒那麼重要,只要不是大錯就行。

Mercor 並不是特別 data-driven,很多時候都依賴創始人和管理層的直覺。因為市場變化太快,我們沒時間做特別科學的判斷,所以關鍵是快速行動。

就算錯了,能及時意識到問題、立刻修正就行。

曲凱:也就是你説的「執行快」?

虞快:對。這是我們最核心的競爭力,別人很難複製。

最直觀的體現,就是我們能「説到做到」。我們一旦定下一個目標,就一定能按時交付。而且整個團隊都是這樣,所以大家彼此信任,也敢對客户做出承諾。

曲凱:你們是怎麼做到的?我覺得很重要的一點,是你們可能比其他硅谷公司要卷。

虞快:確實很卷(笑)。我們團隊里絕大多數人都是每天 7 點半上班,凌晨 1 點下班。

但工作時長不是關鍵,關鍵是我們真的在乎自己做的事,所以都是心甘情願地在拼。

在一家每月營收都能漲 50% 的公司里,你根本不會糾結那些有的沒的,只會越做越有勁。

曲凱:所以增長就是最大的激勵。

那像你們這樣勤奮的公司,在硅谷 AI 創業圈里大概有多少?

虞快:十幾人的團隊很多都是這種狀態,等團隊擴張到一百人,還能保持這種強度的就不多了。

曲凱:但這可能已經超出很多國內公司對硅谷努力程度的預期了。國內很多人以為美國公司很悠閒,但其實這邊的很多團隊也很拼。所以大家還是不能小看硅谷公司。

那你現在在 Mercor 負責 Engineer Management,也在招人,能不能講講你招人的一些標準?

虞快:首先技術肯定要強。

比如我們招 PM 時,也很看重候選人的技術能力,經常會問「你最近 build 過什麼」,哪怕是個網站也可以,只要你能講清楚過程中你的一些思考就行。現在 AI 工具這麼多,如果一個候選人什麼都沒 build 過,就是個 huge red flag。

另外,我個人更看重的一個品質是 Agency。

曲凱:這個詞在美國很火,有點像是「主動性」的意思,就是你能不能克服一切困難,拿到最終的結果。

虞快:對。如果我要把一個任務事無鉅細地拆解給你、還要給你設定每天的工作量,那我就會覺得你沒有足夠高的 Agency。團隊里可以有一兩個只會埋頭干活的人,但前提是他們的溝通和學習能力也要過硬,否則就會拖慢整個團隊。

另外,我特別看重一個人是不是足夠聰明。

怎麼判斷呢?

我常用的方法是:先拋一個新概念,然后看這個人能多快理解並融會貫通。

學習有不同層次,最基礎的是機械背誦,再高一層是能理解原理,但沒有內化、講不清楚。

更高級且輕巧的思維方式,是能拿熟悉的東西去類比。舉個例子,你不知道 MCP 是什麼,但你很懂 API,能立刻看出 MCP 和 API 的相似點與不同點,那你就能通過類比的方式,快速消化新概念,而且理解得會比較深刻。

曲凱:其實好的哲學家、詩人都有這種能力。他們很擅長解構,然后在底層找到不同事物之間的聯繫。

不過你舉的 MCP 的例子還挺有趣的,因為大多數人學新概念可能就是看介紹、讀文章,而你的第一反應是去找類比?

虞快:對。我會在 Google 里輸入「MCP vs」,看自動補全是什麼。

曲凱:如果只是想粗淺地瞭解 MCP,用你這種方法可能只需要 1 秒鍾。因為大家只要能看到自動補全的「MCP vs API」的詞條、認知到 MCP 可以類比 API,那就已經很夠用了。

虞快:是。另外,對我來説,學習新東西最有效的方式是看別人的評價。比如搜完「MCP vs API」,我會優先去看 Reddit 上的帖子。再比如我想快速瞭解 A 產品,我也不會先看官網,而是會想它的競品是誰,然后搜索「A vs B」,看大家對這兩個產品的評價。

曲凱:你的學習方法有個前提,就是腦子里得有一套結構化的框架,這樣遇到新概念時,才知道該放在哪一塊。不然就算能想到做類比,腦子里的知識也是一盤散沙。

然后你剛纔説面試會用新概念來考察一個人聰不聰明,能舉個例子嗎?

虞快:比如我可能會介紹一個概念,叫「parking function」:

假設有三個人要停車,只有 3 個車位,如果這三個人都能停到自己想停的位置,就算滿足條件;而只要有一輛車停不下,就不滿足。

舉幾個例子:

如果三個人分別想停在 1、2、3 號位,顯然都能停下,所以「123」是一個滿足條件的 parking sequence;

如果三個人都選 1 號位,那后面的人看到 1 號位被佔之后,可以向后順延、停進后面的車位,所以「111」也滿足條件;

但如果三個人都想停 3 號位,且車不能后退時,那第一個人佔了 3 號位之后,后面的人既不能退回到 1、2 號位,也沒有 4 號位可選。所以「333」不是一個 parking sequence。

講完定義,我會給候選人一個數組,讓 Ta 判斷這個數組是不是 parking sequence。

比如我給出的數組是「231」,大多數人都會老老實實按照定義去模擬:第一輛車去 2 號位能停下,第二輛車去 3 號位也能停,而第三輛車本來就想去 1 號位,所以大家都能停下,因此這個數組是對的。

曲凱:大多數人可能這會兒已經暈了(笑)。

虞快:哈哈,而且這種列舉的方式很慢。更好的做法是 take a step back,思考「在什麼情況下會有人停不下」。

曲凱:稍等啊,給我幾秒鍾。

(大家也可以一起停下來想一想 :P)

……

我在想,如果后面的車想停下,前面的車位必須先被佔滿。

虞快:對,這是一個很好的觀察。所以你希望大家優先選擇停在靠前的車位。那麼如果沒有人選擇 1 號位呢?

曲凱:那車位的數量就一定要大於車的數量,否則就必須得有人選 1 號位。

虞快:那需不需要一定有人選 2 號位?

曲凱:不需要,因為可以有兩個人選 1 號位。

虞快:對。所以要麼得有兩個人選 1 號位,要麼得有一個選 1 號、另一個人選 2 號。

這里還有一個觀察,就是數組的順序其實無所謂,比如「321」和「123」,最后結果是一樣的。

所以最后能推出的規律就是:一個數組從小到大排序之后,第一個數必須 ≤ 1,第二個數必須 ≤ 2,第三個數必須 ≤ 3。只要滿足這個條件,就是一個 parking sequence。

但很多人不會這樣思考問題,而是會花很多時間去硬生生地模擬。這時我也會給大家一個 hint,比如:如果我給你一個隨機數組,你覺得它大概率能不能滿足條件?

曲凱:很有意思。有沒有更簡單的題?

虞快:我面試其實也會問一些很簡單的題,但往往能從細節里看出很多問題。

比如我會給候選人「123」和「456」這兩個字符串,然后讓 ta 寫段代碼,把這兩個字符串相乘的規則表示出來。有的人會卡半個小時,最后説「我忘了乘法怎麼算了」。

其實忘記乘法沒關係,畢竟大家現在都會用計算器。但我介意的是:你不記得規則,為什麼還要在那硬耗半個小時?這半小時你在做什麼?既然你不會,那為什麼不直接問?

不過有時候我自己也不知道某道題的答案是什麼。這種情況,我會一邊聽候選人推理,一邊在心里想「如果是我,我會怎麼做」,然后和候選人的答案做對比。如果 Ta 答得太離譜,那我可能就會直接拒掉。

曲凱:明白。前面你聊到的這些框架和思路,是什麼時候開始形成的?

虞快:其實是做管理之后纔開始形成的。我大概做了四五年管理,很多想法都是和我在 Two Sigma 的老闆學的。

另外説起來,讓我快速成長的,是在 Google 的那段時間。

我剛參加工作的第二個月,需要做一個項目,涉及到一項全新的技術。我對那個技術一無所知,所以就有點沮喪,覺得自己對團隊沒有貢獻。但我的 Tech Lead 和我說了一番話,讓我茅塞頓開,他説:

如果真有人知道該怎麼做,這個項目早就做完了。所以第一,別把別人想得太強,不要以為 senior 的人一看就能搞定,其實大家都要摸索;第二,你的工作之一就是主動去搞明白這件事到底該怎麼做,如果你能啃下來,那你就是組里第一個會做的人,還能去教別人。

這件事對我影響很大。在那之前,我會覺得自己只是 L3,而組里全是 L5、L6,所以自己就是不如別人。但其實很多時候不是這樣的。

曲凱:所以從 Google、Two Sigma、Citadel,再到初創公司,你在各種類型的公司都待過。你感受到的核心區別是什麼?

虞快:我覺得公司類型不重要,重要的是賽道。

我當時去金融公司,是因為發現周圍厲害的人都在做金融。而現在,很多厲害的人都會優先去搞 AI。

你想想,未來十年,是金融更可能漲 100 倍,還是 AI?

答案顯然是 AI。

所以真正值得思考的問題不是要選大廠還是創業公司,而是你要不要做 AI。

曲凱:最后,你覺得未來 AI 公司的組織形態會是什麼樣?PM 和工程師的角色會發生什麼變化?

虞快:隨着 AI Coding 能力提升,寫代碼會越來越省時間。比如我現在在通勤路上想到一個點子,就會把需求丟給 Cursor,等到家時,它可能已經生成了一個初版。

所以未來,工程師更重要的能力不是寫代碼,而是要想清楚該做什麼、方向對不對。這種判斷往往來自客户反饋,所以工程師也應該重視和客户的交流。

反映到組織架構上,就是工程師和 PM 的邊界會越來越模糊,組織也會趨向扁平化。

這就要求公司有健康的激勵機制,管理層也要有識人能力,能看出誰真的在為公司思考。

42章經

思考事物本質

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。