热门资讯> 正文
2025-09-25 21:00
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
最新消息,扎克伯格再次从OpenAI重磅挖角了一名华人研究员。
这次是——宋飏(Yang Song)!
宋飏,何许人也?
16岁裸分上清华的少年天才,扩散模型崛起&攻克扩散模型短板的关键贡献者之一,OpenAI战略探索团队的带队人。
这次是真的要用“震惊”来表达我内心的感受了(吃惊脸.jpg)……
翻看他本人在𝕏上的最新一篇推文,还是上个月因GPT-OSS而激动。
现在再听闻他的消息,已经是宋飏于本月初转会至Meta的MSL旗下,向MSL首席科学家赵晟佳汇报。
他被撬动这件事,咱听到后脱口而出一句“震惊”真不是夸张,而且相信大部分人听到这个消息几乎第一反应都这样。
业内人士称他是Meta从OpenAI挖来的最强大脑之一,还说“很多OpenAI的朋友得知他离开,都惊呆了”。
Meta前前后后不停歇挖来的这么多牛人,他们到底看中的是什么?
有网友评价道,他们并非纯粹为了金钱利益,“一旦你达到一定的财富水平,金钱就不再驱动你的决策”——尤其是对于那些在OpenAI工作了3年以上的员工来说。
持续攻克扩散模型短板
宋飏于2022年博士毕业后加入OpenAI,担任研究科学家,至今3年零2个月。
他的核心研究方向是提升模型处理大规模、复杂、多模态数据集的能力,以及探索如何让模型在不同模态(图像、文本、代码等)之间进行更高效、更智能的交互。
离开OpenAI前,宋飏是公司战略探索团队(Strategic Explorations Team)的负责人。
这个团队没有具体的成立时间,是作为OpenAI整体组织的一部分从公司成立以来逐步发展起来的,主要负责前瞻性研究方向探索,重点在模型能力拓展、跨模态数据处理等。
在OpenAI期间,宋飏最出名的成果是一致性模型。
2023年4月,宋飏、清华校友路橙以及Ilya等开源了比扩散模型更快、性能更好的一致性模型Consistency Models,只需要3.5秒左右就能生成64张左右256×256的图像。
去年10月,宋飏和路橙再次简化了一致性模型,提出改进版的连续时间一致性模型(Continuous-Time Consistency Models),解决了早期一致性模型在稳定性和可扩展性上的问题。
仅用两步采样,就能让生成质量与扩散模型结果相媲美,同时生成图像的速度是扩散模型的50倍。
他们成功将连续时间一致性模型的训练规模扩展到了前所未有的15亿参数,并实现了在512×512分辨率的ImageNet数据集上的训练。
基于这项研究,在单张A100 GPU上,参数15亿的模型无需任何推理优化,即可在0.11秒内生成一个样本。
这两篇论文和开源代码被大量引用,是近两年生成模型领域的明星成果。
业内有讨论称,这个方向有可能成为“有可能终结扩散模型”的新方向。
但要知道,在此之前,同样也是因为宋飏的工作,才出现了扩散模型如DALL-E 2、Stable Diffusion、Imagen的狂潮。
扩散模型崛起的关键人物之一
来到OpenAI之前,宋飏在斯坦福大学攻读计算机博士,师从斯坦福计算机系副教授Stefano Ermon。
这位导师团队曾连续两年获得ICLR杰出论文奖。
其中一次,一作正是宋飏。
而要被视作为扩散模型提供早期贡献的,还要属被NeurIPS 2019接收并做口头报告的工作《Generative Modeling by Estimating Gradients of the Data Distribution》。
当时,GAN还在以逼真生成风格席卷全球,但众多科学家仍受困于很难训练、无法完整采样等难题。
斯坦福大学博士后Sohl-Dickstein受物理学启发,利用扩散原理开发了生成建模算法——
类似于从一滴墨水变成漫射淡蓝色的水,首先将训练数据集中的复杂图像转化为简单的噪声,然后教系统如何反转这个过程,将噪声转化为图像。
如此一来就能实现对整个分布进行采样。
但当时,这样做会让训练过程太慢,性能效果也远远落后于GAN。
这时候,宋飏和他的导师Stefano Ermon出现了。
他们提出了一种新方法,不估计数据的概率分布,而是估计分布的梯度,最终效果实现了对GAN的超越。
不过,后来宋飏坦言:
当时根本不知道扩散模型。
他本人是在论文发布后,从Sohl-Dickstein的邮件才知道,自己的研究与扩散模型有非常紧密的联系。
在此前,宋飏都不知道这场受物理学启发的扩散模型风潮,会和自己有关,并成为显学。
16岁裸分上清华的少年天才
不过说来有趣,早在高中时期,宋飏就展现了他在物理和信息学方面的天赋。
宋飏高中时期就读于江苏省新海高级中学,获得过全国物理奥赛、信息学奥赛的一等奖。
14岁时,他在清华推荐生面试现场,有一段经典的排比句自我介绍:
我是奥赛宋飏,我获得了物理以及信息学的全国一等奖;
我是标兵宋飏,我的理想是做一名物理学家,现在我已经自学了高校里的高等数学以及普通物理学;
我还是文艺宋飏,我已经通过了钢琴十级考试,在班级的羽毛球对抗赛上,也有我活跃的身影。
最终,他以17位评委全票通过的成绩,入选“清华大学新百年领军计划”。
次年高考时,他考出425分的裸分成绩,以连云港市理科状元的身份入读清华大学数理基础科学班。
这个成绩也超出他自己的估分,称“我觉得也就在400分左右吧,完全出乎意料”。
本科时期,宋飏跟从清华计算机科学与技术系教授朱军学习。
并与Raquel Urtasun(多伦多大学计算机科学系教授)和Richard Zemel(曾在多伦多大学和哥伦比亚大学任教)等学术大咖有过学术合作。
2016年,宋飏从清华毕业,拿下数学与物理本科学位,此后赴斯坦福深造。
读博期间,他在微软、Uber、Google都有过实习经历。
等到博士毕业,他就被OpenAi收入囊中了。
截至本文推送,宋飏的领英和𝕏页面都还保持在“于OpenAI工作”的状态。
One More Thing
现在,宋飏在Meta MSL的+1是赵晟佳。
过去十余年间,他俩之间真的十分有缘——
同是清华校友,同在斯坦福师从Stefano Ermon,同在OpenAI工作。
现在,两人又先后跳槽,变成了小扎的心腹大将。
妙啊,妙。
参考链接:
[1]https://mp.weixin.qq.com/s/3h_mxCij5_owicnfsHhp_Q
[2]https://www.wired.com/story/meta-poaches-openai-researcher-yang-song/
[3]https://x.com/Yuchenj_UW/status/1971088866095603858
[4]https://www.linkedin.com/in/yang-song-machine-learning/details/experience/
[5]https://openreview.net/pdf/ef0eadbe07115b0853e964f17aa09d811cd490f1.pdf?ref=news-tutorials-ai-research
(声明:本文仅代表作者观点,不代表新浪网立场。)