他不追风口、不打营销,却把一家数据公司做到十亿美元级
正在加载视频...
视频章节
当所有人都在谈模型、算力和Scaling Laws时,Surge AI创始人Edwin Chen却反复强调一件“看起来很老派”的事:人类数据。他不玩硅谷式增长游戏,却做出了接近十亿美元规模的AI数据公司。这场对话,几乎每一句都在反击行业共识。
他不追风口、不打营销,却把一家数据公司做到十亿美元级
当所有人都在谈模型、算力和Scaling Laws时,Surge AI创始人Edwin Chen却反复强调一件“看起来很老派”的事:人类数据。他不玩硅谷式增长游戏,却做出了接近十亿美元规模的AI数据公司。这场对话,几乎每一句都在反击行业共识。
最反直觉的开场:AGI不是先把人“替换”掉
在访谈一开始被问到AGI时,Edwin给出的定义就让现场安静了几秒。他并不执着于“什么时候超过人类”,而更关心一件事:这些系统是否在帮我们做对的事。他直言不讳地说,很多AI产品正在“把人变懒”,而且是在优化错误目标的前提下。
这句话之所以刺耳,是因为它直接挑战了当下最主流的叙事:模型越强,人就越可以退场。Edwin的态度恰恰相反——AGI如果只是减少思考、放大捷径,那即使再聪明,也不是他想要的未来。这也为Surge AI后面所有决策埋下了伏笔。
从研究员到创业者:Surge AI诞生得异常“朴素”
Edwin的背景并不花哨。他在佛罗里达一个叫Crystal River的小镇长大,自称现在做的事,只是“小时候爱折腾的成人版本”。2020年,他还是一名研究人员,同一年,GPT-3发布。
关键转折点并不复杂:他意识到,模型能力的爆发,会立刻把“高质量数据”推到瓶颈位置。一个月后,Surge AI成立了。
没有宏大的使命宣言,也没有精心设计的融资故事。最早的客户,甚至是直接找上门,希望用更高质量的人类标注来加速研究。Surge从一开始就站在一个很清醒的位置:不是去“做模型”,而是成为模型背后最难、也最被低估的那一层。
99%留存率背后:他们刻意不玩“硅谷游戏”
访谈中一个很容易被忽略、但极其重要的细节是:Edwin说他们从来没有刻意追逐曝光、融资新闻或简历光环。很多早期客户,甚至是通过一篇新闻文章才“意外”被外界注意到。
结果呢?接近99%的客户留存率。
这不是靠低价,也不是靠绑定大厂,而是靠一件事:数据真的解决了问题。无论是搜索、研究,还是更复杂的任务型系统,Surge都在做同一件事——让数据本身更可靠,而不是更“多”。
在一个所有公司都急着讲“增长故事”的行业里,Surge反而选择了一条慢得多、但粘性极强的路。
为什么他反复提醒:别低估“人类数据”
当话题转向“Human-powered AI data company”时,Edwin的观点非常明确:行业系统性低估了人类在数据链条中的价值。
模型可以生成、可以合成、可以自举,但在复杂任务、推理边界、多模态场景下,人类判断仍然是质量天花板。他特别提到,很多团队在讨论未来时,过于关注模型结构,却忽略了“数据从哪来、是否可信、是否可复用”。
这也是Surge强调原则和流程的原因。他形容在Surge工作的体验是“世界上最好的工作之一”,不是因为轻松,而是因为你在和地球上最聪明的一批人一起,认真把一件难而重要的事做到极致。
多模态、长周期,以及数据层的真正未来
在访谈后半段,话题逐渐拉远:基准测试、leaderboard、RL环境、多模态。
Edwin反复回到一个关键词:时间尺度。短期看,大家都在拼demo和指标;长期看,真正决定AI系统上限的,是数据是否“聪明且有用”。尤其在多模态时代,文本、图像、行为信号交织在一起,数据质量的复杂度指数级上升。
他的判断很冷静:未来的数据层不会只是“供给”,而会成为AI系统设计的一部分。谁能在这个层面建立护城河,谁才真正站在长期一侧。
总结
这场对话真正的价值,不在于“Surge做到多大”,而在于它揭示了一条被忽视的路径:当全行业追逐模型能力时,有人选择把最脏、最慢、最难的基础工作做到极致。对AI从业者来说,这意味着两个行动点:第一,重新审视你所依赖的数据质量,而不是只盯着模型参数;第二,别低估长期主义在AI时代的回报。最后留一个问题:如果下一代AI的瓶颈不在算力,而在数据,你现在的选择,站对位置了吗?
关键词: Surge AI, 人类数据, AGI, 多模态, AI创业
事实核查备注: 需要核查:1)Surge AI“十亿美元级”具体指估值、收入还是规模;2)Surge成立时间是否为2020年;3)GPT-3发布时间与Surge成立的时间关系;4)99%客户留存率的具体口径;5)Edwin Chen对AGI和‘让人变懒’的原话表述。