他不追风口、不打营销，却把一家数据公司做到十亿美元级

AI PM 编辑部 · 2026年03月05日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在谈模型、算力和Scaling Laws时，Surge AI创始人Edwin Chen却反复强调一件“看起来很老派”的事：人类数据。他不玩硅谷式增长游戏，却做出了接近十亿美元规模的AI数据公司。这场对话，几乎每一句都在反击行业共识。

他不追风口、不打营销，却把一家数据公司做到十亿美元级

当所有人都在谈模型、算力和Scaling Laws时，Surge AI创始人Edwin Chen却反复强调一件“看起来很老派”的事：人类数据。他不玩硅谷式增长游戏，却做出了接近十亿美元规模的AI数据公司。这场对话，几乎每一句都在反击行业共识。

最反直觉的开场：AGI不是先把人“替换”掉

在访谈一开始被问到AGI时，Edwin给出的定义就让现场安静了几秒。他并不执着于“什么时候超过人类”，而更关心一件事：这些系统是否在帮我们做对的事。他直言不讳地说，很多AI产品正在“把人变懒”，而且是在优化错误目标的前提下。

这句话之所以刺耳，是因为它直接挑战了当下最主流的叙事：模型越强，人就越可以退场。Edwin的态度恰恰相反——AGI如果只是减少思考、放大捷径，那即使再聪明，也不是他想要的未来。这也为Surge AI后面所有决策埋下了伏笔。

从研究员到创业者：Surge AI诞生得异常“朴素”

Edwin的背景并不花哨。他在佛罗里达一个叫Crystal River的小镇长大，自称现在做的事，只是“小时候爱折腾的成人版本”。2020年，他还是一名研究人员，同一年，GPT-3发布。

关键转折点并不复杂：他意识到，模型能力的爆发，会立刻把“高质量数据”推到瓶颈位置。一个月后，Surge AI成立了。

没有宏大的使命宣言，也没有精心设计的融资故事。最早的客户，甚至是直接找上门，希望用更高质量的人类标注来加速研究。Surge从一开始就站在一个很清醒的位置：不是去“做模型”，而是成为模型背后最难、也最被低估的那一层。

99%留存率背后：他们刻意不玩“硅谷游戏”

访谈中一个很容易被忽略、但极其重要的细节是：Edwin说他们从来没有刻意追逐曝光、融资新闻或简历光环。很多早期客户，甚至是通过一篇新闻文章才“意外”被外界注意到。

结果呢？接近99%的客户留存率。

这不是靠低价，也不是靠绑定大厂，而是靠一件事：数据真的解决了问题。无论是搜索、研究，还是更复杂的任务型系统，Surge都在做同一件事——让数据本身更可靠，而不是更“多”。

在一个所有公司都急着讲“增长故事”的行业里，Surge反而选择了一条慢得多、但粘性极强的路。

为什么他反复提醒：别低估“人类数据”

当话题转向“Human-powered AI data company”时，Edwin的观点非常明确：行业系统性低估了人类在数据链条中的价值。

模型可以生成、可以合成、可以自举，但在复杂任务、推理边界、多模态场景下，人类判断仍然是质量天花板。他特别提到，很多团队在讨论未来时，过于关注模型结构，却忽略了“数据从哪来、是否可信、是否可复用”。

这也是Surge强调原则和流程的原因。他形容在Surge工作的体验是“世界上最好的工作之一”，不是因为轻松，而是因为你在和地球上最聪明的一批人一起，认真把一件难而重要的事做到极致。

多模态、长周期，以及数据层的真正未来

在访谈后半段，话题逐渐拉远：基准测试、leaderboard、RL环境、多模态。

Edwin反复回到一个关键词：时间尺度。短期看，大家都在拼demo和指标；长期看，真正决定AI系统上限的，是数据是否“聪明且有用”。尤其在多模态时代，文本、图像、行为信号交织在一起，数据质量的复杂度指数级上升。

他的判断很冷静：未来的数据层不会只是“供给”，而会成为AI系统设计的一部分。谁能在这个层面建立护城河，谁才真正站在长期一侧。

总结

这场对话真正的价值，不在于“Surge做到多大”，而在于它揭示了一条被忽视的路径：当全行业追逐模型能力时，有人选择把最脏、最慢、最难的基础工作做到极致。对AI从业者来说，这意味着两个行动点：第一，重新审视你所依赖的数据质量，而不是只盯着模型参数；第二，别低估长期主义在AI时代的回报。最后留一个问题：如果下一代AI的瓶颈不在算力，而在数据，你现在的选择，站对位置了吗？

关键词： Surge AI，人类数据， AGI，多模态， AI创业

事实核查备注：需要核查：1）Surge AI“十亿美元级”具体指估值、收入还是规模；2）Surge成立时间是否为2020年；3）GPT-3发布时间与Surge成立的时间关系；4）99%客户留存率的具体口径；5）Edwin Chen对AGI和‘让人变懒’的原话表述。

返回文章列表