从MIT到Anthropic:AI基础设施、创业心态与Claude Code的崛起

AI PM 编辑部 · 2025年08月19日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

本文深度还原Anthropic联合创始人Tom Brown的创业历程,揭示大模型行业的技术演进、团队文化与产品突围。你将看到Claude Code如何成为开发者新宠,以及AI基础设施背后的惊人扩张与挑战。

从MIT到Anthropic:AI基础设施、创业心态与Claude Code的崛起

本文深度还原Anthropic联合创始人Tom Brown的创业历程,揭示大模型行业的技术演进、团队文化与产品突围。你将看到Claude Code如何成为开发者新宠,以及AI基础设施背后的惊人扩张与挑战。

“狼性”创业:从MIT到AI前沿的曲折之路

每一个AI创业者都在寻找属于自己的突破口。Tom Brown的故事,正是从“被动等待任务”到主动“狩猎”的转变。他回忆道,早年在MIT毕业后,加入朋友的YC创业公司linked language,虽然技术不成熟,但团队氛围极具挑战性:“公司会默认死掉,没人告诉我们要做什么,我们得自己去‘狩猎’生存。”这种“狼性”心态,成为他后续创业和技术突破的底色。

Tom并非一帆风顺。参与Mopub、Grouper等项目时,他坦言自己编程能力有限,甚至在Grouper期间因业务下滑而极度疲惫——“我主要工作还是招工程师,要推销一个我自己都不再相信的梦想”。但正是这些失败和转折,让他在后来的OpenAI、Anthropic团队中,拥有了更强的韧性和使命感。

技术跃迁:从GPT-2到GPT-3的规模化与基础设施革命

大模型的进化,离不开底层技术的突破。Tom Brown在OpenAI的经历,是行业转折的缩影。他曾负责GPT-3的训练工程,将架构从TPU(谷歌的专用AI芯片)迁移到GPU(通用图形处理器),原因在于PyTorch在GPU上的软件生态远优于TensorFlow在TPU上的表现。这一决策直接加速了模型迭代和实验效率。

Tom强调,“只要有正确的配方,投入更多算力就能获得更强智能”,这正是Scaling Laws(扩展定律)的核心。他回忆道:“12个数量级的直线趋势,我以前从没见过,这让我彻底转向规模化。”尽管外界批评“只是砸钱堆算力”,但事实证明,这种“做蠢事但有效”的方法推动了GPT-3的诞生,也成为Anthropic后续技术战略的基础。

使命驱动与团队文化:Anthropic的独特组织基因

在AI安全和对齐(Alignment)成为行业焦点的背景下,Anthropic的团队文化格外突出。Tom Brown回忆,Anthropic最初由OpenAI分拆出来的七位联合创始人组成,大家都为使命而来:“所有最初加入的人都可以在别处获得更多金钱和声望,但他们选择了这里。”

Anthropic坚持“全员Slack公开沟通”,前100名员工都以使命为核心,确保组织在快速扩张(现已2000人)时依然保持透明和高效。Tom认为,这种文化是公司能够在OpenAI巨额资金和明星效应下突围的关键:“如果有人偏离了使命,大家会主动指出。”

这种使命感也体现在产品决策上。Anthropic在Claude 1推出前,曾因不确定产品是否对世界有益而迟疑,甚至一度没有完善的服务基础设施。直到Claude 3.5 Sonnet和Claude Code在代码生成领域取得突破,团队才真正意识到自己的产品力。

Claude Code的崛起:开发者体验与“模型为用户”的新范式

2024年,Claude 3.5 Sonnet和Claude Code在开发者社区爆红,成为YC创业者的首选代码模型。Tom坦言,这一切并非预设:“我们只是想让模型在代码上更强,没想到市场反响如此巨大。”他分享了一个令人惊讶的案例——有用户让Claude对二进制文件进行反汇编,Claude竟能在10分钟内生成C语言版本,令专业工程师都自愧不如。

Anthropic的产品策略与众不同:他们不“教模型考试”,而是通过内部评测和大量“狗粮测试”(dogfooding),让模型真正服务于工程师。更重要的是,团队将“Claude本身”视为产品的用户,专注于为模型提供最佳工具和上下文。这种“模型为用户”的思路,让Claude Code在工具调用和Agent(智能体)领域表现突出,也为开发者打造AI应用提供了新范式。Tom总结道:“我们是最关注开发者、最API导向的实验室。”

AI基础设施的极限扩张:算力、芯片与能源的全球竞赛

AI的未来不仅是算法,更是基础设施的比拼。Tom Brown负责Anthropic的算力体系,他直言:“人类正走向史上最大规模的基础设施建设,比阿波罗计划和曼哈顿计划还要大。”目前,AGI(通用人工智能)算力投入每年增长3倍,电力和硬件成为最大瓶颈。

Anthropic采用多芯片策略——同时用GPU、TPU和Tranium,虽然增加了工程复杂度,但能灵活匹配训练与推理需求。Tom指出,未来数据中心、电力(尤其美国的电力和核能)将是行业的关键制约因素。YC内部甚至出现了“算力抢购潮”,创业者们“永远不够用”。

这种基础设施能力,正是Tom在OpenAI推动GPU转型的经验积累,如今在Anthropic以更大规模重现。他强调,只有打造高效的软件栈,让底层平台支持快速迭代,才能让AI真正释放生产力。

总结

Tom Brown的经历证明,AI行业的突破不仅依赖技术,更取决于团队心态、使命驱动和对用户需求的深刻理解。从“狼性”创业到Claude Code的爆发,再到全球算力基础设施的竞赛,每一步都充满了意外与挑战。对于想要投身AI革命的年轻人,Tom的建议是:“多冒险,做让自己和朋友都为之骄傲的事。”在AI变革的洪流中,最重要的是找到属于自己的使命和价值。


关键词: Anthropic, Claude Code, GPT-3, Scaling Laws, AI基础设施, 创业故事, 模型训练, GPU, API, AI Agent

事实核查备注: 人名:Tom Brown, Greg Brockman, Dario Amodei, Elon Musk, Daniela Amodei;公司:Anthropic, OpenAI, Google DeepMind, Y Combinator, Google, Cursor;产品:Claude, Claude Code, Claude 3.5 Sonnet, GPT-3, GPT-2, ChatGPT, Cursor;技术名词:Scaling Laws, GPU, TPU, Tranium, PyTorch, TensorFlow, API, Agent, 代码生成;数字:Anthropic现有约2000人,AGI算力投入每年增长3倍,GPT-3训练时期为2018-2019年,Claude Code在YC开发者中代码生成领域占有率高达80-90%。