软件的三次进化：Andrej Karpathy谈AI时代的程序员新机遇

AI PM 编辑部 · 2025年06月19日 · 25 阅读 · AI/人工智能

吴恩达 Andrej Karpathy 对话AI GPU Transformer AI应用模型部署目标检测提示工程操作系统

正在加载视频...

视频章节

本文基于Andrej Karpathy在Y Combinator的演讲，深入解析了软件从传统编程到神经网络、再到大语言模型（LLM）驱动的三次范式转变，结合他在Tesla和个人项目中的真实经历，揭示AI如何重塑开发者角色、软件生态与未来机会。

软件的三次进化：Andrej Karpathy谈AI时代的程序员新机遇

本文基于Andrej Karpathy在Y Combinator的演讲，深入解析了软件从传统编程到神经网络、再到大语言模型（LLM）驱动的三次范式转变，结合他在Tesla和个人项目中的真实经历，揭示AI如何重塑开发者角色、软件生态与未来机会。

软件的三次范式转变：从代码到“用英语编程”

软件行业正经历前所未有的剧变。Andrej Karpathy以“软件正在再次改变”为主题，提出了软件发展的三大阶段：1.0（传统代码）、2.0（神经网络权重）、3.0（用自然语言驱动的大语言模型）。他回顾了自己在Tesla Autopilot团队的经历，见证了C++代码被神经网络逐步取代的过程：“软件2.0堆栈字面意义上吞噬了Autopilot的软件堆栈。”

Karpathy强调，软件3.0的最大突破是“我们现在用英语编程了”。他曾在社交媒体上感慨：“令人惊讶的是，我们现在用英语编程计算机。”这种范式让软件开发门槛骤降，每个人都能成为“程序员”。

他还用GitHub、Hugging Face等平台做类比，指出软件1.0和2.0各有自己的“代码仓库”，而3.0则是prompt（提示词）成为新的“代码”，LLM成为全新可编程计算机。

LLM：新一代操作系统，还是智能公用事业？

为什么LLM不仅仅是工具？Karpathy用一连串生动的比喻解读：他引用吴恩达的“AI是新电力”，指出LLM实验室（如OpenAI、Anthropic、Google等）正像电力公司一样，投入巨额资本（capex）训练模型，再通过API像公用事业一样向全球分发智能。

但他进一步指出，LLM更像“新一代操作系统”。“LLM就像1960年代的操作系统，我们正在重做一遍计算。”他分析了当前LLM生态的集中化（云端推理、批量共享计算资源），并预测“个人计算机革命”尚未到来，未来或许会有本地化LLM的机会。

Karpathy还敏锐地观察到，LLM的普及路径与以往技术相反——不是先军用、后民用，而是“LLM首先帮助我们煮鸡蛋，而不是政府搞弹道导弹”。他认为，LLM的“终端用户先行”特性，将深刻影响未来AI应用的形态和爆发点。

与“人类精神”共事：LLM的能力与缺陷

Karpathy将LLM比作“人类精神的随机模拟器”，它们拥有超越人类的记忆力，却也有独特的“认知缺陷”。他用电影《Rainman》形容LLM的记忆力：“它们能记住SHA哈希和各种细节，远超任何个人。”但与此同时，LLM也会“幻觉”（hallucinate）、犯低级错误，缺乏持续学习能力（“前向性遗忘”），更容易受到提示注入等安全威胁。

他提醒开发者：“你必须同时考虑这种超人能力和一堆认知缺陷，如何编程、如何规避风险、如何发挥其优势。”

Karpathy还用《记忆碎片》《初恋50次》等电影类比LLM的“上下文窗口”限制——每次对话都像“每天醒来都失忆”，无法像人类同事那样积累组织知识。这些细节提醒我们，LLM虽强大，但需要全新的协作和工程方法。

部分自治应用：人机共舞的新范式

AI Agent（智能体）和部分自治软件是Karpathy最看好的应用方向。他以代码助手Cursor和问答工具Perplexity为例，分析了“自治滑块”（autonomy slider）的重要性——用户可以自由选择AI介入的深度，从代码补全到全自动修改，灵活控制。

他强调，优秀的LLM应用必须具备：1）高效的上下文管理；2）多模型协同；3）专用GUI（图形界面）以便人类审核；4）自治滑块，便于用户调节AI权限。“我们现在和AI协作，AI负责生成，人类负责验证。让这个循环越快越好。”

Karpathy还分享了自己在Tesla和Waymo体验自动驾驶的故事。2013年，他曾在Palo Alto试驾Waymo无人车，30分钟零干预让他以为“自动驾驶即将到来”，但12年后行业仍在攻坚。他借此提醒AI Agent的现实挑战：“这不是2025年Agent元年，而是Agent的十年。我们需要人类在环，不能操之过急。”

他用“Iron Man战衣”做比喻：“现在更像是Iron Man的战衣，而不是Iron Man机器人。我们要做的是增强人类，而不是完全交给AI。”

“Vibe Coding”与为Agent而建：人人皆可编程的新世界

LLM让“人人皆可编程”成为现实。Karpathy自嘲地讲述了“vibe coding”一词的流行——即用自然语言和AI“随性编程”。他分享了自己不会Swift，却用LLM一天内做出iOS App的经历，以及开发菜单图片生成应用Menu Genen的故事：“代码部分很容易，真正难的是上线、认证、支付等‘点点点’的DevOps流程。”

他由此提出新问题：“能不能为Agent直接构建软件，让AI自己去点这些按钮？”他建议开发者为AI Agent优化文档和接口，比如用markdown而非HTML，提供curl命令而非“点击”指令。Stripe、Vercel等公司已开始为LLM重写文档，Anthropic也推出了Model Context Protocol。

Karpathy还推荐了如get-ingest、deep wiki等工具，帮助开发者一键将GitHub项目转化为LLM友好的输入。他强调：“我们要主动迎合Agent，未来的软件既要服务人，也要服务AI Agent。”

总结

AI和大语言模型正推动软件行业进入全新纪元。Karpathy的洞见提醒我们：未来十年既是技术范式转变的窗口，也是开发者重新定义自身角色的机会。无论是部分自治的AI应用，还是人人皆可参与的“vibe coding”，都预示着一个人机协作、持续进化的软件世界。对每一位开发者而言，现在正是投身其中、共同塑造未来的最佳时机。

关键词： Andrej Karpathy，大语言模型， AI Agent，软件3.0， vibe coding

事实核查备注：关键事实包括：Andrej Karpathy（前Tesla AI负责人）、吴恩达（Andrew Ng）引用、软件1.0/2.0/3.0分层、GitHub/Hugging Face/Flux/LLM等产品名、Cursor、Perplexity、Menu Genen等具体案例、2013年Waymo无人车试驾、Iron Man战衣比喻、Stripe/Vercel/Anthropic/Model Context Protocol、get-ingest、deep wiki等工具名称。

返回文章列表