Karpathy 最新反思:Vibe Coding 之后,真正的战场叫 Agentic Engineering
如果你还在纠结 Prompt 怎么写得更“优雅”,那你可能已经落后了。Andrej Karpathy 在这场分享里,把注意力从“怎么和模型聊天”,推到了一个更硬核的问题:当 LLM 变成一种新型计算机,我们到底该如何工程化它?从 Vibe Coding 到 Agentic Engineering,这不是概念升级,而是整个工作方式的转向。
如果你还在纠结 Prompt 怎么写得更“优雅”,那你可能已经落后了。Andrej Karpathy 在这场分享里,把注意力从“怎么和模型聊天”,推到了一个更硬核的问题:当 LLM 变成一种新型计算机,我们到底该如何工程化它?从 Vibe Coding 到 Agentic Engineering,这不是概念升级,而是整个工作方式的转向。
如果你以为AGI的关键在算力或参数规模,这场对话会直接打脸。Demis Hassabis反复强调三件反直觉的事:AI想走远,得先在“没用”的游戏里折腾;创业和科研,最怕不是慢,而是走得太超前;真正的爆发点,不在互联网,而在科学本身。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。
如果你还以为“做AI应用”等于调模型参数,这场来自Google DeepMind的演示会让你彻底改观。Paige Bailey用一小时,把多模态模型、AI Studio、世界模型和一键部署串成了一条几乎不用写代码的生产线。
如果你还只把Google的AI理解为Gemini,那你已经错过了它真正锋利的部分。Peter Yang 用16分钟点名了5个来自 Google Labs 的“冷门武器”:它们不够成熟,却极具方向性,甚至暴露了Google在AI战略上的野心与短板。这篇文章,帮你一次看懂它们为什么值得关注。
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
很多人以为 Codex 只是“更会写代码的 ChatGPT”,但视频里真正炸裂的一点是:Codex 被定位成一个能直接控制你电脑、管理文件、记住长期上下文、还能自动化工作的 AI Agent 超级应用。看完你会明白,为什么它更像一个能长期共事的 AI 同事,而不是聊天工具。
如果你以为 AI 最大的风险还在模型失控,那你可能低估了一件正在逼近的事:车内监控。TBPN 在这期节目里抛出的观点很直接——相比遥远的通用智能,车内的摄像头和麦克风,才是最容易引爆社会情绪、也最难回头的 AI 应用。
如果你以为这只是一期杂谈节目,那你会错过太多猛料:美国正在逼近“车内AI监控”时间表、AI Agent从玩具走向生产系统、OpenAI的Goblin Mode暗示提示工程正在失效,而Blackstone管理着1.3万亿美元的掌门人,正在用一种极其冷静的方式重新下注AI与基础设施。
很多人以为“软件工厂”就是让 AI 自动写代码。Eric Zakariasson 在这场分享里却反着来:真正决定工厂能不能跑下去的,不是模型多强,而是你给它加了多少“不许做错事”的约束。这是一套明显和当下狂热氛围相反的方法论。