Pydantic 作者在生产环境玩“进化论”:AI Agent 其实是这样被优化出来的
大多数人还在 Prompt 上反复手调,Pydantic 创始人 Samuel Colvin 已经在生产环境里“养”AI Agent 了:跑评测、做对比、用类似进化算法的方法自动找更好的提示词。这场分享把一个残酷现实讲透了——Agent 真正难的,不是写代码,而是如何在真实世界持续变聪明。
大多数人还在 Prompt 上反复手调,Pydantic 创始人 Samuel Colvin 已经在生产环境里“养”AI Agent 了:跑评测、做对比、用类似进化算法的方法自动找更好的提示词。这场分享把一个残酷现实讲透了——Agent 真正难的,不是写代码,而是如何在真实世界持续变聪明。
一位研究黑洞与量子场论的顶级物理学家,亲自测试 GPT‑5 后给出结论:它已经能做“Vibe Physics”。不是推导公式,而是抓住物理直觉。这次分享,意外揭示了 AI 正在如何改变科研方式,以及提示工程为什么开始变成一种“科学方法”。
这不是一次“AI 画图”的演示,而是一条真正跑通的设计到代码闭环:AI 读代码、写 Figma、再把修改直接变成 PR。更反直觉的是,最容易翻车的地方不是生成质量,而是一个被无数人忽略的认证步骤。
当大多数人还在卷提示词技巧时,Patrick Debois 抛出一个反直觉观点:真正决定 AI 工程质量的,不是 prompt,而是你如何“开发、测试、复用上下文”。这场演讲,把提示工程从手艺活,推向了一套工程化方法。
当所有人都在吹嘘“全自动AI Agent”时,Liam McGarrigle在这场超过1小时的工作坊里,反其道而行:他反复强调,人类不该被踢出系统。真正能上线、能扩展、能让人睡得着觉的AI自动化,必须有人类在环。这不是保守,而是现实。
大多数 AI 工具还被关在侧边栏里当“助手”,这场演示却做了一个反直觉的决定:把 Agent 直接丢进画布。不是多一个功能,而是换一套思维方式——这可能会改变你对提示工程和人机协作的理解。
如果你还以为复杂功能必须靠复杂代码,David Gomes 这场分享会让你坐不住。Cursor 团队用一个 200 行的 Markdown Skill,替换掉了 1.2 万行代码、无数依赖和测试——而且功能还活得更好。
如果你还把互联网的用户理解为“人”,那你已经落后了。Stripe 在内部看到一个惊人的变化:AI Agent 正在成为新的主要经济参与者,甚至开始像人一样“刷接口、薅试用、搞欺诈”。这期视频从支付基础设施的第一线,揭开了 Agent Economy 最真实、也最危险的一面。
如果你以为这只是一期杂谈节目,那你会错过太多猛料:美国正在逼近“车内AI监控”时间表、AI Agent从玩具走向生产系统、OpenAI的Goblin Mode暗示提示工程正在失效,而Blackstone管理着1.3万亿美元的掌门人,正在用一种极其冷静的方式重新下注AI与基础设施。
当所有人都在追逐“一个人+一堆AI Agent=一支团队”时,GitHub Next 的 Maggie Appleton 站出来泼了盆冷水:真正拖垮团队的,从来不是写代码慢,而是没人对“该不该做”达成一致。这场演讲,几乎是在否定当下最流行的 Agent 使用方式。