Cursor突然放大招,DeepSeek追近Opus,这周AI工具的风向变了
这一周的AI圈有点不对劲:Cursor不再只是写代码的工具,DeepSeek被反复拿来和Opus对标,而Anthropic似乎成了最“坐立不安”的那一方。这不是零散更新,而是一条正在成形的趋势线。
这一周的AI圈有点不对劲:Cursor不再只是写代码的工具,DeepSeek被反复拿来和Opus对标,而Anthropic似乎成了最“坐立不安”的那一方。这不是零散更新,而是一条正在成形的趋势线。
大多数人以为,AI 编程助手的天花板就是“更会写代码”。但在这场 GitHub 的分享里,Microsoft 和 GitHub 直接掀桌子:未来的 Copilot,不是多聪明,而是能不能在聊天里直接跑 UI、画火焰图、让你点着用。这正是 MCP Apps 想解决的事。
Hermes Desktop 刚发布时,很多人以为它只是又一个“更好看的 AI 客户端”。但 Greg Isenberg 的这期视频,直接把问题抛到台面上:如果你用对了 Hermes Agent,它不是效率工具,而是一个 24 小时为你工作的系统。这篇文章,讲清楚为什么。
如果你以为评测(Evals)能客观告诉你模型好坏,这场演讲会让你不太舒服。Ara Khan 直接抛出结论:Evals 本身是“坏的”,但你不仅不能扔,还必须继续用——只是用法完全不是你想的那样。
如果让 AI Agent 真正走向商业世界,它们迟早要自己下单、付款、结算。但 Stripe 的 Steve Kaliski 在这场演讲里抛出一个反直觉的结论:问题不在于“机器人能不能付钱”,而在于“我们有没有把支付基础设施拆对”。这是一篇每个做 Agent、平台和工具的人都该读完的文章。
一家年收入破1亿美元的公司,起点并不是宏伟蓝图,而是连续半年的“随便试试”。YC 最新分享里,Emergent 团队讲清了一件反直觉的事:真正改变世界的软件,并不是从商业计划书里长出来的。
如果你还以为大模型的差距只来自参数量和算力,这期 Latent Space 会直接打脸你。视频里,一个反直觉的观点被反复强调:真正拉开编码模型差距的,不是模型本身,而是“你怎么用它”。甚至,通过一套被称为 Taste 的方法,开源模型也能在实战中压过闭源巨头。
大多数人做 Agent 界面时,第一反应是“更快、更省 token”。但来自 Google Chrome DevTools 团队的一个结论恰恰相反:如果你的 Agent 不知道自己在干什么,再高的效率都是浪费。这场演讲,拆穿了很多 Agent 产品正在犯的设计错误。
一个几乎不可能完成的成就:连续13周清空邮箱,而且是在下午2点。更反直觉的是,这不是时间管理技巧的胜利,而是AI真正开始“替人工作”的信号。这期视频展示了一个很多AI从业者忽略的现实:真正的生产力革命,可能先发生在你的收件箱里。
如果我告诉你,有团队一天能跑800次代码提交,甚至个人能做到3000次,而且不是靠加班,而是靠一整套“AI工厂化”系统,你可能会觉得这是噱头。但OpenClaw的Vincent Koc用一小时,把这件事讲清楚了:这不是运气,而是工程学的必然结果。