Google最强模型不是Gemini:他们为什么押注“你能拥有的AI”
在这场来自 Google DeepMind 的分享里,一个反直觉的结论被反复强调:最强的模型,未必是最适合你的模型。Gemini 很强,但真正改变工程实践的,可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。
在这场来自 Google DeepMind 的分享里,一个反直觉的结论被反复强调:最强的模型,未必是最适合你的模型。Gemini 很强,但真正改变工程实践的,可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。
很多人以为 AI Agent 的关键在模型、在工具,Ras Mic 却反着来:真正拉开差距的,是你怎么“喂”模型。这个视频里,他拆解了自己每天都在用的3个技能,以及一个被严重误解的 agents.md 文件,用 53 个 token 干掉 900 多个 token,直接把上下文窗口变成生产力。
在 Alchemy 负责产品的 Matias Castello 不是工程师出身,却用 AI 把“个人生产力”和“团队交付速度”推到一个反直觉的新高度:事故能被提前抓住、原本一年半的项目一周完成、甚至在 Apple Watch 上用语音派发编程任务。这期 Builders Unscripted,信息密度极高。
一位 Sentry 高级工程师公开承认:从 2025 年 12 月开始,她几乎不再亲手写代码。更反直觉的是,她的效率和影响力反而大幅提升。她用一组真实数据,颠覆了整个 AI 编程圈最流行的幻想。
GitHub 正在迎来史上最疯狂的代码增长期:一年 140 亿次提交,其中大量由 AI 共同完成。但更大的问题来了——代码更多,开发者真的更高效了吗?微软开发者布道师 Marlene Mhangami 用一场 Playwright 实战演示,给了一个让很多人不太舒服、却极其重要的答案。
Manus为什么能在发布后迅速引爆市场、候补名单破百万、邀请码被炒到高价?答案不在模型参数,而在一次临时决定的产品视频、一个“让AI自己动手”的设计理念,以及一套完全不同于传统软件的产品方法论。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
Nikesh Arora 抛出一个让安全圈不寒而栗的判断:AI 并没有制造新的漏洞,它只是把人类几十年写下的烂代码一次性“点亮”了。更糟的是,企业甚至不知道自己部署了多少模型、更不知道它们安不安全。这场 AI 网络安全危机,已经不是未来式。
Anthropic 刚刚公开了一件让安全圈后背发凉的事:他们的模型在几周内找到的漏洞,比一位资深安全研究员一辈子发现的还多,其中甚至包括潜伏了27年的操作系统级漏洞。这不是炫技,而是一个信号——AI 已经开始系统性改变网络安全的攻防平衡。
Anthropic 再次“手滑”泄露 Claude Code 源码,有人只是围观,而 Riley Brown 直接下载、拆解、改人格、换UI,甚至做成桌面应用。这不是黑客炫技,而是一堂关于“AI Agent到底是怎么被造出来的”公开课。