40 tok/s 跑在 iPhone 上:Gemma 4 让大模型第一次真正“贴身”
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
如果你还以为 Deep Research Agent 只是把 Prompt 写长一点、模型串多一点,那这场 1 小时 50 分钟的工作坊会直接打脸。AI Engineer 团队现场拆解了他们如何从“几乎没价值的输出”,一步步构建出真正能产出可用研究结果的 Agent 系统,而且过程比你想象得更残酷、更工程化。
最近一个名字在 AI 圈反复出现:Hermes Agent。它被称为“OpenClaw killer”,主打自我学习、内置记忆、可扩展技能,甚至能跑在 Android 手机上。这期视频第一次把它从“传说”拉到“可落地”,一步步告诉你它到底强在哪。
同样是AI浪潮,有人用数据反击“末日论”,有人用危机感重塑组织。Salesforce和Verizon两位CEO的截然不同判断,正在影响SaaS、就业、Agent产品和企业预算的走向。这期节目信息密度极高,几乎每一段都在改写从业者的默认认知。
这期 Latent Space 的对话抛出一个刺痛行业的观点:癌症药物失败,问题不只在分子,而在我们用来“理解生物”的模型。Noetik 选择了一条最贵、最慢、也最反直觉的路——自己建实验室,用 Transformer 和计算机视觉,从真实肿瘤数据里逼近答案。
一周前发布的Gemma 4,没有靠更大的参数震撼行业,却用“完全离线、跑在手机上、Apache 2开源许可”这三件事,重新定义了什么叫真正可用的开源大模型。这不是一次常规更新,而是一种路线选择。
如果你还在把 AI 当成“更聪明的功能”,那你已经落后了。Vercel CTO Malte Ubl 在欧洲首届 AI Engineer 大会上抛出一个极具冲击力的判断:我们正在进入一个全新的应用层,软件的主要用户和构建者,都不再是人类。
真正把 AI 用到极致的公司,早就不再把它当“写代码工具”。咨询研究给出一个反直觉的数据:50% 的 AI 使用,和编程无关。领先者的差距,不在模型,而在组织、结构和接口设计。
在扎克伯格最早的创业屋里,一场长达4小时的对话,把数学、直觉、证明与AI放在同一张手术台上解剖。Carina Hong 的核心观点极其反直觉:数学不只属于天才,也不只属于人类,而AI正在逼我们重新理解“理解”本身。
这不是一条普通的编程教学视频。Riley Brown 用一整套 Codex 实操,悄悄展示了一种全新的工作方式:你不再“写完代码再做产品”,而是让 AI 贯穿从想法、设计、自动化到上线的每一步。这条视频真正炸裂的地方,很多人其实看漏了。