40 tok/s 跑在 iPhone 上:Gemma 4 让大模型第一次真正“贴身”
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。
在 Latent Space 的这期访谈里,Mistral 团队抛出了一个让很多企业不舒服的观点:你用得越多闭源模型,手里沉淀多年的私有数据价值就越被浪费。同时,他们正式发布了自家的语音生成模型 Voxal(或 Voxtral)TTS,并罕见地深入讲清了音频模型在架构、token 与部署层面的真实难题。
过去三年,ChatGPT几乎成了AI的代名词。但这支视频抛出一个刺眼的信号:Claude正在用一整套“Agent化”的更新,悄悄改变竞争规则。从OpenClaw的诞生到Claude Co-work的研究预览,这不只是功能更新,而是产品方向的转向。
“我觉得 AI 很混乱。”这是 Greg Isenberg 在这期 59 分钟大师课里的第一句话,也是一句让无数从业者沉默的实话。Agent、MCP、技能、记忆、工具权限——这些被包装成“未来工作方式”的概念,其实大多数人并没真正搞懂。这篇文章带你把 AI Agent 拆到不能再拆,看看真正有用的到底是什么。
如果你觉得AI行业已经没什么新鲜事了,这期TBPN会狠狠打你的脸:Meta悄悄收购社区产品、NVIDIA持续押注新一代模型公司、Claude开始“教你改代码”,而AI写作的风向,正在发生一次危险又真实的反转。
如果你还在纠结谁会赢下大模型之战,这期 a16z 给了一个更冷静、也更残酷的答案:模型只是起点,真正拉开差距的是分发、上下文和平台锁定。从 ChatGPT、Claude、Gemini 的分化,到 Agent、语音、AI 浏览器的崛起,这份 Top 100 报告讲清了消费级 AI 下一阶段的胜负手。
一个几乎没有团队的创始人,用一个AI产品,在短短一个月内跑到100万美元ARR。更反直觉的是:他不是在“做工具”,而是在把“公司本身”交给AI运行。这期 Latent Space 的对话,几乎是一次关于“自运行公司”未来的现场演示。
这不是又一个聊天机器人。Greg Isenberg第一次上手 Perplexity Computer,就让它自动找CEO、写邮件、做竞品监控、盯投资人,还真的把邮件发出去了。更炸的是:它不是“工具”,而是开始接管原本属于人的整套工作流。
当所有人都在谈 AGI、AI Agent 和代码自动化时,TBPN 却泼了一盆冷水:AI 之所以“还没炸”,不是能力不行,而是最基础的产品体验没做好。这支视频点破了几个被忽视、却足以引爆下一轮用户增长的关键细节。