40 tok/s 跑在 iPhone 上:Gemma 4 让大模型第一次真正“贴身”
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
如果你还以为AI赛道的主角只有OpenAI,这条消息可能会让你愣住:Anthropic的年化收入已经冲到30亿美元,并在统计口径上反超OpenAI。更关键的是,这不是一次偶然爆发,而是一整套商业、算力和客户结构同时拐点的结果。
当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。
一个几乎没有团队的创始人,用一个AI产品,在短短一个月内跑到100万美元ARR。更反直觉的是:他不是在“做工具”,而是在把“公司本身”交给AI运行。这期 Latent Space 的对话,几乎是一次关于“自运行公司”未来的现场演示。
2026年的CES释放出一个清晰信号:AI不再只是被塞进各种奇怪硬件里的噱头,而是由芯片巨头、平台公司和终端厂商共同推动的系统性变革。本文基于《AI Daily Brief》的观察,带你理解这场“基调转变”背后的真实含义。
当所有人都在争论AI设备该长什么样时,这期视频给出了一个反直觉的答案:真正重要的也许不是新形态,而是被忽视的旧形态。通过对OpenAI、Meta、Google和Apple不同路径的对比,演讲者提出了一个耐人寻味的判断——苹果看似落后的AI表现,反而可能孕育着下一代AI设备的“特洛伊木马”。
如果你还把 AI 编程理解为“自动补全”,这期 OpenAI 播客会让你彻底改观。Greg Brockman 首次系统讲述 Codex 的来路、Copilot 的血泪经验,以及 OpenAI 为什么把“agentic software engineer”当成终极目标。
这期《AI Daily Brief》表面上是几条分散的AI新闻,背后却指向同一个趋势:AI正在从“技术竞赛”转变为“全价值链重构”。从大众汽车喊出“没有流程不使用AI”,到云巨头用合同堆出未来五年的收入,再到苹果刻意低调却提前铺好硬件底座,这是一场节奏各异、但方向高度一致的产业转向。
这期《AI Daily Brief》看似是几条日常新闻,却串起了一个清晰信号:AI产品正在从“能用”走向“好用、常用、离不开”。无论是ChatGPT的分叉对话、Vibe编码的新指标,还是本地模型和AI浏览器,这些变化都指向同一件事——对上下文、工作流和真实使用场景的重新争夺。
在这期 No Priors 播客中,Cloudflare 联合创始人兼 CEO Matthew Prince 从“互联网交通警察”的独特位置出发,谈了 AI 正在如何重塑搜索、内容经济和网络架构。这不仅是对技术趋势的判断,更是一次关于互联网未来如何被资助和治理的深度反思。