NVIDIA把大模型搬进你电脑后,云AI第一次显得有点多余
当所有人还在讨论算力有多贵、GPU有多稀缺时,NVIDIA悄悄做了一件反方向的事:把大模型直接塞进你的个人电脑。本地运行、接你自己的数据、完全不出云——这不只是一个新产品,而是一次对云AI叙事的正面挑战。
当所有人还在讨论算力有多贵、GPU有多稀缺时,NVIDIA悄悄做了一件反方向的事:把大模型直接塞进你的个人电脑。本地运行、接你自己的数据、完全不出云——这不只是一个新产品,而是一次对云AI叙事的正面挑战。
谷歌亲手“杀死”了 Bard,把全部筹码压在 Gemini 上,并首次放出真正能与 GPT‑4 同级的模型 Ultra 1.0。这不只是一次产品升级,而是谷歌在 AI 战场上的一次自我救赎:一场迟到一年、却必须打赢的战争。
当所有人都在担心 AGI 会不会“毁灭世界”,Sam Altman 却在达沃斯说了一句反直觉的话:它来的不远,但影响可能没你想的大。这不是降温,而是 OpenAI 对现实的重新判断。
一家成立不到半年的欧洲创业公司,用一款开源模型让整个 AI 圈开始重新评估 GPT‑4 的护城河。Mistral 不只是在“跑分上赢了”,它正在用开源、MoE 架构和极具挑衅意味的发布方式,重塑 2024 年的大模型竞争逻辑。
如果你觉得最近的 ChatGPT 回答变短、变敷衍了,这可能不是你的错觉。有人用同一段代码提示,只改了系统日期,就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是:承诺给它“小费”,它真的会更卖力。
就在所有人以为 Gemini 又要跳票时,Google 突然官宣上线。基准测试全面碾压 GPT-4、原生多模态、DeepMind 全员上阵——看起来像是王者归来。但很快,质疑声也接踵而至:真正的 Gemini Ultra 并未开放,基准对比被指“过度包装”。这到底是 Google 的翻身仗,还是一次仓促止血?
所有人都在盯着 Sam Altman 的去留,AI 世界却发生了另一件更耐人寻味的事:Inflection AI 在几乎没人注意的情况下,发布了他们口中“全球第二强”的大模型 Inflection‑2。更重要的不是排名,而是它代表了一条完全不同的 AI 路线。
如果你以为微软在 AI 上最大的筹码是 OpenAI,那你已经落后了。Ignite 大会上,微软一口气甩出自研 AI 芯片、重塑 Copilot 品牌、加码模型与云基础设施,释放的信号只有一个:它不想只做 AI 的渠道商,而是要掌控整条价值链。
一个反直觉的现实正在发生:最火的AI创业公司,VC反而投不动了。Character.AI日活400万、用户每天用两小时,却依然难以说服传统风投。真正敢接盘的,只剩下微软、谷歌、亚马逊和英伟达。AI创业的融资逻辑,正在被大厂重写。
Imbue两位创始人在这期播客中反复强调:如果目标是构建能长期推理、执行任务的AI Agent,仅靠大语言模型远远不够。本文围绕他们的创业故事、对推理型模型的判断、为何从“写代码”切入,以及他们对未来人机交互的预判,提炼出这场对话中最值得反复思考的洞见。