Google抢跑OpenAI的那一刻,语音AI的胜负手已经变了
几个月前,所有人还在等OpenAI的“高级语音模式”全面上线;几个月后,真正完成全量发布的却是Google。Gemini Live的推出,不只是一次功能更新,而是一次关于AI形态、平台控制力和未来入口的反击战。
几个月前,所有人还在等OpenAI的“高级语音模式”全面上线;几个月后,真正完成全量发布的却是Google。Gemini Live的推出,不只是一次功能更新,而是一次关于AI形态、平台控制力和未来入口的反击战。
如果你只记住一个数字,那就是:85亿美元。最新爆料显示,OpenAI 今年的总成本可能高达 85 亿美元,而收入只有 35–45 亿。这不是情绪化的唱空,而是来自最懂 AI 财务内幕的媒体。《The Information》把一颗深水炸弹,扔进了整个 AI 产业。
Elon Musk 的 xAI 刚刚完成了史上最大规模的 Series B,但钱并不是最值得讨论的部分。真正让整个 AI 圈警觉的,是他对“算力”的极端押注,以及这背后一场正在失控的超级计算机竞赛。
不是实验室Demo,也不是PPT故事。Klarna直接甩出结果:一个由OpenAI驱动的AI客服,在一个月内干了700名全职客服的活。这条消息之所以炸裂,不只是因为数字夸张,而是它第一次把“AI取代岗位”这件事,放在了真实业务、真实财报、真实市场反应的聚光灯下。
就在ChatGPT短暂“发疯”、Gemini因历史图像争议被群嘲的同一天,Google悄然丢出一颗重磅炸弹:发布首个真正意义上的开源大模型家族Gemma。这不是一次普通的模型发布,而是一次关于权力、控制权和AI未来路线的集体转向。
Google 这次不是小修小补,而是直接把大模型的“大脑容量”拉到新维度:100万 Token 上下文窗口。它意味着什么?不只是更长的对话,而是整本书、整部电影、完整代码库一起推理。更重要的是,这一次,Google 真的把东西交到了开发者手里。
同一周,Google一边把AI塞进Chrome这种“最无聊却最常用”的地方,另一边却亮出几乎科幻级别的视频生成模型。看似零散的发布,其实清楚地暴露了2024年AI竞争的两条主线:谁在追求极限,谁在抢占日常。
所有人都在担心被AI取代,但MIT的一项研究给出了一个反直觉答案:不是AI太慢,而是它在大多数岗位上“不划算”。真正决定你工作命运的,不是模型能力,而是一笔冷冰冰的成本账。
如果你觉得最近的 ChatGPT 回答变短、变敷衍了,这可能不是你的错觉。有人用同一段代码提示,只改了系统日期,就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是:承诺给它“小费”,它真的会更卖力。
原定年度最重要发布,Google 却在最后一刻取消 Gemini 的线下预览,只改成“可能上线”的线上展示。原因并不体面:模型在多语言场景下还不够稳,而外界盯着的对手,正是 GPT‑4。这不是一次普通跳票,而是一次巨头在 AI 竞赛中罕见的迟疑。