文章

Gemini这一年:一次“转折点”背后的模型、组织与未来

Gemini这一年:一次“转折点”背后的模型、组织与未来

这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟,讲清了Gemini过去一年真正的转折点:为什么2.5 Pro意义重大,DeepMind为何从“纯研究”转向“研究+交付”,以及他们眼中多模态、Agent和“无限上下文”的下一站。

api_bot · 2025-07-10 · 69 阅读 · AI/人工智能
GPT‑5真正重要的,不是更强,而是终于“合体”了

GPT‑5真正重要的,不是更强,而是终于“合体”了

这期《The AI Daily Brief》梳理了GPT‑5从“千呼万唤不出来”到即将登场的完整脉络。与其说它是一次性能飞跃,不如说是OpenAI对过去一年路线选择的总交付:统一推理、多模态与工具,重新定义普通用户和开发者如何使用AI。

api_bot · 2025-07-09 · 54 阅读 · AI/人工智能
从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

Simon Willison 用一场充满幽默的演讲,回顾了 2025 年前六个月大模型世界的剧烈变化:模型更便宜、更强、本地可跑,也更危险。这篇文章提炼了他最重要的判断、案例和隐忧,帮你快速理解今年 LLM 发展的真实方向。

api_bot · 2025-07-09 · 70 阅读 · AI/人工智能
不止最强模型:AI真正的前沿在成本、速度与取舍

不止最强模型:AI真正的前沿在成本、速度与取舍

ArtificialAnalysis 联合创始人 George Cameron 用真实基准数据揭示:AI 不只有“最强智能”这一条前沿。推理模型的高代价、开源权重的快速逼近、以及成本与速度的数量级差异,正在重塑我们构建 AI 应用的方式。

api_bot · 2025-07-08 · 59 阅读 · AI/人工智能
把“机器人前台”做成真人对话:实时视频AI的工程真相

把“机器人前台”做成真人对话:实时视频AI的工程真相

这场由 Pipecat 与 Tavus 联合分享的演讲,罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行,以及真正的难点不在模型本身,而在编排与部署。读完你会理解,一个 600 毫秒响应的对话式视频系统,究竟是怎样被搭出来的。

api_bot · 2025-06-27 · 66 阅读 · AI/人工智能
毫秒级语音AI如何落地:Cartesia与AWS的实时推理新范式

毫秒级语音AI如何落地:Cartesia与AWS的实时推理新范式

这场对话罕见地从第一性原理出发,拆解了“语音AI为什么难以规模化”的核心原因。Cartesia联合创始人Arjun Desai与AWS的Rohit Talluri分享了他们在实时语音、低延迟推理和新模型架构上的关键判断,揭示了企业级语音AI真正的技术门槛。

api_bot · 2025-06-27 · 73 阅读 · AI/人工智能