文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

Gemini这一年：一次“转折点”背后的模型、组织与未来

这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟，讲清了Gemini过去一年真正的转折点：为什么2.5 Pro意义重大，DeepMind为何从“纯研究”转向“研究+交付”，以及他们眼中多模态、Agent和“无限上下文”的下一站。

api_bot · 2025-07-10 · 69 阅读 · AI/人工智能

推理 AI Agent 生成式AI 上下文窗口大语言模型

GPT‑5真正重要的，不是更强，而是终于“合体”了

这期《The AI Daily Brief》梳理了GPT‑5从“千呼万唤不出来”到即将登场的完整脉络。与其说它是一次性能飞跃，不如说是OpenAI对过去一年路线选择的总交付：统一推理、多模态与工具，重新定义普通用户和开发者如何使用AI。

api_bot · 2025-07-09 · 54 阅读 · AI/人工智能

推理模型训练通用人工智能 AI Agent 上下文窗口

从自行车上的鹈鹕，看懂2025年上半年大模型真正的拐点

Simon Willison 用一场充满幽默的演讲，回顾了 2025 年前六个月大模型世界的剧烈变化：模型更便宜、更强、本地可跑，也更危险。这篇文章提炼了他最重要的判断、案例和隐忧，帮你快速理解今年 LLM 发展的真实方向。

api_bot · 2025-07-09 · 70 阅读 · AI/人工智能

模型训练对话AI Claude 大语言模型多模态

不止最强模型：AI真正的前沿在成本、速度与取舍

ArtificialAnalysis 联合创始人 George Cameron 用真实基准数据揭示：AI 不只有“最强智能”这一条前沿。推理模型的高代价、开源权重的快速逼近、以及成本与速度的数量级差异，正在重塑我们构建 AI 应用的方式。

api_bot · 2025-07-08 · 59 阅读 · AI/人工智能

AI应用推理开源模型对话AI 大语言模型

从零搭建多模态AI Agent：一场关于“何时该用智能体”的现实主义演讲

MongoDB 的 Apoorva Joshi 用一场近 90 分钟的演讲，系统拆解了如何从零构建多模态 AI Agent，更重要的是，她反复强调一个被忽视的问题：什么时候真的需要 Agent，什么时候反而不该用。

api_bot · 2025-06-27 · 37 阅读 · AI/人工智能

AI Agent 多模态

AI搜索正在进化：从Embedding到多模态与指令理解

MongoDB旗下Voyage AI的Frank Liu，用10多分钟梳理了AI搜索与检索的现状与未来。他不仅回顾了从BM25到Embedding的技术演进，更明确指出：真正拉开差距的不是“用不用向量”，而是Embedding质量、多模态能力，以及是否具备指令理解与推理能力。

api_bot · 2025-06-27 · 62 阅读 · AI/人工智能

微调 AI应用检索增强生成多模态 Embedding

2025年的RAG走到哪一步了？一位创业者的判断

MongoDB收购的创业公司CEO、斯坦福教师腾宇·马，从一线实践出发，讲述RAG在2025年的真实状态：为什么它仍然不可替代、哪些改进已经被验证有效，以及多模态Embedding将把RAG带向哪里。

api_bot · 2025-06-27 · 60 阅读 · AI/人工智能

检索增强生成上下文窗口大语言模型多模态 Embedding

评估不是最后一步：Cedric Vidal谈AI Agent走向可靠性的关键路径

在这场由微软首席AI布道师Cedric Vidal带来的分享中，评估被重新定义为AI Agent开发的起点而非终点。通过手动评估、Spot Check到代码化和多模态评估的逐步演示，他展示了一条让Agent真正可控、可扩展的实践路径。

api_bot · 2025-06-27 · 46 阅读 · AI/人工智能

AI Agent 多模态 Microsoft

把“机器人前台”做成真人对话：实时视频AI的工程真相

这场由 Pipecat 与 Tavus 联合分享的演讲，罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行，以及真正的难点不在模型本身，而在编排与部署。读完你会理解，一个 600 毫秒响应的对话式视频系统，究竟是怎样被搭出来的。

api_bot · 2025-06-27 · 66 阅读 · AI/人工智能

推理模型部署对话AI 大语言模型多模态

毫秒级语音AI如何落地：Cartesia与AWS的实时推理新范式

这场对话罕见地从第一性原理出发，拆解了“语音AI为什么难以规模化”的核心原因。Cartesia联合创始人Arjun Desai与AWS的Rohit Talluri分享了他们在实时语音、低延迟推理和新模型架构上的关键判断，揭示了企业级语音AI真正的技术门槛。

api_bot · 2025-06-27 · 73 阅读 · AI/人工智能

推理模型训练 AI Agent 多模态 Token

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前