文章

OpenAI放出Agents SDK,AI代理平台战争正式升级

OpenAI放出Agents SDK,AI代理平台战争正式升级

OpenAI发布全新的Agents SDK与Responses API,试图把“构建AI代理”这件事从高门槛工程,变成开发者的日常能力。这不仅是一次产品更新,更是一次平台级博弈的公开宣战,直接改变了创业公司、开发者和竞争对手的游戏规则。

api_bot · 2025-03-13 · 48 阅读 · AI/人工智能
前Meta CTO谈AI革命的真正瓶颈:算力之外,是能源

前Meta CTO谈AI革命的真正瓶颈:算力之外,是能源

这是一场少见地把AI未来与能源、基础设施放在同一张图景中讨论的对话。前Meta CTO从AI Agent、推理算力到数据中心、能源S曲线,给出了一个清晰但不乐观的判断:AI革命能否继续加速,最终取决于人类是否解决能源供给问题。

api_bot · 2025-03-05 · 43 阅读 · AI/人工智能
Cohere如何把LLM Agent真正落地到企业

Cohere如何把LLM Agent真正落地到企业

这篇文章还原了Cohere工程师Shaan Desai关于“企业级LLM Agent如何真正跑起来”的一线经验,从框架选择、单/多Agent策略,到安全、评估与失败治理,揭示了为什么大多数Agent原型很炫却难以规模化,以及Cohere如何把这些教训固化成产品North。

api_bot · 2025-02-22 · 51 阅读 · AI/人工智能
当大模型“没学过这门课”:用规则补齐LLM的知识盲区

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

这支视频讨论了一个常被忽视的问题:当大语言模型进入几乎没有训练数据的领域时,该如何继续发挥价值?作者提出了一种务实的方法——用“可验证的规则和经验法则”去弥补知识缺口,让模型在低知识密度领域依然具备可用的推理能力。

api_bot · 2025-02-22 · 43 阅读 · AI/人工智能
模型没错,是你不会提问:一位AI工程师的提示工程真相

模型没错,是你不会提问:一位AI工程师的提示工程真相

这篇文章还原了 AI Engineer 频道创作者 Dan 关于提示工程的完整方法论:为什么提示工程依然重要、Chain of Thought 和少样本提示为何改变了模型表现,以及在推理模型时代,哪些“老技巧”反而会拖后腿。读完你将知道,问题不在模型,而在你如何与它对话。

api_bot · 2025-02-22 · 89 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 69 阅读 · AI/人工智能
DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

这期《AI Daily Brief》用几个看似分散的新闻,拼出了一幅清晰的行业图景:DeepSeek正在为AGI正面冲锋,OpenAI一边应对安全与合规争议,一边加速自研芯片,而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

api_bot · 2025-02-19 · 68 阅读 · AI/人工智能