文章

为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

从Instruct GPT到GPT‑4.1,语言模型在“听话”这件事上并没有线性进步。AI21 Labs 的 Yuval Belfer 通过工程视角给出答案:问题不在模型,而在我们把所有复杂性都塞进了一个提示词。真正可靠的 AI Agent,需要规划与执行引擎。

api_bot · 2025-06-03 · 22 阅读 · AI/人工智能
为什么AI Agent总翻车?一位工程师的冷静诊断

为什么AI Agent总翻车?一位工程师的冷静诊断

在AI Agent被热烈追捧的当下,Sayash Kapoor给出了一次“泼冷水式”的演讲:Agent并没有我们想象中那么可靠。通过法律、科研和产品落地的真实失败案例,他指出问题不在模型能力,而在评估方法与可靠性工程。

api_bot · 2025-04-17 · 19 阅读 · AI/人工智能
Anthropic企业落地实战:从模型能力到可控价值

Anthropic企业落地实战:从模型能力到可控价值

这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。

api_bot · 2025-04-13 · 42 阅读 · AI/人工智能
从o3到AGI:一场被过度放大的发布与真正的技术拐点

从o3到AGI:一场被过度放大的发布与真正的技术拐点

围绕OpenAI即将发布的o3推理模型,社交媒体迅速将其解读为“AGI前夜”。但视频指出,真正重要的并不是AGI是否到来,而是推理模型在成本、规模和Agent形态上的关键转折,以及中美模型竞争正在发生的结构性变化。

api_bot · 2025-01-21 · 7 阅读 · AI/人工智能
谷歌25%代码交给AI之后,程序员真正的拐点来了

谷歌25%代码交给AI之后,程序员真正的拐点来了

谷歌CEO桑达尔·皮查伊在财报电话会上披露:谷歌超过25%的新代码由AI生成并被工程师接受。这一数字不仅震动了华尔街,也在开发者社区引发焦虑与反思。本文结合财报细节、行业讨论与关键人物观点,拆解这背后对软件工程、职业结构与AI长期价值的深远影响。

api_bot · 2024-10-31 · 8 阅读 · AI/人工智能
一个AI在Minecraft里自己写代码盖房子,这不是玩具,是信号

一个AI在Minecraft里自己写代码盖房子,这不是玩具,是信号

你在Minecraft里打方块,AI却在后台写代码、跑脚本、直接改世界状态。这个叫 Andy 的AI Bot,用的不是游戏规则,而是大模型的“执行力”。这条视频真正炸的不是好玩,而是它提前演示了:AI Agent 将如何进入真实环境,接管复杂任务。

api_bot · 2024-10-24 · 15 阅读 · AI/人工智能