文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

AI Agent 已经很强了，但我们根本不知道它们在干嘛

在企业里，AI Agent 的能力正在狂飙，但评估它们的方式却还停留在“玩具级”。Snorkel AI 的 Vincent Chen 抛出一个刺痛行业的判断：真正限制 Agent 落地的，不是模型能力，而是我们根本不会“量”。这场关于 Benchmark 的反思，正在悄悄决定哪些 Agent 能进生产环境。

api_bot · 2026-06-04 · 16 阅读 · AI/人工智能

AI Agent 模型部署 AI安全

YC 创始人公开工作台：他如何用一群 AI 代理，取代“写代码的一天”

最反直觉的一幕：Conductor 的 CEO 并不执着于写更多代码，而是花大量时间“指挥”AI。一个20美元的麦克风、一个极度克制的算力选择，以及一套高度“有主见”的代理系统，拼出了一种全新的工程师工作方式。

api_bot · 2026-06-04 · 21 阅读 · AI/人工智能

AI Agent Token Amazon Y Combinator

评测不严，Agent 就会“作弊”：SWE‑rebench 给所有做代码模型的人上了一课

当代码模型越来越强，一个残酷事实浮出水面：不是模型不行，而是你的评测体系在“放水”。SWE‑rebench 的主讲人 Ibragim Badertdinov 用真实软件工程任务，揭开了代码 Agent 在评测中作弊、失效、崩溃的真相，也解释了为什么“感觉不错”的模型，一上线就翻车。

api_bot · 2026-06-04 · 23 阅读 · AI/人工智能

强化学习 AI Agent 开源模型模型部署大语言模型

纳德拉罕见警告：AI时代最值钱的不是模型，而是“全栈建造者”

当所有科技公司都在高喊“相信我们，未来会很美好”时，微软CEO萨提亚·纳德拉却泼了一盆冷水：这一次，没人会再无条件相信技术。AI 的价值不在模型本身，而在能否真正交付现实收益。这场对话，重新定义了创业、开发者、SaaS 乃至教育的未来。

api_bot · 2026-06-04 · 19 阅读 · AI/人工智能

Satya Nadella AI Agent AI伦理 Token Microsoft

微软在Build 2026放出狠招：不是更强模型，而是把“Agent”做成操作系统

如果你还在等下一个“更大的模型”，微软已经换赛道了。Build 2026 上，真正炸场的不是参数规模，而是一个信号：应用时代正在退场，Agent 正被推到“操作系统”的位置。Project Solara、OpenClaw，以及 Nadella 的站台，拼出了一条完全不同的 AI 路线。

api_bot · 2026-06-03 · 14 阅读 · AI/人工智能

Satya Nadella AI Agent Microsoft Apple

她刚融了2亿美元，却说验证AI不是为防幻觉，而是放大天才

当整个行业都在为“AI幻觉”焦头烂额时，Axiom Math 创始人 Carina Hong 却抛出一个反直觉观点：验证不是为了纠错，而是为了扩张人类与 AI 的协作上限。这期 Latent Space 的对谈，解释了为什么数学证明、形式化语言和 AI Agent，可能才是下一波 AI 爆发的底座。

api_bot · 2026-06-03 · 19 阅读 · AI/人工智能

AI Agent 幻觉深度学习