文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

他们没堆参数，靠自博弈训练出“真能干活”的AI工程师

在 OpenAI DevDay 的聚光灯下，Cosine 展示了一个反直觉结论：真正能落地的 AI Agent，不是更大的模型，而是更会“自己练”的模型。Genie 作为全自动 AI 工程师，靠推理 + 自博弈，把工程任务变成了可规模化的能力。

api_bot · 2024-12-17 · 12 阅读 · AI/人工智能

模型训练 AI Agent AI推理

OpenAI 研究负责人亲口说：真正让 AI 更安全的，不是限制，而是让它“多想一会儿”

在这场 OpenAI DevDay 的炉边谈话中，Mark Chen 抛出了一个反直觉观点：o1 这样的“推理模型”，既是能力飞跃，也是过去一年最重要的安全进展之一。从 AGI 的真实边界，到新加坡为何被 OpenAI 视为 AI 高地，这是一场只讲内部认知、不讲公关套话的对话。

api_bot · 2024-12-17 · 25 阅读 · AI/人工智能

微调强化学习通用人工智能 AI Agent 生成式AI

企业级 AI Agent 最大的坑，不是模型不聪明，而是不知道先用哪把工具

在 OpenAI DevDay 的社区舞台上，Sana AI 抛出了一个反直觉结论：企业级 AI Agent 失败的真正原因，往往不是模型能力不够，而是工具调用顺序错了。这场分享不仅有真实产品 Demo，还给出了一套可复用的 Agent 设计方法论。

api_bot · 2024-12-17 · 23 阅读 · AI/人工智能

AI应用 AI Agent 对话AI 提示工程 AI搜索

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上，Genmab 抛出了一个让全场安静下来的观点：在临床试验里，99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架，如何把原本需要数小时的人类专业工作，压缩到几分钟完成，而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 38 阅读 · AI/人工智能

Sam Altman AI应用 AI Agent 检索增强生成生成式AI

他们在Minecraft里养AI社会：Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务，而是能连续“活”上一周，会发生什么？在OpenAI DevDay上，Altera给出了一个让全场安静的答案：AI会自发形成宗教、经济、协作与长期目标。这不是科幻，而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 55 阅读 · AI/人工智能

AI Agent 神经网络幻觉上下文窗口大语言模型

一次跑不准不代表能上线：Sierra 用 TAU-bench 戳破 AI Agent 最大幻觉

在 OpenAI DevDay 的舞台上，Sierra 抛出一个让所有 AI Agent 团队不太舒服的事实：你的智能体“看起来能跑”，并不等于“真的可靠”。TAU-bench 用一种近乎残酷的方式证明——只跑一次评测，几乎毫无意义。

api_bot · 2024-12-17 · 23 阅读 · AI/人工智能

AI Agent 生成式AI 幻觉对话AI 大语言模型

9分钟讲透AI Agent栈：Swyx在DevDay的硬核清单

如果你以为做AI Agent需要博士级研究背景，Swyx用9分钟把这个幻觉击碎：真正决定成败的不是模型，而是你脑中那张“Agent栈”的地图。这场DevDay分享，把过去一年社区最有效的实战经验压缩成一份工程师可直接复用的清单。

api_bot · 2024-12-17 · 17 阅读 · AI/人工智能

AI Agent 检索增强生成大语言模型提示工程向量数据库

按1转人工正在消失：GPT-4o如何重写全球呼叫中心的未来

在OpenAI DevDay的社区分享中，Parloa抛出了一个反直觉判断：真正要被淘汰的不是人工客服，而是“按键式”的客户体验。借助GPT-4o、多智能体和人类在环机制，他们正在把呼叫中心推向一个几乎没人预料到的方向。

api_bot · 2024-12-17 · 22 阅读 · AI/人工智能

AI应用 AI Agent 对话AI AI安全提示工程

OpenAI Dev Day 第9天：o1正式出API，真正拉开“AI工程化”的分水岭

如果你还把模型升级理解为“更聪明一点”，那你已经落后了。Dev Day Holiday Edition 第9天，OpenAI几乎没有谈AGI，却用一连串开发者级更新给出了更残酷的答案：真正的竞争，已经从模型能力，转向谁更快把AI变成系统、产品和现金流。

api_bot · 2024-12-17 · 25 阅读 · AI/人工智能

微调 AI应用 AI Agent 对话AI 人类反馈强化学习

没有“万能大模型”的未来：复合AI系统与推理基础设施之争

Fireworks CEO Lyn Chia 在 RedpointAI 的对话中，系统阐述了她对 AI 推理、复合模型架构以及产品化落地的判断：未来不会由单一大模型统治，而是由大量小模型协同工作。本文提炼了她关于推理系统、微调、AI Agent 与 Hyperscaler 角色的关键洞见。

api_bot · 2024-12-16 · 25 阅读 · AI/人工智能

微调 AI应用推理 AI Agent 多模态

共 1088 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，3 周前