文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 开源模型多模态提示工程

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上，Genmab 抛出了一个让全场安静下来的观点：在临床试验里，99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架，如何把原本需要数小时的人类专业工作，压缩到几分钟完成，而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 68 阅读 · AI/人工智能

Sam Altman AI应用 AI Agent 检索增强生成生成式AI

只要70%准确率就能救命：DataKind把生成式AI塞进人道救援的幕后

在人道救援领域，完美的数据从来不存在。OpenAI DevDay 上，DataKind 抛出一个反直觉结论：只要把数据“做得比错的多”，AI 就能真正救命。这不是炫技，而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 87 阅读 · AI/人工智能

微调 AI应用模型训练机器学习生成式AI

Sam Altman罕见松口：AGI不再是终点，真正的分水岭另有其事

在这场超过40分钟的炉边对谈中，Sam Altman 并没有给出一个“AGI倒计时”，反而反复强调：真正重要的，不是某一天突然宣布我们到了 AGI，而是能力如何被产品化、被规模化、被安全地释放。这场 DevDay 对话，信息密度远超发布会本身。

api_bot · 2024-12-17 · 52 阅读 · AI/人工智能

Sam Altman 微调通用人工智能计算机视觉语音AI

他们在Minecraft里养AI社会：Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务，而是能连续“活”上一周，会发生什么？在OpenAI DevDay上，Altera给出了一个让全场安静的答案：AI会自发形成宗教、经济、协作与长期目标。这不是科幻，而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 135 阅读 · AI/人工智能

AI Agent 神经网络幻觉上下文窗口大语言模型

OpenAI 把语音对话“合并成一次调用”，Realtime API 改写多模态应用玩法

在 DevDay 2024 上，OpenAI 抛出一个对语音 AI 从业者极具冲击力的事实：真正自然的语音对话，不该再是“语音转文字→模型思考→文字转语音”的流水线。Realtime API 用一次连接，直接实现“听进去、说出来”，这背后意味着整个多模态应用架构正在被重写。

api_bot · 2024-12-17 · 120 阅读 · AI/人工智能

对话AI 多模态语音AI GPT-4 ChatGPT

OpenAI悄悄改了API底层逻辑：结构化输出，才是可靠AI应用的分水岭

大多数人还在讨论模型多聪明，OpenAI已经在DevDay抛出一个更现实的问题：如果AI连JSON都不稳定，你敢把它接进生产系统吗？这场关于Structured Outputs的分享，几乎重新定义了“AI能不能真的用”。

api_bot · 2024-12-17 · 51 阅读 · AI/人工智能

OpenAI GPT-3

他们用大模型帮医生省下7分钟，却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上，Tortus 团队抛出一个刺痛行业的事实：在医疗场景里，LLM 最大的风险不是不够聪明，而是“看起来太聪明”。一次无意的幻觉，可能直接影响患者决策。这不是一场炫技分享，而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 42 阅读 · AI/人工智能

Sam Altman AI应用幻觉 AI安全大语言模型

Claude 被测出“正向歧视”，真正降偏见的提示词反而很简单

在 OpenAI DevDay 的社区分享中，LaunchDarkly 的开发者教育者抛出一个反直觉结论：主流大模型并不是一视同仁，而是已经在“主动纠偏”。更意外的是，真正有效的反偏见提示工程，并不复杂，甚至有点“反直觉地朴素”。

api_bot · 2024-12-17 · 68 阅读 · AI/人工智能

检索增强生成 AI伦理 Claude Anthropic AI安全

他们把视频生成留在ChatGPT里，结果成了GPT Store第一名

在OpenAI DevDay 2024上，VEED的创始人讲了一个反直觉的增长故事：不把用户带到自己的网站，反而让产品爆火。更意外的是，这个决定让他们的AI视频应用成为GPT Store排名第一，每月生成50万条视频。

api_bot · 2024-12-17 · 46 阅读 · AI/人工智能

AI应用生成式AI 对话AI 大语言模型提示工程

一次跑不准不代表能上线：Sierra 用 TAU-bench 戳破 AI Agent 最大幻觉

在 OpenAI DevDay 的舞台上，Sierra 抛出一个让所有 AI Agent 团队不太舒服的事实：你的智能体“看起来能跑”，并不等于“真的可靠”。TAU-bench 用一种近乎残酷的方式证明——只跑一次评测，几乎毫无意义。

api_bot · 2024-12-17 · 47 阅读 · AI/人工智能

AI Agent 生成式AI 幻觉对话AI 大语言模型

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月，2 周前