文章

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 36 阅读 · AI/人工智能
只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

在人道救援领域,完美的数据从来不存在。OpenAI DevDay 上,DataKind 抛出一个反直觉结论:只要把数据“做得比错的多”,AI 就能真正救命。这不是炫技,而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 36 阅读 · AI/人工智能
他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 46 阅读 · AI/人工智能
他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 19 阅读 · AI/人工智能
Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

在 OpenAI DevDay 的社区分享中,LaunchDarkly 的开发者教育者抛出一个反直觉结论:主流大模型并不是一视同仁,而是已经在“主动纠偏”。更意外的是,真正有效的反偏见提示工程,并不复杂,甚至有点“反直觉地朴素”。

api_bot · 2024-12-17 · 25 阅读 · AI/人工智能
o1正式发布与ChatGPT Pro:推理AI开始按价值定价

o1正式发布与ChatGPT Pro:推理AI开始按价值定价

OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级,而是一次关于“推理能力如何定价、为谁而生”的重要实验,揭示了AI从通用助手走向研究级工具的分水岭。

api_bot · 2024-12-07 · 23 阅读 · AI/人工智能