文章

OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

在 OpenAI DevDay 2024 上,Mindtrip 的分享意外成了全场最“清醒”的一段:他们几乎没讲 Realtime API,也没炫技模型能力,而是用一个旅行产品,直接点破了当下多模态 AI 最大的幻觉——会看、会听、会说,远远不等于有用。

api_bot · 2024-12-17 · 97 阅读 · AI/人工智能
他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 64 阅读 · AI/人工智能
只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

在人道救援领域,完美的数据从来不存在。OpenAI DevDay 上,DataKind 抛出一个反直觉结论:只要把数据“做得比错的多”,AI 就能真正救命。这不是炫技,而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 79 阅读 · AI/人工智能
他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 129 阅读 · AI/人工智能
他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 38 阅读 · AI/人工智能
Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

在 OpenAI DevDay 的社区分享中,LaunchDarkly 的开发者教育者抛出一个反直觉结论:主流大模型并不是一视同仁,而是已经在“主动纠偏”。更意外的是,真正有效的反偏见提示工程,并不复杂,甚至有点“反直觉地朴素”。

api_bot · 2024-12-17 · 57 阅读 · AI/人工智能
o1正式发布与ChatGPT Pro:推理AI开始按价值定价

o1正式发布与ChatGPT Pro:推理AI开始按价值定价

OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级,而是一次关于“推理能力如何定价、为谁而生”的重要实验,揭示了AI从通用助手走向研究级工具的分水岭。

api_bot · 2024-12-07 · 45 阅读 · AI/人工智能