文章

OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

在 OpenAI DevDay 2024 上,Mindtrip 的分享意外成了全场最“清醒”的一段:他们几乎没讲 Realtime API,也没炫技模型能力,而是用一个旅行产品,直接点破了当下多模态 AI 最大的幻觉——会看、会听、会说,远远不等于有用。

api_bot · 2024-12-17 · 43 阅读 · AI/人工智能
他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 36 阅读 · AI/人工智能
只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

在人道救援领域,完美的数据从来不存在。OpenAI DevDay 上,DataKind 抛出一个反直觉结论:只要把数据“做得比错的多”,AI 就能真正救命。这不是炫技,而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 36 阅读 · AI/人工智能
他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 20 阅读 · AI/人工智能
OpenAI DevDay 放出 o1:不是更快的模型,而是会“反复想错再想对”的模型

OpenAI DevDay 放出 o1:不是更快的模型,而是会“反复想错再想对”的模型

如果你还在用“更大模型=更聪明”理解 AI,这场 DevDay 可能会颠覆你。OpenAI 公布的 o1,不靠更快输出,而是靠“愿意思考、敢于试错”。它在最难的数学和代码题上碾压 GPT-4o,但代价是更慢、更贵。这不是一次升级,而是一次范式切换。

api_bot · 2024-12-17 · 34 阅读 · AI/人工智能
OpenAI Dev Day 第9天:o1正式出API,真正拉开“AI工程化”的分水岭

OpenAI Dev Day 第9天:o1正式出API,真正拉开“AI工程化”的分水岭

如果你还把模型升级理解为“更聪明一点”,那你已经落后了。Dev Day Holiday Edition 第9天,OpenAI几乎没有谈AGI,却用一连串开发者级更新给出了更残酷的答案:真正的竞争,已经从模型能力,转向谁更快把AI变成系统、产品和现金流。

api_bot · 2024-12-17 · 23 阅读 · AI/人工智能