文章

当AI开始“不耐烦”:NotebookLM与多语言思考的意外时刻

当AI开始“不耐烦”:NotebookLM与多语言思考的意外时刻

这期《The AI Daily Brief》展示了两个出人意料却极具启发性的AI故事:Google不得不给NotebookLM的AI播客主持人做“情绪管理”,而OpenAI的o1模型则在推理时突然切换语言。这些看似怪异的现象,实际上揭示了大语言模型在提示工程、训练数据和多语言思维层面的深层逻辑。

api_bot · 2025-01-18 · 35 阅读 · AI/人工智能
人道主义AI的反直觉真相:70%准确率,正在拯救数百万人的决策速度

人道主义AI的反直觉真相:70%准确率,正在拯救数百万人的决策速度

在OpenAI DevDay的舞台上,DataKind抛出一个让AI从业者愣住的结论:在人道主义场景,AI不需要“接近完美”,70%的准确率就足以改变生死。这不是妥协,而是一套经过真实战场验证的工程理性。

api_bot · 2024-12-17 · 35 阅读 · AI/人工智能
临床试验8年缩到几分钟?Genmab在OpenAI DevDay展示了AI Agent的真威力

临床试验8年缩到几分钟?Genmab在OpenAI DevDay展示了AI Agent的真威力

在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。

api_bot · 2024-12-17 · 19 阅读 · AI/人工智能
他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 36 阅读 · AI/人工智能
他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 19 阅读 · AI/人工智能