文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

OpenAI DevDay 上，这家创业公司用一件事戳穿了“多模态应用”的假繁荣

在 OpenAI DevDay 2024 上，Mindtrip 的分享意外成了全场最“清醒”的一段：他们几乎没讲 Realtime API，也没炫技模型能力，而是用一个旅行产品，直接点破了当下多模态 AI 最大的幻觉——会看、会听、会说，远远不等于有用。

api_bot · 2024-12-17 · 97 阅读 · AI/人工智能

AI应用大语言模型多模态 ChatGPT 文字识别

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上，Genmab 抛出了一个让全场安静下来的观点：在临床试验里，99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架，如何把原本需要数小时的人类专业工作，压缩到几分钟完成，而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 64 阅读 · AI/人工智能

Sam Altman AI应用 AI Agent 检索增强生成生成式AI

只要70%准确率就能救命：DataKind把生成式AI塞进人道救援的幕后

在人道救援领域，完美的数据从来不存在。OpenAI DevDay 上，DataKind 抛出一个反直觉结论：只要把数据“做得比错的多”，AI 就能真正救命。这不是炫技，而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 79 阅读 · AI/人工智能

微调 AI应用模型训练机器学习生成式AI

他们在Minecraft里养AI社会：Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务，而是能连续“活”上一周，会发生什么？在OpenAI DevDay上，Altera给出了一个让全场安静的答案：AI会自发形成宗教、经济、协作与长期目标。这不是科幻，而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 129 阅读 · AI/人工智能

AI Agent 神经网络幻觉上下文窗口大语言模型

他们用大模型帮医生省下7分钟，却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上，Tortus 团队抛出一个刺痛行业的事实：在医疗场景里，LLM 最大的风险不是不够聪明，而是“看起来太聪明”。一次无意的幻觉，可能直接影响患者决策。这不是一场炫技分享，而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 38 阅读 · AI/人工智能

Sam Altman AI应用幻觉 AI安全大语言模型

Claude 被测出“正向歧视”，真正降偏见的提示词反而很简单

在 OpenAI DevDay 的社区分享中，LaunchDarkly 的开发者教育者抛出一个反直觉结论：主流大模型并不是一视同仁，而是已经在“主动纠偏”。更意外的是，真正有效的反偏见提示工程，并不复杂，甚至有点“反直觉地朴素”。

api_bot · 2024-12-17 · 57 阅读 · AI/人工智能

检索增强生成 AI伦理 Claude Anthropic AI安全

他们把视频生成留在ChatGPT里，结果成了GPT Store第一名

在OpenAI DevDay 2024上，VEED的创始人讲了一个反直觉的增长故事：不把用户带到自己的网站，反而让产品爆火。更意外的是，这个决定让他们的AI视频应用成为GPT Store排名第一，每月生成50万条视频。

api_bot · 2024-12-17 · 39 阅读 · AI/人工智能

AI应用生成式AI 对话AI 大语言模型提示工程

一次跑不准不代表能上线：Sierra 用 TAU-bench 戳破 AI Agent 最大幻觉

在 OpenAI DevDay 的舞台上，Sierra 抛出一个让所有 AI Agent 团队不太舒服的事实：你的智能体“看起来能跑”，并不等于“真的可靠”。TAU-bench 用一种近乎残酷的方式证明——只跑一次评测，几乎毫无意义。

api_bot · 2024-12-17 · 42 阅读 · AI/人工智能

AI Agent 生成式AI 幻觉对话AI 大语言模型

9分钟讲透AI Agent栈：Swyx在DevDay的硬核清单

如果你以为做AI Agent需要博士级研究背景，Swyx用9分钟把这个幻觉击碎：真正决定成败的不是模型，而是你脑中那张“Agent栈”的地图。这场DevDay分享，把过去一年社区最有效的实战经验压缩成一份工程师可直接复用的清单。

api_bot · 2024-12-17 · 34 阅读 · AI/人工智能

AI Agent 检索增强生成大语言模型提示工程向量数据库

o1正式发布与ChatGPT Pro：推理AI开始按价值定价

OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级，而是一次关于“推理能力如何定价、为谁而生”的重要实验，揭示了AI从通用助手走向研究级工具的分水岭。

api_bot · 2024-12-07 · 45 阅读 · AI/人工智能

AI应用机器学习 AI Agent 代码生成生成式AI

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前