Notion AI的方法论:如何把AI从“能用”做到“世界级”

AI PM 编辑部 · 2025年06月27日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这场由Notion AI负责人Sarah Sachs分享的演讲,罕见地拆解了一款成熟AI产品从诞生到规模化的真实过程。你将看到Notion AI为何早于ChatGPT上线、AI产品评估为何异常困难,以及他们如何用日志、人类反馈和快速迭代,把AI真正变成可依赖的生产力工具。

Notion AI的方法论:如何把AI从“能用”做到“世界级”

这场由Notion AI负责人Sarah Sachs分享的演讲,罕见地拆解了一款成熟AI产品从诞生到规模化的真实过程。你将看到Notion AI为何早于ChatGPT上线、AI产品评估为何异常困难,以及他们如何用日志、人类反馈和快速迭代,把AI真正变成可依赖的生产力工具。

为什么Notion AI上线得比ChatGPT还早,却更低调?

这一点是整场演讲最让人意外的开场。Sarah Sachs在台上直接抛出一句让全场愣住的话:“Believe it or not, Notion AI actually came out before ChatGPT.” 这句话的重要性不在于时间点的对比,而在于它揭示了一种完全不同的产品路径。

Notion AI并不是作为一个“聊天机器人”被推出的。它从一开始就被嵌入在Notion已有的文档、知识库和工作流中,解决的是“如何让用户更快完成已有任务”。这种定位让它在发布时并没有形成像ChatGPT那样的爆炸性传播,但却天然更贴近真实生产场景。

Sarah提到,正是因为这种嵌入式设计,团队在早期就必须面对一个更难的问题:AI不是展示能力,而是要在真实用户数据、真实上下文中稳定工作。这也为后面所有关于评估、迭代和人类反馈的复杂性埋下了伏笔。

AI产品最难的不是生成,而是“评估”

在演讲的中段,Sarah反复回到一个看似简单、但极其棘手的问题:“What makes it hard to evaluate?” 对于传统软件,评估往往意味着是否通过测试、是否符合需求;但在生成式AI中,答案远没有这么清晰。

Notion AI面对的是开放式输出:总结是否“好”、改写是否“更清楚”、头脑风暴是否“有启发”,这些都很难用单一指标衡量。更麻烦的是,不同用户、不同上下文下,对“好”的定义完全不同。

Sarah强调,正是这种模糊性,让AI产品无法只依赖离线基准测试。模型在实验室里表现优秀,并不代表它在真实工作流中就能创造价值。这也是为什么Notion团队很早就意识到,评估必须与真实使用行为深度绑定,而不是停留在模型层面。

从用户行为出发的迭代循环,而不是模型驱动

在解释Notion AI的演进方式时,Sarah展示了他们的迭代循环,并用一句话概括:“So this is kind of what our iteration cycle looks like.” 这个循环的核心,不是先问‘模型还能不能更强’,而是先问‘用户到底卡在哪里’。

团队会先通过产品内的使用情况和日志,观察用户在哪些步骤反复尝试、放弃或手动修改结果。这些信号往往比用户直接反馈更诚实。随后,他们才回到提示设计、模型选择或产品交互上做针对性调整。

这种方式的一个重要结果是:很多改进并不来自模型升级,而是来自更好的上下文提供、更清晰的操作入口,或者干脆减少AI介入的频率。Sarah直言,有时候“让AI少做一点”,反而让整体体验更好。

日志、人类反馈与“可控”的规模化

在演讲后半段,话题逐渐转向工程与组织层面。Sarah抛出一个看似基础、但被很多团队忽略的问题:“So, why should you even set up logging?” 在Notion AI的实践中,日志并不仅仅是为了排错,而是理解AI行为的唯一窗口。

通过系统化的日志,团队可以回溯某个糟糕输出是在什么上下文、什么提示、什么用户意图下产生的。这为后续的人类评审和产品决策提供了事实基础,而不是凭感觉争论。

她还特别强调了“human section”的重要性:无论模型多强,人类始终是AI产品质量的最后一道防线。真正世界级的AI产品,不是自动化一切,而是清楚地知道在哪些关键节点必须让人参与判断。正如她所说,结果之所以“crazy”,并不是因为AI无所不能,而是因为系统被设计成了可被人类持续修正。

总结

这场分享最有价值的地方,不在于具体用了哪种模型,而在于Notion AI背后的产品哲学:把AI当作长期产品能力,而不是一次性功能发布。从嵌入式场景、困难的评估问题,到以日志和人类反馈驱动的迭代循环,这些经验都指向同一个结论——世界级AI产品的门槛,远高于“接入一个大模型”。对于任何想认真做AI产品的人来说,这套方法论比模型参数更值得反复琢磨。


关键词: Notion AI, 生成式AI产品, AI评估, 人类反馈, 产品迭代

事实核查备注: 视频标题为“How to build world-class AI products”;演讲者为Notion AI负责人Sarah Sachs;明确提到Notion AI早于ChatGPT上线;原话包括“Believe it or not, Notion AI actually came out before ChatGPT.”、“What makes it hard to evaluate?”、“So, why should you even set up logging?”;内容围绕Notion AI的评估、迭代、日志与人类反馈展开