ComfyUI 创始人首场公开课:为什么节点式工作流正在重塑生成式AI创作
正在加载视频...
视频章节
这是一场由 ComfyUI 原作者 ComfyAnonymous 亲自讲述的完整工作坊。从个人项目的诞生,到被数百万创作者和大厂采用,再到节点式工作流为何能承载生成式 AI 的未来,这场演讲给出了许多只有一线开发者才能说出的真实判断。
ComfyUI 创始人首场公开课:为什么节点式工作流正在重塑生成式AI创作
这是一场由 ComfyUI 原作者 ComfyAnonymous 亲自讲述的完整工作坊。从个人项目的诞生,到被数百万创作者和大厂采用,再到节点式工作流为何能承载生成式 AI 的未来,这场演讲给出了许多只有一线开发者才能说出的真实判断。
从“谁听说过 ComfyUI?”开始:一个工具的定位野心
这场工作坊一开始,ComfyAnonymous 并没有急着讲技术,而是先抛出一个看似随意的问题:“谁听说过 ComfyUI?”当他看到只有半个会场举手时,还幽默地点评“这一半房间很有知识储备”。但接下来的自我介绍,迅速点明了 ComfyUI 的核心定位:它不是某个模型的前端,而是一个“为生成式 AI 服务的开源、节点式设计画布”。
他用一句非常工程师气质的话总结 ComfyUI:“我们支持图像、视频、音频、3D、文本,以及更多模态的生成式模型。”节点式(node-based)在这里不是 UI 风格,而是一种方法论——把扩散、采样、条件控制、后处理全部拆解成可组合、可替换的模块。这也是为什么 ComfyUI 往往能在“技术发布当天”就支持最新模型,他强调这是“从原始实现重新设计,而不是简单封装”。
更重要的是,ComfyUI 从一开始就同时面向两种世界:本地运行的开源模型,以及通过 API 接入的闭源模型。它支持 NVIDIA、AMD、Intel 硬件,也支持“只用 API 把结果交付给用户”的商业模型。这种不站队的姿态,解释了它后来能在创作者和企业中同时扩散。
可拖回画布的图片:ComfyUI 最被低估的“病毒机制”
如果说节点式只是强大,那真正让 ComfyUI 爆发的,是它对“工作流可分享性”的极端重视。ComfyAnonymous 在演讲中明确指出:任何由 ComfyUI 生成的图片或视频,都内嵌了完整的工作流元数据。“你可以把它直接拖回画布,所有参数都会原样复现。”
这意味着,一张好图不再只是结果,而是教程本身。正是这种设计,让 ComfyUI 工作流在社区中像代码一样传播。他半开玩笑地说:“你只要 Google 一下 ComfyUI workflows,就会看到一页又一页。”这不是营销,而是系统设计带来的自然扩散。
随后的数据披露进一步印证了这一点:ComfyUI 拥有 300–400 万活跃用户、每天约 2 万次下载,社区贡献了 22,000 个自定义节点,背后是约 3,000 名公开开发者。更有意思的是,他提到 Amazon、Apple、Netflix 等公司,“大概率在某个后端环节跑着 ComfyUI”。这并非因为 UI 漂亮,而是因为工作流可以被复用、审计和自动化。
不是一开始就成功:ComfyUI 的个人项目起点
在“Story behind ComfyUI”这一段,演讲第一次从工具转向了人。ComfyAnonymous 直言,ComfyUI 最初只是他的个人项目,并没有宏大的商业计划。后来他加入了 Stability AI,在那里积累了对扩散模型工程化的理解,也看清了现有工具在“控制力”上的不足。
真正的转折点,是他与 Yolan、Robin 等人一起,把这个个人工具推进成一个由 Comfyorg 维护的开源项目。他轻描淡写地说“things have been going pretty well”,但从随后展示的用户规模和企业采用情况来看,这显然是一次超出预期的增长。
这段经历最有价值的地方,不是励志,而是现实:ComfyUI 的成功并非来自某个单点创新,而是持续地“把没时间做的事情交给社区”。自定义节点、模型适配、边缘需求,全部由社区补齐。这也解释了为什么他在现场明确表示:“Comfyorg is indeed hiring”——维护一个如此开放的系统,本身就是一项长期工程。
从扩散管线到视频与虚拟试穿:节点的真正威力
在演示环节,ComfyAnonymous 把抽象理念落回到具体操作。他展示了一个基础扩散模型管线:模型加载、条件输入、采样、输出,每一步都是独立节点。这种拆解让高级用户可以精确控制正负提示词、采样策略,甚至在中途插入实验性模块。
随后,他展示了更复杂的工作流:视频生成、开源视频模型接入,以及通过调整上下文改善画面一致性。他还提到了虚拟试穿(virtual try-on)和 Flux 相关的上下文控制能力,强调这些并不是“新功能按钮”,而是现有节点组合出来的结果。
在问答中,他多次被问到微调(fine-tuning)、社区模型、以及本地运行的可行性。他的态度非常务实:模型在变大,社区微调仍然重要,但并非所有场景都值得。他甚至直言,在某些情况下“not much point”。这与市面上动辄鼓吹“人人都该微调”的说法形成了鲜明对比。
总结
这场工作坊最有价值的,并不是 UI 教学,而是一个核心判断:生成式 AI 的未来不在“更聪明的按钮”,而在可组合、可复现、可分享的工作流。ComfyUI 之所以能被个人创作者和大厂同时采用,正是因为它把控制权交还给用户,也把扩展权交给社区。对读者来说,这不仅是一个工具故事,更是一种构建 AI 产品的长期方法论。
关键词: ComfyUI, 生成式AI, 多模态, 节点式工作流, 微调
事实核查备注: 关键事实包括:ComfyAnonymous 为 ComfyUI 原作者;ComfyUI 为开源节点式生成式 AI 画布;支持图像、视频、音频、3D、文本;支持 NVIDIA、AMD、Intel 硬件;支持闭源 API 模型;图片/视频内嵌可回放工作流元数据;活跃用户约 300–400 万、每日下载约 2 万;约 22,000 个自定义节点、3,000 名开发者;提及公司包括 Amazon、Apple、Netflix、Stability AI;产品与概念包括 Flux、虚拟试穿、微调。