他用“品味”调教模型：让 DeepSeek v4 在编码上压过 Opus 4.7

AI PM 编辑部 · 2026年06月06日 · 24 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还以为大模型的差距只来自参数量和算力，这期 Latent Space 会直接打脸你。视频里，一个反直觉的观点被反复强调：真正拉开编码模型差距的，不是模型本身，而是“你怎么用它”。甚至，通过一套被称为 Taste 的方法，开源模型也能在实战中压过闭源巨头。

他用“品味”调教模型：让 DeepSeek v4 在编码上压过 Opus 4.7

如果你还以为大模型的差距只来自参数量和算力，这期 Latent Space 会直接打脸你。视频里，一个反直觉的观点被反复强调：真正拉开编码模型差距的，不是模型本身，而是“你怎么用它”。甚至，通过一套被称为 Taste 的方法，开源模型也能在实战中压过闭源巨头。

最反直觉的开场：编码世界里，其实只有一种 Agent

节目一开始，话题就被迅速拉高了水位。嘉宾在回顾自己从做内容、做 DevRel，到构建 Command Code 的路径时，抛出了一个几乎和主流叙事相反的判断：“所谓多种 AI Agent，本质上最后都会收敛为一种——Coding Agent。”

这句话之所以炸，是因为它直接否定了当下对“多 Agent 协作”“角色分工”的迷恋。在他的经验里，无论你是在做 CLI 助手、自动化工具，还是更复杂的工作流，只要最终要落地为可执行结果，编码能力就会成为那个吞噬一切的核心。其他 Agent，只是包装。

这也是他早期项目 CLAI 的延续逻辑：不是再造一个会聊天的 AI，而是打造一个真正“理解代码语境”的系统。

从 CLAI 到 Command Code：不是转型，而是认清现实

视频中有一个容易被忽略、但非常关键的细节：他说自己“不是没有编码经验”，但那并不是今天最值得谈的东西。真正重要的是，他在实践中意识到一件事——工具真正的价值，不在模型能力的上限，而在你是否为它设计了正确的使用方式。

CLAI 最初的目标很直接：让 AI 进入开发者的命令行。但随着使用者和场景增多，他们发现一个残酷现实：再聪明的模型，如果被喂进模糊、懒惰、缺乏上下文的指令，产出依然是一团糟。

于是方向发生了变化：与其追逐“更强模型”，不如系统性地解决一个问题——如何把人类的工程直觉，转译成模型能稳定执行的输入结构。这，才是 Command Code 的核心。

DeepSeek v4 vs Opus 4.7：真正的胜负手叫 Taste

当话题进入数据和对比时，全场开始真正“上头”。在公开视频和帖子中，他们展示了一个现象：在相同的编码任务下，通过精心设计的提示和工作流，DeepSeek v4 这样的开源模型，可以在实际效果上逼近，甚至超过 Opus 4.7。

这里的关键词不是“调参”，也不是“微调”，而是他们反复提到的 Taste。Taste 并不是某个神秘算法，而是一种经验的集合：

你如何拆解一个任务
你在什么阶段要求模型给出代码、而不是解释
你如何限制它的自由度，避免生成不安全或低质量代码

正如节目里提到的：很多所谓“模型不行”，本质上是“使用方式太随意”。当你开始像对待初级工程师一样对待模型，结果会完全不同。

开源模型的真实上限，可能被我们低估了

视频后半段的讨论，逐渐从个案上升到趋势判断。一个值得所有从业者警惕的信号是：我们可能系统性地低估了开源模型的可塑性。

在节目中，他们提到，单纯“读榜单”“看评测”很容易得出错误结论。很多评测关注的是静态能力，而真实世界的编码工作，是一个高度动态、上下文密集、反馈频繁的过程。

一旦你把 Taste、流程设计、以及安全约束引入系统，模型之间的差距会被重新洗牌。闭源模型依然强，但“强”不再是压倒性的。这对创业者、独立开发者，甚至企业团队来说，都是一个极具现实意义的变化。

总结

这期视频真正的价值，不在于“DeepSeek 赢了谁”，而在于它逼着我们重新思考一个问题：你是在用模型，还是在消耗模型？ 对 AI 从业者来说，下一阶段的核心竞争力，很可能不再是“选哪个模型”，而是你有没有自己的 Taste——一套稳定产出高质量结果的方法论。现在就值得你行动的，是回看自己每天给模型的指令：它们，真的配得上一个优秀的工程师吗？

关键词： AI Agent， Coding Agent，开源模型， DeepSeek， Prompt 设计

事实核查备注：需要核查：1）DeepSeek v4 与 Opus 4.7 的具体对比来源与原始帖子；2）Taste 是否为正式提出的方法论还是经验性说法；3）CLAI 与 Command Code 的产品关系与时间线；4）视频实际时长以确认文章长度是否匹配。

返回文章列表