当云架构变成认知工作:多智能体如何真正“会思考”

AI PM 编辑部 · 2025年06月03日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这场演讲分享了Cato在构建云架构AI Copilot过程中的真实探索:为什么传统自动化不够用,以及如何通过多智能体、图结构和严谨评估,让AI参与复杂的架构推理与决策。

当云架构变成认知工作:多智能体如何真正“会思考”

这场演讲分享了Cato在构建云架构AI Copilot过程中的真实探索:为什么传统自动化不够用,以及如何通过多智能体、图结构和严谨评估,让AI参与复杂的架构推理与决策。

为什么云架构需要“推理”,而不是更多自动化

这一切的出发点,是一个对行业并不讨巧、但极其重要的判断:云架构设计本质上是认知工作。演讲一开始,Iman Makaremi就点明,“Cloud architecture needs reasoning, not just automation.” 随着云系统规模膨胀,工具、约束和组织预期同步增长,架构师每天面对的不是‘怎么部署’,而是‘为什么这么设计’。

他将架构工作拆解为辩论、权衡和规划:同样的需求,不同团队、不同背景会给出截然不同的方案。这些决策背后充满隐性知识——组织偏好、历史包袱、风险容忍度——而这恰恰是传统自动化脚本无法捕捉的部分。Cato因此将问题重新表述为三个认知挑战:需求理解、架构识别、以及基于最佳实践的架构推荐。

这个转折非常关键:他们不是从“让AI画架构图”开始,而是先研究“架构师是如何思考的”。这也是全文反复出现的核心观点——如果不先理解人的推理路径,AI再聪明也只是在做表面模仿。

从文本到图:让需求和架构“说同一种语言”

理解问题之后,真正的技术难题才开始显现:需求是文本,架构是图。一个是自然语言,一个是由组件、连接和约束构成的关系网络。Iman将这称为“语义世界”和“图世界”的断裂。

他们最早的尝试相当直接:用语义Embedding和向量数据库做架构检索,把复杂架构拆成组件,再通过向量搜索匹配需求。初期效果“看起来不错”,检索速度和表层相关性都有提升,但很快撞上瓶颈——语义搜索并不擅长理解结构关系。换句话说,它知道‘像不像’,却不知道‘连不连得上’。

同样的问题也出现在需求侧。通过模板化和文档预处理,他们能更快抽取关键信息,但在大规模文档中,这种方法会丢失上下文。Iman直言,这是一个重要教训:规模一上来,只有图分析才能找到“对的上下文”。因此,他们逐步转向图结构和知识图谱,用图内存来维持连续性和因果关系,而不仅是相似度。

多智能体不是热闹,而是有组织的“争论”

当系统开始真正参与设计,新的问题出现了:架构设计本身充满冲突目标。成本、安全、性能、可维护性往往互相拉扯,一个“正确答案”几乎不存在。Iman的判断是,这种场景不适合单一模型,而需要会协作、会争论的多智能体系统。

他们构建了角色明确的智能体:有的负责需求,有的负责架构,有的像总架构师一样做裁决。一个关键设计是结构化消息格式和内存隔离,这显著减少了token浪费和幻觉问题。他们甚至使用“agent cloning”,为每个候选方案复制一组智能体并行工作。

但他也坦率承认,结构化输出是一把双刃剑:它提升了可控性,却牺牲了一部分推理自由度。因此他们引入动态编排,让系统在严格控制流下,仍能产生创造性方案。这种平衡,是多智能体系统从“演示”走向“可用”的分水岭。

从推荐到评估:为什么人类依然不可替代

在生产系统中,Cato的Copilot会输出完整的架构推荐:包含类别、目标状态、差距分析和具体行动。工作流被拆成三个阶段:列表生成、冲突消解和设计提案,由首席架构师Agent协调多名专家Agent并行完成。

真正棘手的,是评估。Iman分享了一个略显反直觉的结论:在复杂多智能体系统中,人类评估远比LLM自评有效。他们因此构建了内部工具Eagle Eye,用来回放需求、架构、Agent对话和最终建议,并从相关性、可见性、清晰度进行人工打分。

他总结了几条血的教训:“Confidence is not correctness.” 早期必须引入人类反馈,而且评估不能事后补救,而要从系统设计阶段就内嵌进去。这也是他们对‘Copilot’的定义:不是替代决策,而是参与推理。

总结

这场演讲最有价值的地方,不在于某个具体技术栈,而在于一整套关于“推理型系统”的思维方式。从语义到图,从单模型到多智能体,从自动化到认知协作,Iman展示了一条真实、曲折但可复用的路径。对任何试图构建复杂AI Copilot的人来说,这都是一次重要提醒:真正难的不是生成答案,而是理解问题、组织推理,并承认人类依然是系统的一部分。


关键词: 多智能体, 云架构, 推理系统, 图结构, AI Copilot

事实核查备注: 演讲者:Iman Makaremi;主题:Grounded Reasoning Systems for Cloud Architecture;公司:Cato;技术名词:Multi-agent orchestration、Embedding、Vector database、Graph-based memory、Knowledge graph、LangGraph;内部工具:Eagle Eye;核心原话包括“Cloud architecture needs reasoning, not just automation.”、“Confidence is not correctness.”