为什么AI代理还没真正自动化企业流程?
Thomson Reuters Labs 的 Shirsha Chaudhuri 通过真实的企业一线经验,拆解了“AI 工作流自动化”迟迟难以落地的关键原因。问题不在模型能力,而在连接、可靠性、标准化和人与 AI 的协作方式。
Thomson Reuters Labs 的 Shirsha Chaudhuri 通过真实的企业一线经验,拆解了“AI 工作流自动化”迟迟难以落地的关键原因。问题不在模型能力,而在连接、可靠性、标准化和人与 AI 的协作方式。
在 AI Agent 工具爆发的当下,Aparna Dhinkaran 提醒行业:真正决定成败的不是你能不能“做出 Agent”,而是你是否知道它在真实世界里有没有正确工作。这场演讲系统拆解了 Agent 的结构、评估方法,以及语音与多模态时代带来的全新挑战。
Apache Ranger 创始成员 Don Bosco Durai 结合自身开源与创业经历,系统拆解了 AI Agent 在企业落地时被严重低估的安全与合规问题,并给出一套可执行的三层方法论:从安全评估、零信任执行到持续可观测性,帮助团队真正把 Agent 放进生产环境。
LinkedIn并非一开始就要打造宏大的GenAI平台,而是在真实产品压力下,一步步演化出支撑AI Agent的基础设施。本文还原Xiaofeng Wang的分享,讲清楚他们为何自建平台、如何从简单Prompt走向多智能体系统,以及这些选择背后的工程与组织洞见。
这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。
一家只有两名核心工程师参与的团队,如何在金融这种高风险场景中,把AI Agent真正推到生产环境,并支撑每天千万级请求?这场分享讲清了从GPT-4试水、成本失控,到微调小模型实现质量、成本、延迟三赢的完整路径。
RAG(检索增强生成)的提出者Douwe Kiela,用真实的企业落地经验解释了一个残酷现实:AI投入巨大,但真正产生价值的公司不到四分之一。这篇文章提炼了他在生产环境中踩过的坑、反直觉的认知,以及为什么“系统”和“上下文”才是AI ROI的决定因素。
YC最新视频聚焦AI代理平台Manis:它并非更强的单一模型,而是一套精密的多智能体协作系统。文章深入拆解其技术架构、真实能力、成本优势,以及“应用层rapper”模式的机会与隐忧,帮助读者理解AI代理下一阶段真正的竞争焦点。
这是一场来自彭博社AI工程负责人Anju Kambadur的实战分享。她没有停留在“Agent很有前途”的空谈,而是用彭博在真实金融场景中的产品经验,讲清楚什么是可落地的Agent、为什么必须是“半自动”、以及在高风险行业里,Agent规模化的真正难点。
Ramp工程负责人Rahul Sengottuvelu用真实生产系统说明:在大模型时代,最该被优化的不是规则和代码,而是“能否随算力变强”的系统结构。这是一场关于Agent架构、工程取舍和未来软件形态的反直觉分享。