2025年AI工程真实图景:从500份调查看行业的集体焦虑与共识
正在加载视频...
视频章节
这是一份基于500名一线工程师的真实调查,揭示了2025年AI工程的实际状态:经验丰富的工程师依然“很新手”,LLM已无处不在,但工程体系却明显滞后。演讲用大量数据和幽默,勾勒出一个快速演进却充满结构性痛点的行业。
2025年AI工程真实图景:从500份调查看行业的集体焦虑与共识
这是一份基于500名一线工程师的真实调查,揭示了2025年AI工程的实际状态:经验丰富的工程师依然“很新手”,LLM已无处不在,但工程体系却明显滞后。演讲用大量数据和幽默,勾勒出一个快速演进却充满结构性痛点的行业。
为什么资深工程师也在“重新入行”
理解AI工程的现状,首先要理解“谁”在做这件事。Barr Yaron一开始就抛出了调查样本:这份《2025 AI Engineering Report》共收集了500份问卷,受访者大多是经验丰富的软件工程师。然而,数据却呈现出一种反直觉的断层——在拥有10年以上软件开发经验的人群中,接近一半与AI打交道的时间只有3年或更短。
这并不是能力问题,而是时代问题。正如演讲者在台上总结的那样:“change right now is the only constant even for the veterans。”对很多工程师而言,AI并不是渐进式技能升级,而是一次彻底的范式切换。过去十几年积累的软件工程最佳实践,并不能直接套用到以大语言模型(LLM)为核心的系统中。
这个背景非常关键。它解释了为什么行业整体在快速试错,也解释了后面一系列“看似不成熟”的工程现象:流程缺失、工具分裂、标准尚未形成。AI工程并不是一个由新手推动的领域,而是一个连老兵都必须边走边学的新战场。
LLM已经无处不在,但用途远比想象中杂乱
在“大家到底在用LLM做什么”这个问题上,报告给出的答案并不性感,却极其真实。Barr Yaron直言:“Let’s get into the juice.”结果发现,大多数团队并没有把LLM只用在单一场景,而是同时用于内部工具、外部产品,以及多个并行的用例。
这种“到处都在用”的状态,说明LLM已经从实验性技术,转变为通用能力组件。它既可能是内部的效率工具,也可能直接面向用户承担核心功能。但这也带来了复杂性:同一个团队,可能同时维护聊天界面、自动化流程和嵌入式智能能力。
值得注意的是,演讲并没有美化这种状态。相反,数据暗示出一种隐忧——当LLM被快速铺开,却缺乏统一的工程范式时,技术债会以非常隐蔽的方式积累。这也是为什么后续关于训练方式、提示管理和监控的问题,会显得如此尖锐。
训练、微调与提示工程:工程现实远比论文朴素
在模型训练和适配方式上,报告给出了一个非常“接地气”的结论:最常见的核心方法,仍然是“good old supervised fine-tuning”。监督微调,指的是用人工标注或整理好的数据,对预训练模型进行再训练,以更贴合特定任务。
当然,并非只有一种路径。调查中也出现了大量混合方案,但这恰恰说明工程团队更关心可控性和确定性,而不是追逐最新概念。相比复杂而脆弱的方案,大家更愿意选择自己能理解、能调试的方法。
然而,在提示工程(Prompt Engineering)这个看似“轻量”的环节,问题却集中爆发。尽管提示词频繁变更、直接影响系统行为,但仍有31%的受访者表示:他们“没有任何方式”来管理提示。这不是技术难题,而是工程意识的缺失——提示已经成为代码,却还没被当作代码对待。
从多模态到Agent:系统复杂度正在失控
随着多模态模型和AI Agent的引入,系统复杂度被再次放大。Barr Yaron在介绍多模态使用情况时调侃观众“get ready to see an audio wave”,暗示音频等新模态正在进入工作流,而不再只是研究展示。
更具挑战性的,是Agent系统的兴起。Agent通常需要调用工具、访问权限、执行多步任务,这使“工具授权”和安全边界成为新的工程难题。演讲者提到,大家对Agent充满期待,但真正落地时,往往会被权限管理和不可预测行为拖慢节奏。
这也直接引出了监控与可观测性的问题。为了让AI真正进入生产环境,团队必须知道系统在做什么。调查显示,在已经重视监控的人群中,35%主要选择自托管方案,30%依赖第三方服务。这种分裂本身就说明:行业仍在寻找最合适的工程平衡点。
总结
这场演讲最有价值的地方,并不在于某个具体技术选择,而在于它如实呈现了一个“尚未定型”的行业。AI工程已经足够重要,却还不够成熟;足够普及,却缺乏共识。正如那句玩笑式的总结——“it’s not you, it’s my algorithm”——很多痛点并非个人能力不足,而是整个工程体系仍在成长中。对每一位从业者而言,真正的启发或许是:与其追逐概念,不如先补齐那些最基础、却最容易被忽视的工程能力。
关键词: AI工程, 大语言模型, 监督微调, 提示工程, AI Agent
事实核查备注: 视频信息:The 2025 AI Engineering Report;演讲者:Barr Yaron;调查样本量:500人;资深工程师中近一半AI经验≤3年;31%无提示管理;监督微调为最常见训练方式;35%主要自托管监控,30%使用第三方;引用原话包括“change right now is the only constant”“good old supervised fine-tuning”“it’s not you, it’s my algorithm”。