哪些工作会被AI彻底自动化?一套判断方法与两个真实案例
正在加载视频...
视频章节
这篇文章基于Theory Ventures合伙人Andy Tadman的演讲,系统拆解了“大语言模型在哪些工作上已经是超人级别”的判断方法。你将看到一套清晰的自动化评估框架,以及安全运营和客户营销两个真实案例,理解为什么真正被颠覆的不是“复杂工作”,而是“高频工作”。
哪些工作会被AI彻底自动化?一套判断方法与两个真实案例
这篇文章基于Theory Ventures合伙人Andy Tadman的演讲,系统拆解了“大语言模型在哪些工作上已经是超人级别”的判断方法。你将看到一套清晰的自动化评估框架,以及安全运营和客户营销两个真实案例,理解为什么真正被颠覆的不是“复杂工作”,而是“高频工作”。
别再泛谈“岗位”,AI自动化必须拆到任务级
为什么很多关于“AI会不会取代某某职业”的讨论都失焦?Andy Tadman一上来就点破问题:我们讨论错了粒度。不是“岗位”,而是“任务”。
在Theory Ventures的研究方法中,每一个岗位都会被拆解成一系列可执行的任务和子任务。例如在安全运营(Security Operations)中,一个分析师的工作并不是“处理安全事件”,而是:接收告警、查询系统、补充上下文信息、整合结果、分析判断,然后反复迭代直到得出结论。甚至在“查询”这个步骤里,还可以继续拆成选择工具、写查询语句、调试错误。
Andy特别强调了两个容易被忽略的事实。第一,“一份工作不一定对应一个人”,它可能由多人协作完成,也可能部分已经被自动化系统接管。第二,一个人的工作不仅是核心任务,还包括大量会议、沟通、协作等组织行为,而这些对自动化的影响非常不同。
这也是他反复强调的一句话:“When you’re thinking about AI automating workflows, you need to get really specific.”如果不拆到任务层面,就根本无法判断LLM真正能替代什么、不能替代什么。
LLM真正擅长的三件事,决定了它能自动化什么
理解LLM能做什么,必须回到它的本质。Andy给出了一个极其克制但准确的定义:“All an LLM is trained to do is to model the distribution of the data that it’s trained on.”正是这一点,催生了三个对工作流自动化至关重要的能力。
第一是“转化(Transformation)”。把信息从一种格式变成另一种格式,比如PDF到表格、表格到邮件、邮件到JSON。历史上,数据整合和格式转换一直是自动化的最大阻力,而LLM几乎天然解决了这个问题。
第二是“综合(Synthesis)”。不是简单总结,而是从大量信息中提炼结论、回答问题。Theory内部已经在使用Gemini和OpenAI的深度研究工具,一次性总结数百个网站来判断某个技术或市场。
第三是“推理(Reasoning)”。Andy的表述非常谨慎:LLM并不是真正在“思考”,而是在拟合人类书面推理的分布。这意味着它在常识、代码、数学、逻辑等有大量公开文本的数据领域表现很好,但在安全分析师、律师、会计等高度依赖隐性经验的领域,还需要大量定制数据。这反而成为初创公司的差异化机会。
这三种能力,直接决定了LLM在哪些任务上是“勉强可用”,在哪些地方是“压倒性优势”。
真正被颠覆的,是“高频、低复杂度”的工作
Andy提出了一条极具操作性的判断轴:用“任务复杂度”和“任务量级”来看待所有工作。
在光谱的一端,是低频但高度复杂的工作,比如战略规划。这类工作短期内更多是Copilot形态,“人驱动,AI加速”。中间地带,是客户支持等核心流程自动化场景,LLM可以覆盖40%到70%的日常工作,但仍需要人工介入和配置。
而最激进、也最有创业机会的区域,是“高频、相对低复杂度”的工作。Andy用了一个非常有记忆点的说法:“These are jobs that are hard because of scale.”难的不是判断,而是数量。
在这里,LLM的对手甚至不是人类,而是上一代的规则引擎。Andy直言,在很多人担心“LLM只有80%到90%可靠性”的场景里,它依然可以“10倍好于人类”,因为只要能完成一次,它就能完成一千次、一万次,而且不会疲劳、不会打错字。
“Competition is no longer AI versus human, it’s AI versus rules-based software.”这句话,几乎定义了这一代AI自动化公司的真正战场。
两个真实案例:安全告警与千万级用户沟通
第一个案例来自Theory投资的Dropzone AI,面向安全运营中心。随着公司购买的安全产品越来越多,告警数量呈指数增长,分析师往往只能查看1%的告警,其余交给规则系统处理。这不仅效率低,而且工作极度重复,全球还缺口约400万名安全分析师,人员流失率极高。
Dropzone构建的是端到端的Agent系统,完整执行调查流程。它们精通所有查询语言、不犯拼写错误、拥有近乎完美的记忆,并且可以7×24小时运行。Andy特别指出,关键并不是它们“比人更聪明”,而是“比规则系统更好”已经足够。更重要的是,系统还能跨客户共享新威胁的学习成果。
第二个案例是客户互动平台Amp。在营销中,决定“给一个用户发什么消息”并不难,难的是“给一百万个用户分别发什么”。规则式旅程在面对时间、渠道、偏好等变量时会发生组合爆炸。
Amp的Agent系统持续试验不同文案、时机和渠道,让营销团队从“规则维护者”转变为“实验设计者”。一个极具故事性的发现来自某食品配送客户:系统识别出一群只在晚上11点或午夜响应的“夜宵用户”,这是人类团队过去从未意识到的用户群体。这种洞察,本身就成为了战略资产。
总结
这场演讲真正的价值,不在于告诉你“哪些岗位会消失”,而是提供了一套可反复使用的判断框架:拆解到任务、评估复杂度与频率、理解LLM的真实能力边界。对于创业者,这是寻找“技术问题匹配”的地图;对于管理者,这是重新设计组织结构的起点。当高频工作被系统接管,组织将从金字塔走向“倒金字塔”或“菱形”,而真正稀缺的,将是能设计、审查和进化这些系统的人。
关键词: 大语言模型, AI自动化, AI Agent, 工作流自动化, Copilot
事实核查备注: 演讲者:Andy Tadman(Theory Ventures合伙人);投资机构:Theory Ventures(旧金山);核心能力:Transformation、Synthesis、Reasoning;提及产品:Gemini、OpenAI深度研究工具;案例公司:Dropzone AI(安全运营)、Amp(客户互动);数字:全球约400万名安全分析师缺口;观点原话包括“model the distribution of the data”“AI versus rules-based software”“jobs that are hard because of scale”。