一次“黑客式”复盘：YC 2025 春季 AI Agent 的真实安全隐患

AI PM 编辑部 · 2025年07月30日 · 31 阅读 · AI/人工智能

正在加载视频...

视频章节

YC 创业公司 Casco 的 CEO Renee Brandel 现场拆解了他们如何“黑进”一批 AI Agent。与其说是炫技，这更像一次对新一代智能应用安全底座的集体体检，揭示了当下 Agent 系统中最容易被忽视、却最致命的设计问题。

一次“黑客式”复盘：YC 2025 春季 AI Agent 的真实安全隐患

YC 创业公司 Casco 的 CEO Renee Brandel 现场拆解了他们如何“黑进”一批 AI Agent。与其说是炫技，这更像一次对新一代智能应用安全底座的集体体检，揭示了当下 Agent 系统中最容易被忽视、却最致命的设计问题。

为什么要“黑”AI Agent：从好奇心到现实威胁

这场演讲一开始就抛出了一个看似挑衅、实则务实的问题：为什么要主动去攻击 AI Agent？Renee Brandel 给出的背景非常直接——她是 Casco 的 CEO，这是一家 YC 体系内、专门做 AI 应用和 Agent 红队测试（red teaming）的公司。红队测试的核心目标不是炫耀漏洞，而是提前发现系统在真实世界中会如何被滥用。

她提到，这次选择 YC Spring 2025 batch 的 AI Agent 作为研究对象，并不是因为这些团队做得“不够好”，而恰恰相反：这些产品代表了当前创业者对 Agent 能力的最前沿探索。也正因为如此，它们暴露的问题，往往不是初级错误，而是整个行业在新范式下共同面对的盲区。

Renee 在台上用一句轻松但意味深长的话总结动机：“why did we even hack a bunch of agents”。在她看来，如果今天不由建设者自己去拆解、去攻击这些系统，那么明天这么做的，就会是真正的恶意攻击者。Agent 不再只是‘会聊天的模型’，而是开始拥有工具、权限和行动能力，这使得安全问题从‘提示词是否泄露’，升级为‘系统是否会被越权操控’。

最常见、也最危险的问题：跨数据访问失控

在所有发现的问题中，Renee 把“cross data access”（跨数据访问）放在了第一位。她明确指出，这是当前 AI Agent 架构中最普遍、也最容易被低估的风险来源。很多团队在设计 Agent 时，默认它们“应该”能够访问多个数据源、文件或上下文，却没有精细化地限制边界。

在演讲中，她强调这一点的重要性时说：“the most common issues are… cross data access”。这并不是传统意义上的数据库泄露，而是 Agent 在执行任务链时，意外地读到了不属于当前用户、当前任务的数据。这类问题尤其容易出现在多 Agent 协作、或一个 Agent 服务多个用户的场景中。

更棘手的是，这种漏洞往往不会在功能测试中暴露。Agent 看起来“完成了任务”，结果也似乎合理，但它背后的路径却可能已经越权。Renee 的警告很明确：当 Agent 被赋予‘帮你自动完成事情’的能力时，任何一次未受控的数据访问，都可能被放大成系统级风险。这是一个属于 Agent 时代的新问题，用传统 Web 应用的安全直觉，很容易低估它。

认证与授权：老问题，在新世界里被重新放大

如果说跨数据访问是新形态的问题，那么认证（authentication）和授权（authorization）则是“老问题的新版本”。Renee 在演讲中多次回到这一主题，并直言：很多 Agent 系统在这一步走得太快了。

她指出，开发者往往更关注 Agent 能不能顺利调用工具，却忽略了一个基本问题——“authenticate and authorize”。也就是说，Agent 现在用的到底是谁的身份？它是否真的被允许执行这一步操作？在传统系统中，这些边界通常由明确的 API 层来控制，但在 Agent 通过自然语言决策行动时，这些边界变得模糊。

在其中一个案例描述中，她提到 Agent 可以“write a Python file and read some files”，听起来像是强大功能，但如果缺乏严格的授权模型，这种能力本身就是攻击面。她半开玩笑地补了一句：“Trust me.” 这既是经验之谈，也是对台下工程师的提醒：不要因为系统‘看起来在内部运行’，就放松对身份和权限的要求。

从“能跑就行”到新范式：给 Agent 时代的三点带走思考

在演讲的最后一部分，Renee 把视角从具体漏洞拉回到更宏观的层面。她明确表示，这些问题并不是为了指责某几个团队，而是为了帮助整个行业“take it forward to a new technology paradigm”。Agent 不是简单的功能升级，而是软件构建方式的变化。

她希望观众最终能带走“三件事”。虽然演讲中并未把它们包装成口号，但核心思路非常清晰：第一，不要假设 Agent 是‘可信的员工’，它只是代码和模型；第二，所有能力一旦自动化，就必须同步引入更严格的安全边界；第三，Agent 的安全设计应该从第一天开始，而不是产品成熟之后再补。

当掌声响起时，这场分享更像一次集体预警。Agent 时代的风险，并不会以传统漏洞的形式出现，而是隐藏在‘它帮你做事’的每一个便利之中。Renee 的分享提醒大家：真正成熟的 Agent 产品，不只是更聪明，而是更可控。

总结

这次对 YC Spring 2025 AI Agent 的“黑客式”复盘，本质上是一堂关于边界感的课程。Renee Brandel 用真实测试经验提醒我们：当软件开始替人行动，安全问题就不再是附加项，而是系统能力的一部分。对所有正在构建 Agent 的团队来说，真正的竞争力，可能来自那些用户永远看不见、却决定系统能否长期存在的设计选择。

关键词： AI Agent，安全，红队测试， Y Combinator， Casco

事实核查备注：演讲者：Renee Brandel（Casco CEO）；公司：Casco（YC 公司）；视频主题：Hack YC Spring 2025 batch 的 AI Agents；核心问题：cross data access、authentication、authorization；引用原话包括“why did we even hack a bunch of agents”“the most common issues are… cross data access”“authenticate and authorize”“Trust me.”

返回文章列表