她刚融了2亿美元,却说验证AI不是为防幻觉,而是放大天才

AI PM 编辑部 · 2026年06月03日 · 19 阅读 · AI/人工智能

正在加载视频...

视频章节

当整个行业都在为“AI幻觉”焦头烂额时,Axiom Math 创始人 Carina Hong 却抛出一个反直觉观点:验证不是为了纠错,而是为了扩张人类与 AI 的协作上限。这期 Latent Space 的对谈,解释了为什么数学证明、形式化语言和 AI Agent,可能才是下一波 AI 爆发的底座。

她刚融了2亿美元,却说验证AI不是为防幻觉,而是放大天才

当整个行业都在为“AI幻觉”焦头烂额时,Axiom Math 创始人 Carina Hong 却抛出一个反直觉观点:验证不是为了纠错,而是为了扩张人类与 AI 的协作上限。这期 Latent Space 的对谈,解释了为什么数学证明、形式化语言和 AI Agent,可能才是下一波 AI 爆发的底座。

2亿美元砸向数学:这不是烧钱,而是一次路线选择

节目一开始,主持人就抛出了一个足以让 VC 和研究人员同时愣住的数据:Axiom Math 刚刚完成了一轮高达 2 亿美元的融资,估值约 16 亿美元。有人在 LinkedIn 上感慨,这几乎等同于美国一整年的数学研究预算。

这不是一个“模型更大、更快、更便宜”的故事。Axiom 之所以引发关注,并不是因为又一个参数规模奇迹,而是因为它在一个长期被认为“慢、难、没市场”的方向上下注——形式化验证的数学 AI。

Carina Hong 的背景和选择本身就很有象征意义:她不是在追逐下一个聊天机器人,而是在问一个更底层的问题——当 AI 开始参与真正的知识创造,我们如何确保它不是在“凑答案”,而是在扩展人类的认知能力?

验证不是用来治幻觉的,而是用来放大“天才”的

全场最值得反复咀嚼的一句话,来自 Carina 对“verified AI”的重新定义。

她明确反对一种流行叙事:把验证当成“防止 AI 胡说八道”的补丁。在她看来,这个理解太保守了。“Verification is not about hallucination. Verification is about scaling brilliance.”

她用了一个极具冲击力的类比:拉马努金。拉马努金本身已经是天才,但如果他生活在一个有形式化验证、有协作工具的时代,他的天才不是被约束,而是被放大、被复利化。

在这个框架里,验证不再是一个‘检查步骤’,而是一种协作语言:
- 人与人,通过形式化语言提前对齐理解
- 人与 AI,通过可验证的中间表示共同探索
- 未来甚至是 AI 与 AI 之间的协作

这也是她反复强调的一点:verified AI 天生是“开放式协作”的,而不是为高度封闭、合规驱动的行业量身定做。

从 Proof Assistant 到 AI Agent:被低估的基础设施

很多人对 proof assistant(如 Lean)的印象,仍停留在“学术圈用来折磨研究生的工具”。但 Carina 给出了一个完全不同的视角。

她指出,形式化工具早在深度学习之前就存在,只是长期被视为“烦人但必要”的验证步骤。而现在,随着生成式模型的加入,这些工具第一次成为“生成本身的一部分”。

一个关键变化是:
- 形式化语言不再只是终点
- 它开始成为 AI 生成、推理、修正的中间层

这直接带来了她提到的“verified generation performance gain”:当生成过程本身被嵌入可验证结构,AI 不只是更可靠,还会更有探索效率。

从这个角度看,Lean 这类系统的价值不止是“数学”或“代码”,而是一种跨领域的通用接口——你既可以写程序,也可以做数学发现。

当 AI 开始“证明”而不是“猜”:为什么投资人买账

一个现实问题始终悬在空中:市场在哪里?

节目中,主持人直接追问:一个专注于验证和数学证明的 AI 公司,凭什么支撑 16 亿美元的估值?

Carina 的回答没有落在短期应用上,而是指向一个更长的时间尺度:

一旦 AI 能够在形式化约束下,持续地产生、验证、累积新的知识结构,那么我们看到的将不只是“解决几个 benchmark”,而是“整套数学发现代码库的出现”。

她提到,Axiom 的系统已经能够在数论、交换代数等领域,解决真实的开放研究问题。这不是刷题,而是进入了知识生产的核心地带。

在这个意义上,投资人看到的并不是一个数学工具,而是一种可能重塑科研与软件工程的基础设施。

如果一切都能被指定,就一切都能被证明?

对话后半段,话题触及了计算理论中的经典限制,比如 Rice 定理——你无法证明任意程序的非平凡性质。

Carina 并没有回避这些边界。相反,她强调一个更务实的观点:关键不在于“能不能证明所有东西”,而在于“你能否把真正重要的东西,指定清楚”。

只要问题被表达为满足可验证条件的形式化程序,证明就变成了一个工程问题,而不是哲学问题。

这也解释了她反复提到的动机来源:好奇心、理解欲,以及那种“看到结构之美”的满足感。对她而言,verified AI 并不是冷冰冰的约束系统,而是一种让探索变得更自由的工具。

总结

这期对谈真正颠覆人的地方,不在于融资数字,而在于思路的翻转:验证不是 AI 的刹车,而是油门。如果你在做 AI Agent、科研自动化或复杂系统,Carina Hong 提供了一个值得认真考虑的方向——把精力从“如何让模型少犯错”,转向“如何让正确的东西被持续放大”。未来真正拉开差距的,也许不是谁的模型更大,而是谁拥有可验证、可协作、可累积的知识结构。


关键词: 验证AI, 形式化证明, AI Agent, 幻觉, Axiom Math

事实核查备注: 需要核查:Axiom Math 融资金额是否为 2 亿美元;估值是否约 16 亿美元;美国年度数学研究预算约 2.5 亿美元的说法来源;Axiom 在 Putnam Exam 获得满分及解决开放研究问题的具体时间与范围。