她刚融了2亿美元，却说验证AI不是为防幻觉，而是放大天才

AI PM 编辑部 · 2026年06月03日 · 19 阅读 · AI/人工智能

正在加载视频...

视频章节

当整个行业都在为“AI幻觉”焦头烂额时，Axiom Math 创始人 Carina Hong 却抛出一个反直觉观点：验证不是为了纠错，而是为了扩张人类与 AI 的协作上限。这期 Latent Space 的对谈，解释了为什么数学证明、形式化语言和 AI Agent，可能才是下一波 AI 爆发的底座。

她刚融了2亿美元，却说验证AI不是为防幻觉，而是放大天才

当整个行业都在为“AI幻觉”焦头烂额时，Axiom Math 创始人 Carina Hong 却抛出一个反直觉观点：验证不是为了纠错，而是为了扩张人类与 AI 的协作上限。这期 Latent Space 的对谈，解释了为什么数学证明、形式化语言和 AI Agent，可能才是下一波 AI 爆发的底座。

2亿美元砸向数学：这不是烧钱，而是一次路线选择

节目一开始，主持人就抛出了一个足以让 VC 和研究人员同时愣住的数据：Axiom Math 刚刚完成了一轮高达 2 亿美元的融资，估值约 16 亿美元。有人在 LinkedIn 上感慨，这几乎等同于美国一整年的数学研究预算。

这不是一个“模型更大、更快、更便宜”的故事。Axiom 之所以引发关注，并不是因为又一个参数规模奇迹，而是因为它在一个长期被认为“慢、难、没市场”的方向上下注——形式化验证的数学 AI。

Carina Hong 的背景和选择本身就很有象征意义：她不是在追逐下一个聊天机器人，而是在问一个更底层的问题——当 AI 开始参与真正的知识创造，我们如何确保它不是在“凑答案”，而是在扩展人类的认知能力？

验证不是用来治幻觉的，而是用来放大“天才”的

全场最值得反复咀嚼的一句话，来自 Carina 对“verified AI”的重新定义。

她明确反对一种流行叙事：把验证当成“防止 AI 胡说八道”的补丁。在她看来，这个理解太保守了。“Verification is not about hallucination. Verification is about scaling brilliance.”

她用了一个极具冲击力的类比：拉马努金。拉马努金本身已经是天才，但如果他生活在一个有形式化验证、有协作工具的时代，他的天才不是被约束，而是被放大、被复利化。

在这个框架里，验证不再是一个‘检查步骤’，而是一种协作语言：
- 人与人，通过形式化语言提前对齐理解
- 人与 AI，通过可验证的中间表示共同探索
- 未来甚至是 AI 与 AI 之间的协作

这也是她反复强调的一点：verified AI 天生是“开放式协作”的，而不是为高度封闭、合规驱动的行业量身定做。

从 Proof Assistant 到 AI Agent：被低估的基础设施

很多人对 proof assistant（如 Lean）的印象，仍停留在“学术圈用来折磨研究生的工具”。但 Carina 给出了一个完全不同的视角。

她指出，形式化工具早在深度学习之前就存在，只是长期被视为“烦人但必要”的验证步骤。而现在，随着生成式模型的加入，这些工具第一次成为“生成本身的一部分”。

一个关键变化是：
- 形式化语言不再只是终点
- 它开始成为 AI 生成、推理、修正的中间层

这直接带来了她提到的“verified generation performance gain”：当生成过程本身被嵌入可验证结构，AI 不只是更可靠，还会更有探索效率。

从这个角度看，Lean 这类系统的价值不止是“数学”或“代码”，而是一种跨领域的通用接口——你既可以写程序，也可以做数学发现。

当 AI 开始“证明”而不是“猜”：为什么投资人买账

一个现实问题始终悬在空中：市场在哪里？

节目中，主持人直接追问：一个专注于验证和数学证明的 AI 公司，凭什么支撑 16 亿美元的估值？

Carina 的回答没有落在短期应用上，而是指向一个更长的时间尺度：

一旦 AI 能够在形式化约束下，持续地产生、验证、累积新的知识结构，那么我们看到的将不只是“解决几个 benchmark”，而是“整套数学发现代码库的出现”。

她提到，Axiom 的系统已经能够在数论、交换代数等领域，解决真实的开放研究问题。这不是刷题，而是进入了知识生产的核心地带。

在这个意义上，投资人看到的并不是一个数学工具，而是一种可能重塑科研与软件工程的基础设施。

如果一切都能被指定，就一切都能被证明？

对话后半段，话题触及了计算理论中的经典限制，比如 Rice 定理——你无法证明任意程序的非平凡性质。

Carina 并没有回避这些边界。相反，她强调一个更务实的观点：关键不在于“能不能证明所有东西”，而在于“你能否把真正重要的东西，指定清楚”。

只要问题被表达为满足可验证条件的形式化程序，证明就变成了一个工程问题，而不是哲学问题。

这也解释了她反复提到的动机来源：好奇心、理解欲，以及那种“看到结构之美”的满足感。对她而言，verified AI 并不是冷冰冰的约束系统，而是一种让探索变得更自由的工具。

总结

这期对谈真正颠覆人的地方，不在于融资数字，而在于思路的翻转：验证不是 AI 的刹车，而是油门。如果你在做 AI Agent、科研自动化或复杂系统，Carina Hong 提供了一个值得认真考虑的方向——把精力从“如何让模型少犯错”，转向“如何让正确的东西被持续放大”。未来真正拉开差距的，也许不是谁的模型更大，而是谁拥有可验证、可协作、可累积的知识结构。

关键词：验证AI，形式化证明， AI Agent，幻觉， Axiom Math

事实核查备注：需要核查：Axiom Math 融资金额是否为 2 亿美元；估值是否约 16 亿美元；美国年度数学研究预算约 2.5 亿美元的说法来源；Axiom 在 Putnam Exam 获得满分及解决开放研究问题的具体时间与范围。

返回文章列表