从规模到适应:François Chollet揭示通用人工智能的真正突破口

AI PM 编辑部 · 2025年07月03日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

本文带你走进François Chollet在Y Combinator的演讲,了解AI领域从“规模化预训练”到“测试时自适应”的重大范式转变,以及ARC系列基准如何推动AGI的真正进步。文章还揭示了人类智能的本质、AI模型的瓶颈,以及未来AI如何像程序员一样自主发明和学习。

从规模到适应:François Chollet揭示通用人工智能的真正突破口

本文带你走进François Chollet在Y Combinator的演讲,了解AI领域从“规模化预训练”到“测试时自适应”的重大范式转变,以及ARC系列基准如何推动AGI的真正进步。文章还揭示了人类智能的本质、AI模型的瓶颈,以及未来AI如何像程序员一样自主发明和学习。

规模化预训练的极限:为什么“更大”不等于更聪明

在过去十年,AI领域几乎被“规模化预训练”主导——也就是把越来越多的数据灌入更大的模型,用同样的架构和训练流程,不断刷新各类基准成绩。François Chollet用一组数据开场:“2010年代,GPU算力和大数据集让深度学习真正起飞,AI在计算机视觉和自然语言处理领域取得了前所未有的突破。”但他很快指出,这种进步其实有隐患。许多人曾乐观地认为,只要继续扩大模型和数据,通用人工智能(AGI)会自然涌现。但在ARC(Abstraction and Reasoning Corpus)基准上,哪怕模型规模提升了五万倍,准确率却从0%只提升到10%,远低于人类95%以上的成绩。Chollet直言:“我们对这些基准的意义产生了误解。”这个故事提醒我们,AI的“记忆化技能”与“流动性智能”之间有本质区别,后者才是理解和应对新问题的关键。

ARC基准的诞生:用“流动性智能”挑战AI的舒适区

2019年,Chollet发布了ARC1,一个专为衡量AI流动性智能设计的基准。他回忆道:“ARC就像机器和人类的IQ测试,每道题都是独一无二的,无法靠死记硬背解决。”ARC的设计理念是让AI和人类都必须现场推理,不能提前准备。所有任务都基于基础知识,比如物体性、初级物理、几何、计数——这些都是四岁儿童都能掌握的概念。Chollet强调:“ARC不是终点,而是一支指向正确方向的箭头。”这个基准的最大意义在于,它揭示了AI模型在面对新颖问题时的巨大短板。即使是最先进的大语言模型,如GPT-4.5和Llama 4,在ARC2上依然只能做到0-2%的准确率。只有采用“测试时自适应”(Test-Time Adaptation, TTA)技术的模型才能有所突破,但距离人类水平仍有很大差距。

范式转变:从静态技能到动态适应,AI迎来新纪元

2024年,AI研究界迎来转折点,开始大规模转向“测试时自适应”范式。Chollet描述这一变化:“这不再是查询预加载知识,而是模型在推理时根据新数据动态调整自身状态。”OpenAI的O3模型首次在ARC基准上达到人类水平,标志着AI开始具备流动性智能的雏形。TTA技术包括测试时训练、程序合成、思路链合成等,核心在于让模型能像人类一样“现场学习”。Chollet提出了一个关键问题:“为什么预训练规模化没能带我们到AGI?而测试时适应能否实现这一目标?”他认为,只有能在新环境下自主学习和调整的AI,才具备真正的智能。ARC2和即将发布的ARC3进一步提升了评测难度,要求AI不仅要解决问题,还要像人类一样高效地探索、学习和自主设定目标。

智能的本质:抽象、效率与人类式组合思维

Chollet对智能的定义极具洞见:“智能是你用过往信息高效应对未来未知的能力。”他提出“万花筒假说”,认为世界的复杂性其实源自少量“意义原子”的重组,智能就是高效挖掘并重组这些抽象。AI模型要想接近人类智能,必须具备两种抽象能力:一是连续域上的“值中心抽象”(直觉、感知),二是离散域上的“程序中心抽象”(推理、规划)。他用形象比喻:“左脑负责感知和直觉,右脑负责推理和计划。”目前的Transformer模型在第一种抽象上表现优异,但在第二种——比如排序、加法等离散任务上却力不从心。Chollet指出:“深度学习擅长自动化,但发明和创造则需要离散程序搜索。”他强调,只有将这两种抽象能力结合,AI才能像人类一样,在下棋时用直觉筛选选项,再用推理做出决策。

未来展望:AI将成为程序员式的元学习者

Chollet在演讲结尾描绘了AI的未来蓝图:AI将像程序员一样,面对新任务时能动态组合已有抽象模块,现场编写适应性程序。他介绍了自己创办的新实验室Tendia,目标是打造能自主发明和发现的AI系统,以加速科学进步。“我们的第一步,是用一个从零开始的系统解决ARC系列基准,最终希望AI能像人类研究者一样扩展知识边界。”在ARC3中,AI不仅要解决问题,还要在有限行动数内高效探索、学习和设定目标。Chollet用一句话总结:“我们需要的是能自主发明的AI,而不仅仅是自动化已知任务。”这个愿景不仅关乎技术突破,更关乎人类与AI协作的未来。

总结

François Chollet的演讲揭示了AI领域最核心的转折:规模化预训练不是通往AGI的唯一道路,测试时自适应和高效抽象才是关键。ARC系列基准推动了行业对“流动性智能”的关注,也让我们看清了AI与人类智能的本质差异。未来,AI将像程序员一样自主学习和发明,成为科学进步的加速器。对于每一个关注AI的人来说,这不仅是技术路线的选择,更是对智能本质的深刻思考。


关键词: 通用人工智能, ARC基准, 测试时自适应, 抽象, 深度学习

事实核查备注: François Chollet, Y Combinator, ARC1/ARC2/ARC3, O3模型, OpenAI, GPT-4.5, Llama 4, Tendia实验室, Test-Time Adaptation (TTA), 万花筒假说, Transformer, program-centric abstraction, value-centric abstraction, 2019年ARC1发布, 2024年O3模型ARC人类水平, 50,000x模型规模提升, ARC1人类>95%, AI模型ARC2准确率0-2%, ARC3即将发布