AutoGPT 爆红三周后,行业集体冷静:它可能“太自动化了”
三周前,AutoGPT 和 BabyAGI 被吹成“改变一切的 AI 助手”;三周后,最早冲上去试用的人开始集体泼冷水:它们很酷,但几乎没法用。这不是技术失败,而是一次关于“AI Agent 应该做什么”的认知纠偏。
三周前,AutoGPT 和 BabyAGI 被吹成“改变一切的 AI 助手”;三周后,最早冲上去试用的人开始集体泼冷水:它们很酷,但几乎没法用。这不是技术失败,而是一次关于“AI Agent 应该做什么”的认知纠偏。
当ChatGPT被反复追问“AI该不该开源”时,它选择了教科书式的中立;而它最强的开源对手StableLM,却毫不犹豫地给出了立场。这不是一次简单的模型对比,而是一次关于权力、商业与未来AI走向的正面碰撞。
马斯克一句“微软非法用推特数据训练AI”,把一场早已暗流涌动的冲突推到台前。几乎同一时间,Reddit开始向AI公司收费,AI版“德雷克”横扫全网又被下架。看似分散的新闻,其实都指向同一个核心问题:谁拥有训练AI的权利?
当大家还沉浸在“AI会画画”的震撼中,一个更危险的能力正在浮出水面:AI开始真正“看懂”图片,并且能和你聊它。MiniGPT-4,这个刚亮相的开源研究项目,用一组演示把多模态AI从概念,直接拉进了可实操阶段。
当所有人都以为算力、数据和资本只会把AI推向更封闭的巨头游戏时,一波开源模型却开始“逆袭”。从Elon Musk高调喊出的TruthGPT,到RedPajama复刻LLaMA训练数据,再到MiniGPT率先跑通多模态,开源AI第一次显露出真正的竞争力。
如果你还以为 AI 只是“回答问题”,那你已经落后了。AutoGPT 出现不到一周,就有人让它自己找商机、装开发环境、写代码、跑业务,甚至把待办清单“执行掉”。这不是 Demo,这是一场关于 AI Agent 的提前预演。
这篇文章提炼了Y Combinator关于生成式AI的一次关键对话,重点不在模型参数,而在如何正确理解能力边界、开发者策略以及AI Agent可能带来的下一次飞跃。读完你会更清楚:哪些期待是现实的,哪些地方必须“非常谨慎”。
Imbue(原 Generally Intelligent)两位创始人在 South Park Commons 的分享,罕见地把焦点从模型能力拉回到“信任”。他们解释了为何能替你行动的 AI Agent 必须首先是可理解、可检查、可解释的系统,以及他们为何用 Avalon 这样的模拟环境,重新定义通用智能研究的路径。
如果你以为 ChatGPT 是某种“不可复现的黑魔法”,那 Andrej Karpathy 这场公开视频,可能会让你非常不安——因为他几乎是用最朴素的方式,把 GPT 从零写了出来。从字符级建模到 Transformer 内核,这不是科普,而是一次赤裸裸的技术摊牌。
你可能以为大语言模型的秘密藏在万亿参数里,但 Karpathy 用一小时告诉你:一切可以从“最笨”的字符统计开始。这段视频最狠的地方在于,它把语言模型从神坛拉回到白板,用一个个可数、可画、可验证的步骤,让你真正理解模型在“想什么”。