Karpathy 亲述:我每天这样用 LLM,才发现 90% 的人都用错了
这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。
这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。
OpenAI Deep Research 团队在一次深度对谈中,罕见地系统讲清了他们对 AI Agent 未来的判断:不是更多规则拼装,而是端到端强化学习。本文还原 Deep Research 的诞生背景、技术取舍与真实使用场景,解释为什么“你优化什么,就只能得到什么”。
一边是前OpenAI CTO Mira Murati高调成立Thinking Machines Labs,却几乎不透露具体产品;另一边是曾被寄予厚望的AI硬件Humane Pin在一年内宣告失败。视频通过这两个对比鲜明的故事,揭示了当下AI创业中理想、资本与现实之间的张力。
很多人把“AI Agent”当成新一轮营销热词,但在这场演讲中,Chip 用亲身经历、经典定义和真实工程难题解释了:Agent并不新,却异常困难;也正因为难,它才是通往下一代AI应用的关键路径。
这场来自哥伦比亚大学研究者的演讲,试图回答一个被反复提起却很少被认真拆解的问题:什么才是真正的AI Agent,以及我们该如何系统性地提升它们的能力。视频从基础定义出发,结合学术研究,深入讨论了大语言模型在Agent场景下的自我改进、推理优化与测试时计算等关键方法。
一边是每月 200 美元、主打「深度研究」的 ChatGPT Pro,一边是几乎零门槛的 Perplexity。Greg Isenberg 用同一套创业任务正面硬刚,结果并不如大多数人想象。这不是工具测评,而是一场关于“AI 如何真正帮你做生意”的现实演示。
在长期保持神秘之后,OpenAI罕见地对GPT‑5及其路线图进行了系统性说明。这不仅是一次产品更新,更揭示了OpenAI在“模型是什么、应该如何使用”这一根本问题上的转向。
如果你还以为写应用必须先写代码,这个视频会直接把你拉回现实。Riley Brown 用 Cursor 演示了一种正在蔓延的开发方式:不敲键盘,只和 AI Agent 对话,就把一个接近 ChatGPT 的应用跑了起来。这不是玩具,而是很多程序员已经在用的“Vibe Coding”。
如果我告诉你,有人用 ChatGPT、Leonardo、Kling、ElevenLabs,在65分钟内“搭”出一家AI创业公司,你的第一反应大概率是:噱头。但看完 Greg Isenberg 的这期视频,你会意识到,真正被颠覆的不是创业速度,而是“创业门槛”本身。
如果你以为 ChatGPT 是在“理解”你,那这正是最大误解。Andrej Karpathy 用一场长达一小时的 Deep Dive,把大语言模型从神话拉回工程现实:它只是一个在模仿人类的统计机器,但正是这种“不会思考的系统”,正在重塑整个软件世界。