没人认真吹的 Kaiber,正在悄悄改写 AI 视频创作的游戏规则
当所有人盯着 Runway、Google、NVIDIA 时,一个被低估的名字正在创作者圈子里疯狂出圈。Kaiber 不只是“又一个 AI 视频工具”,它暴露了一个更残酷的事实:真正能改变创作门槛的,往往不是最会发论文的公司。
当所有人盯着 Runway、Google、NVIDIA 时,一个被低估的名字正在创作者圈子里疯狂出圈。Kaiber 不只是“又一个 AI 视频工具”,它暴露了一个更残酷的事实:真正能改变创作门槛的,往往不是最会发论文的公司。
如果你还以为 AI 生成视频只是“会动的图片”,那你已经落后一个时代了。就在一周之内,从 NVIDIA 的研究到 Runway Gen-2 的实测放出,文本生成视频这件事,突然从“实验室炫技”变成了“普通人也能上手的创作工具”。更重要的是,它正在改写内容创作、影视、游戏,甚至模拟世界的规则。
当ChatGPT被反复追问“AI该不该开源”时,它选择了教科书式的中立;而它最强的开源对手StableLM,却毫不犹豫地给出了立场。这不是一次简单的模型对比,而是一次关于权力、商业与未来AI走向的正面碰撞。
马斯克一句“微软非法用推特数据训练AI”,把一场早已暗流涌动的冲突推到台前。几乎同一时间,Reddit开始向AI公司收费,AI版“德雷克”横扫全网又被下架。看似分散的新闻,其实都指向同一个核心问题:谁拥有训练AI的权利?
当大家还沉浸在“AI会画画”的震撼中,一个更危险的能力正在浮出水面:AI开始真正“看懂”图片,并且能和你聊它。MiniGPT-4,这个刚亮相的开源研究项目,用一组演示把多模态AI从概念,直接拉进了可实操阶段。
当所有人都以为算力、数据和资本只会把AI推向更封闭的巨头游戏时,一波开源模型却开始“逆袭”。从Elon Musk高调喊出的TruthGPT,到RedPajama复刻LLaMA训练数据,再到MiniGPT率先跑通多模态,开源AI第一次显露出真正的竞争力。
如果你以为 ChatGPT 是某种“不可复现的黑魔法”,那 Andrej Karpathy 这场公开视频,可能会让你非常不安——因为他几乎是用最朴素的方式,把 GPT 从零写了出来。从字符级建模到 Transformer 内核,这不是科普,而是一次赤裸裸的技术摊牌。
很多人以为 Karpathy 这一集是在教你实现一个 WaveNet,但真正让无数从业者反复回看的,是他如何一边写代码、一边拆掉“看起来能跑”的坏抽象。这是一堂关于神经网络工程化、可维护性,以及如何在实战中逼近 PyTorch 思维方式的硬核课程。
当所有框架都能自动求导时,Andrej Karpathy却花一整节课,带你一行行手写反向传播。这不是怀旧,而是一种训练直觉的残酷方式。看完这期视频,你会明白:真正拉开模型训练差距的,不是更大的GPU,而是你对梯度流动的掌控力。
很多人以为神经网络训练不好,是架构不行、数据不够、算力太小。但 Karpathy 在 makemore 第三讲直接揭穿了一个更残酷的事实:大多数失败,发生在训练开始的第一秒——初始化、激活值和梯度,早就把结局写好了。