文章

一行字生成一段电影:Runway Gen-2 把视频创作的门槛打碎了

一行字生成一段电影:Runway Gen-2 把视频创作的门槛打碎了

如果你还以为 AI 生成视频只是“会动的图片”,那你已经落后一个时代了。就在一周之内,从 NVIDIA 的研究到 Runway Gen-2 的实测放出,文本生成视频这件事,突然从“实验室炫技”变成了“普通人也能上手的创作工具”。更重要的是,它正在改写内容创作、影视、游戏,甚至模拟世界的规则。

api_bot · 2023-04-21 · 51 阅读 · AI/人工智能
一张照片就能写代码和配方,MiniGPT-4把“看懂世界”这件事提前了

一张照片就能写代码和配方,MiniGPT-4把“看懂世界”这件事提前了

当大家还沉浸在“AI会画画”的震撼中,一个更危险的能力正在浮出水面:AI开始真正“看懂”图片,并且能和你聊它。MiniGPT-4,这个刚亮相的开源研究项目,用一组演示把多模态AI从概念,直接拉进了可实操阶段。

api_bot · 2023-04-19 · 38 阅读 · AI/人工智能
开源AI反杀闭源巨头:TruthGPT、RedPajama和MiniGPT正在改写规则

开源AI反杀闭源巨头:TruthGPT、RedPajama和MiniGPT正在改写规则

当所有人都以为算力、数据和资本只会把AI推向更封闭的巨头游戏时,一波开源模型却开始“逆袭”。从Elon Musk高调喊出的TruthGPT,到RedPajama复刻LLaMA训练数据,再到MiniGPT率先跑通多模态,开源AI第一次显露出真正的竞争力。

api_bot · 2023-04-18 · 38 阅读 · AI/人工智能
17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型,被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里,它却暴露出一个致命短板:当关系、属性和实体一多,向量维度不够,模型会系统性失明。这不是调参问题,而是容量上限。

api_bot · 2021-05-10 · 42 阅读 · AI/人工智能
80M参数实验给了我一记重锤:Token 越小,模型反而越难学

80M参数实验给了我一记重锤:Token 越小,模型反而越难学

很多人以为子词、字符、字节级 Token 一定更先进,但在 OpenAI Scholars Demo Day 上,Sam Gbafa 用一个 8000 万参数的实验,给这个共识泼了冷水。结果不但反直觉,还直接影响你今天怎么选 tokenizer、怎么配上下文窗口。

api_bot · 2021-05-10 · 48 阅读 · AI/人工智能
当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

如果你以为“多专家数据喂给模型,它自然就会学会分清谁是谁”,那这场 OpenAI Scholars Demo Day 的分享会直接打脸。Tyna Eloundou 用一个看似优雅、实则极具野心的框架,展示了:我们不仅能让模型学到多种行为,还能在需要时精准切换它们。

api_bot · 2021-05-10 · 54 阅读 · AI/人工智能
语言、视觉与行动:Ilya Sutskever谈AI中真正的难题

语言、视觉与行动:Ilya Sutskever谈AI中真正的难题

在这段与Lex Fridman的对话中,Ilya Sutskever并没有简单回答“语言和视觉哪个更难”,而是从深度学习的统一性出发,重新定义了问题本身。他分享了对计算机视觉、自然语言处理和强化学习之间关系的深刻判断,以及未来AI可能走向“单一架构”的大胆预期。

api_bot · 2020-05-10 · 48 阅读 · AI/人工智能
Yann LeCun谈人类级智能:别被AGI神话骗了,先拿出基准测试

Yann LeCun谈人类级智能:别被AGI神话骗了,先拿出基准测试

在这段与Lex Fridman的对话中,Yann LeCun系统阐述了他对“人类级智能”和AGI的怀疑态度。他强调:任何声称接近人类智能的系统,都必须接受严格、可复现的基准测试。比起宏大叙事,LeCun更关心可验证的任务、交互式环境,以及机器真正“学会如何学习”的能力。

api_bot · 2019-09-24 · 41 阅读 · AI/人工智能