DALL·E 3突然免费,Midjourney第一次感到真正的压力
DALL·E 3不是悄悄上线,而是直接“免费空降”。不用排队、不用付费,只要一个微软账号就能用。这一刻,AI绘画的竞争逻辑变了:从拼参数、拼美感,转向拼“谁更懂人话”。
DALL·E 3不是悄悄上线,而是直接“免费空降”。不用排队、不用付费,只要一个微软账号就能用。这一刻,AI绘画的竞争逻辑变了:从拼参数、拼美感,转向拼“谁更懂人话”。
还没全面开放,ChatGPT Vision已经被玩出“作弊级”用法:看图写代码、白板秒变产品原型、复杂停车牌一句话搞定。这不是炫技,而是AI把“理解世界”的门槛直接打穿。
一边是900亿美元估值、软银可能入局,另一边是Sam Altman在Reddit“玩笑式”承认AGI已实现。OpenAI在24小时内同时点燃资本市场、技术圈和伦理争议,这不是巧合,而是一种信号。
当所有人还在争论AI训练到底侵不侵权时,Getty和Adobe已经换了一个打法:不等法律落地,先把“商业可用”这件事做成。这期《The AI Daily Brief》揭示的,不只是工具更新,而是生成式AI即将分化成两条完全不同的路线。
一个黑客拆掉了 Google Nest Mini,却意外拆穿了整个 AI 设备行业的幻想:真正的下一代 AI 硬件,可能不是大厂封闭生态,而是可被“越狱”的个人 AI 终端。更有意思的是,这个趋势正好与企业自建 AI、公众 AI 焦虑同时发生。
有人在Discord丢出了疑似DALL·E 3的生成图,细节与文字能力直逼“可商用临界点”;英伟达则用一个只有几分钟训练时间的小模型,挑战个性化生成的老难题;而在真实世界,AI已经在乳腺癌筛查中跑赢了人类专家。这不是噱头合集,而是AI正在“跨线”的信号。
一个机器人,被要求“捡起已经灭绝的动物”,它没有犹豫,直接抓起了桌上的恐龙玩偶。这个看似简单的动作,背后却意味着:机器人第一次真正用上了类似大语言模型的“理解力”。这不是演示噱头,而是一场正在发生的范式转移。
一家实验室用AI在尼安德特人和丹尼索瓦人的蛋白序列里,找回了“灭绝”的抗生素分子;另一边,Google DeepMind 刚刚亮出一个能读影像、懂文本、看基因的通用医疗模型。这不是两条新闻,而是一条正在成型的新范式。
当所有人盯着英伟达股价和H100排队名单时,一家几乎没人听过的GPU创业公司,正在中东低调集结前AWS、Azure、Meta的核心人物。算力短缺的真正解法,可能不在硅谷。
AI绘画终于跨过一道尴尬门槛:Stable Diffusion XL 1.0 不但更快、更清晰,还第一次把“文字生成”做到了可用水平。更狠的是,官方研究显示它在用户偏好上击败了 Midjourney。与此同时,Amazon、AI安全研究、日本政府的动作,正在把这场竞赛推向更深水区。