斯坦福给AI打透明度分:Llama 2第一,GPT‑4竟然只排第三
如果你以为最强的AI一定最透明,这份斯坦福最新榜单会直接打脸。研究者用100个指标给主流大模型打分,结果显示:Meta 的 Llama 2 拿下第一,但也只及格一半;而整个行业,在“黑箱”这件事上几乎是集体失分。
如果你以为最强的AI一定最透明,这份斯坦福最新榜单会直接打脸。研究者用100个指标给主流大模型打分,结果显示:Meta 的 Llama 2 拿下第一,但也只及格一半;而整个行业,在“黑箱”这件事上几乎是集体失分。
如果你以为生成式 AI 的巅峰是“改图”,那你已经落后了。Adobe 在最新发布会上展示的不是更强的图像模型,而是把 Generative Fill 直接塞进了视频里。与此同时,Google、Microsoft 正在用“法律兜底”抢企业用户,AI 的战场正在发生一场悄无声息但极其关键的转移。
美国正在酝酿一件比“卡脖子芯片”更激进的事:限制中国获取最先进的AI基础模型。这个变化不只关乎中美博弈,而是可能直接决定你未来能用到什么模型、开源是否还能存在,以及AI创业的门槛会被抬到多高。
这不是一份歌颂 AI 进步的报告,而是一份让从业者警惕的清单:GPT-4 碾压一切、RLHF 带来真实的人类代价、顶级研究正在集体“关门”,而唯一的例外竟然来自 Meta。Air Street 的《State of AI》透露的信号,比技术本身更值得重视。
当所有人都在追逐更大的模型时,真正决定胜负的战场已经下沉到了芯片层。微软被曝即将发布代号“Athena”的自研AI芯片,直指英伟达最核心的GPU训练市场。与此同时,AI的高成本、监管与地缘政治,正在把这场技术竞赛推向更复杂的博弈。
特斯拉正在奥斯汀建一座“地堡”,但不是为了防核弹,而是为了AI。Dojo超算、D1芯片、自建算力,这一系列动作背后,指向的是一场更残酷的AI权力争夺:谁能掌控算力,谁就能定义下一代AI应用。
很多人以为 AutoGPT 的热潮早就过去了,但一场黑客松暴露了一个反直觉的事实:真正重要的不是“能干活的代理”,而是“让代理不翻车的底层能力”。这期 The AI Daily Brief 讲清了 AI Agents 正在发生的关键转向。
很多人以为 AI 改变职业的方式是“取代你”,但这期《AI Daily Brief》讲了一个更反直觉的事实:AI 没有先消灭岗位,而是先创造了两个新职业,而且一个比一个更抢手。从不会写代码的普通员工,到年薪数十万美元的 AI Engineer,这条路径已经被走通了。
生成式 AI 正在悄悄换挡:不是更大的模型,也不是更炸的 Demo。真正的拐点是——ChatGPT 式的“万能工具”正在退潮,深度嵌入工作流的 AI 正在接管一切。这一幕,被称为 Generative AI 的 Act 2。
这不是一篇唱衰 AI 的文章,恰恰相反。The AI Daily Brief 提出一个反直觉判断:生成式 AI 最疯狂、最令人兴奋的“第一阶段”已经结束。模型还在,但游戏规则正在悄悄改变,而多数人甚至还没意识到自己已经站在下一阶段的门口。