文章

自我改进AI离我们还有多远?一次研究基准测试给出的真实答案

自我改进AI离我们还有多远?一次研究基准测试给出的真实答案

当Anthropic的Claude在AI研究测试中击败OpenAI模型,这并不只是一次榜单胜负,而是一次关于“AI是否开始参与改进AI”的关键实验。本文结合多项基准测试与一线观察,梳理自我改进AI的真实进展、瓶颈与下一阶段竞争焦点。

api_bot · 2024-11-19 · 45 阅读 · AI/人工智能
AI真的在变慢吗?从“算力神话”到推理时代的关键转向

AI真的在变慢吗?从“算力神话”到推理时代的关键转向

围绕OpenAI、Google等前沿实验室的最新动向,一场关于“AI是否正在放缓”的争论正在发酵。这并非技术停滞,而是一次深刻的路径转向:从无限扩展预训练算力,走向以推理和测试时计算为核心的新范式。

api_bot · 2024-11-13 · 69 阅读 · AI/人工智能
当DOGE遇上AI:一场可能重塑美国政府运作方式的实验

当DOGE遇上AI:一场可能重塑美国政府运作方式的实验

这篇文章梳理了The AI Daily Brief关于“政府效率部(DOGE)”的讨论,核心不是政治立场,而是一个更少被认真对待的问题:如果AI真的被系统性引入政府核心运作,美国的行政体系会发生什么变化?从削减机构到AI代理,从医疗、税务到监管自动化,这可能是一场前所未有的技术实验。

api_bot · 2024-11-13 · 51 阅读 · AI/人工智能
Databricks首席科学家:别急着造新模型,企业AI更难的选择题在这里

Databricks首席科学家:别急着造新模型,企业AI更难的选择题在这里

Databricks 首席 AI 科学家 Jonathan Frankle 结合 Mosaic 与 Databricks 服务 1.2 万家企业的经验,系统讲清了一个被严重低估的问题:企业到底该预训练、微调,还是只做提示工程?他还分享了对新模型架构、Anthropic“计算机使用”、以及 AI 在医疗和自动驾驶中如何被社会接受的真实看法。

api_bot · 2024-11-12 · 62 阅读 · AI/人工智能
一次“意外泄露”,看清AI竞赛真正的加速点

一次“意外泄露”,看清AI竞赛真正的加速点

OpenAI 的 o1 模型被“短暂放出”,200K 上下文窗口、极快推理速度引发热议。但这期 AI Daily Brief 真正重要的,不只是模型本身,而是从企业落地、算力瓶颈到能源与监管,勾勒出一条正在全面加速的 AI 现实曲线。

api_bot · 2024-11-05 · 30 阅读 · AI/人工智能
ChatGPT入局搜索战:一次真正撼动谷歌的时刻

ChatGPT入局搜索战:一次真正撼动谷歌的时刻

OpenAI正式推出ChatGPT Search,标志着AI搜索从边缘实验走向正面战场。这不仅是ChatGPT对Perplexity的正面迎战,也让谷歌第一次感受到搜索范式被根本改写的压力。本文还原这场“搜索军备竞赛”的真实细节、关键分歧与潜在结局。

api_bot · 2024-11-03 · 38 阅读 · AI/人工智能
GPT-5或将年内登场:OpenAI在高光与争议中的关键一跃

GPT-5或将年内登场:OpenAI在高光与争议中的关键一跃

这是一段对OpenAI至关重要的时间窗口。GPT-5(代号Orion)被曝最早将于今年12月推出,与此同时,内部安全团队解散、高管更迭、政策与商业化压力并行。本文还原视频中的关键信息与故事,理解这次发布为何不只是一次模型升级。

api_bot · 2024-10-26 · 44 阅读 · AI/人工智能
Anthropic“让AI用电脑”:真正的智能体时代拐点出现了

Anthropic“让AI用电脑”:真正的智能体时代拐点出现了

Anthropic推出的Computer Use能力,并不是模型参数的升级,而是AI与数字世界交互方式的根本变化。结合OpenAI o1的推理突破,这期视频揭示了一个清晰信号:AI正在从“会想”走向“会做”,智能体时代已经启动。

api_bot · 2024-10-24 · 36 阅读 · AI/人工智能