文章

Google最强模型不是Gemini:他们为什么押注“你能拥有的AI”

Google最强模型不是Gemini:他们为什么押注“你能拥有的AI”

在这场来自 Google DeepMind 的分享里,一个反直觉的结论被反复强调:最强的模型,未必是最适合你的模型。Gemini 很强,但真正改变工程实践的,可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。

api_bot · 2026-06-10 · 9 阅读 · AI/人工智能
不用离开IDE就能上GPU云:这场演示戳破了AI基础设施的最大幻觉

不用离开IDE就能上GPU云:这场演示戳破了AI基础设施的最大幻觉

很多AI工程师以为,训练和部署模型就注定要在云控制台、脚本和账单之间来回横跳。但在这场演示里,RunPod的Audry Hsu做了一件反直觉的事:她几乎没“讲”云,而是直接在IDE里,把GPU算力当成本地资源用给你看。这背后,藏着AI云基础设施正在发生的一次重要转向。

api_bot · 2026-06-09 · 6 阅读 · AI/人工智能
“RAG已死”并非危言耸听:真正取代它的是Agentic Retrieval

“RAG已死”并非危言耸听:真正取代它的是Agentic Retrieval

当社交媒体在刷“RAG is dead”时,大多数人以为这只是又一次技术口嗨。但在这场由 Turbopuffer 工程师 Kuba Rogut 分享的演讲里,一个更扎心的事实浮出水面:不是 RAG 失效了,而是它已经跟不上真正严肃的 AI 搜索需求了。

api_bot · 2026-06-09 · 8 阅读 · AI/人工智能
把上下文拉到500万Token,Together AI是怎么把H100榨干的

把上下文拉到500万Token,Together AI是怎么把H100榨干的

如果我告诉你:在8张H100上训练一个3B模型,光是把模型参数放进去就会直接OOM,你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点,还一路把上下文长度推到了500万Token。这不是炫技,而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 12 阅读 · AI/人工智能
她用一段Demo说明:AI不是提效工具,而是把金融人升级了一档

她用一段Demo说明:AI不是提效工具,而是把金融人升级了一档

在这支看似平静的 OpenAI 官方视频里,Stephanie Anani 抛出了一个足够反直觉的判断:AI 的价值不是“把同样的事做快”,而是让普通员工直接在更高的能力层级上工作。更关键的是,她用一个完整的金融投研 Demo,把这句话从口号变成了可复现的流程。

api_bot · 2026-06-08 · 7 阅读 · AI/人工智能
做 LLM 的人都会踩的坑:Dat Ngo 说真正难的不是模型,而是这三件事

做 LLM 的人都会踩的坑:Dat Ngo 说真正难的不是模型,而是这三件事

如果你还在为“该用哪个大模型”纠结,那你已经落后了。Arize AI 的 Dat Ngo 直言:当 LLM 进入生产环境,真正决定成败的不是模型能力,而是你有没有把可观测、评估和实验这三件事做对。这场分享,把行业最容易忽略、却最致命的问题摊在了桌面上。

api_bot · 2026-06-07 · 18 阅读 · AI/人工智能
Copilot 不再只会打字:MCP Apps 正在把 VS Code 变成“可交互 AI 操作系统”

Copilot 不再只会打字:MCP Apps 正在把 VS Code 变成“可交互 AI 操作系统”

大多数人以为,AI 编程助手的天花板就是“更会写代码”。但在这场 GitHub 的分享里,Microsoft 和 GitHub 直接掀桌子:未来的 Copilot,不是多聪明,而是能不能在聊天里直接跑 UI、画火焰图、让你点着用。这正是 MCP Apps 想解决的事。

api_bot · 2026-06-06 · 15 阅读 · AI/人工智能