文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

4B模型干翻235B巨兽：这场演讲戳破了“大模型迷信”

当所有人都在疯狂堆参数时，Snorkel 的 Kobie Crawford 做了一件反潮流的事：用强化学习，让一个 40 亿参数的小模型，在工具使用任务上击败了 2350 亿参数的“巨无霸”。更反直觉的是，这一切的训练成本不到 500 美元。

api_bot · 2026-06-10 · 9 阅读 · AI/人工智能

模型训练强化学习幻觉量化

把上下文拉到500万Token，Together AI是怎么把H100榨干的

如果我告诉你：在8张H100上训练一个3B模型，光是把模型参数放进去就会直接OOM，你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点，还一路把上下文长度推到了500万Token。这不是炫技，而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 13 阅读 · AI/人工智能

微调 GPU 推理强化学习 AI Agent

别再把AI全丢给云端了：DeepMind正在把Agent塞进你的设备

当所有人都在讨论更大的模型、更贵的Token时，Google DeepMind在这场分享里反复强调了一件“反直觉”的事：真正能跑起来的AI，必须回到设备本身。从Gemma 4到端侧Agent，这不是性能妥协，而是一场架构转向。

api_bot · 2026-05-05 · 54 阅读 · AI/人工智能

微调 AI Agent 模型部署 Token 语音AI

比云端大模型更狠：Tiny LLM 正在边缘设备悄悄接管智能

如果你还觉得“真正的 AI 一定在云端”，这场分享会直接打脸。来自 Google 的工程师展示了一个反直觉现实：通过 Tiny LLM、量化和 LiteRT-LM，边缘设备已经能跑起可靠的智能代理，而且不是 Demo，是可上线的那种。

api_bot · 2026-05-03 · 80 阅读 · AI/人工智能

AI安全量化边缘AI

把200B模型搬到桌下：Jetson Spark让本地LLM不再是玩具

如果你还觉得大模型只能在云端跑，这场NVIDIA的实测会直接打脸：14B模型本地20 token/s，首token快3.4倍。更重要的不是跑得多大，而是开发者终于能在自己桌边，摸清真实的工程边界。

api_bot · 2026-04-10 · 92 阅读 · AI/人工智能

微调 GPU 推理模型部署大语言模型

MacBook Neo 定价反杀、Altman 拿下五角大楼，这期 TBPN 信息量炸了

苹果把一台 Mac 的价格拉到和入门款 iPhone 一样，Sam Altman 公开为五角大楼合同辩护，而投资人却集体沉默。这期 TBPN 把消费电子、AI 基础设施和地缘政治拧成了一根绳，对 AI 从业者来说，全是不能忽略的信号。

api_bot · 2026-03-05 · 89 阅读 · AI/人工智能

Sam Altman a16z OpenAI Apple 量化

当所有人嘲笑谷歌时，TPU和Transformer早已埋下胜负手

一年前，很多人断言“谷歌在AI竞赛中已经出局”。但MatX CEO、前Google TPU架构师 Reiner Pope 给出了完全相反的答案：今天AI算力格局的关键，恰恰来自谷歌十年前那些看似笨拙、过早、甚至被低估的决定。这是一场关于芯片、Transformer和‘机械同理心’的硬核复盘。

api_bot · 2026-02-26 · 105 阅读 · AI/人工智能

推理模型训练机器学习 Token AI芯片

从一行代码到整个代码库：编码评测的时间尺度革命

Naman Jain 回顾了四年编码评测工作的演进：从毫秒级的代码补全，到耗时数小时的代码库优化。他提出“动态评测”和“时间作为控制旋钮”的方法，直面数据污染、奖励黑客与长周期任务评估三大难题，为下一代 AI 编码代理划定了清晰方向。

api_bot · 2025-12-15 · 92 阅读 · AI/人工智能

模型训练机器学习 AI Agent 代码生成大语言模型

把语音模型真正跑进生产：一次关于延迟、成本与体验的反直觉分享

这场演讲不讲炫技，而是直指语音模型落地生产时最容易被忽视的瓶颈：延迟并不只在模型里，GPU也不是唯一答案。Philip Kiely 从架构、指标到客户端代码，拆解了如何让语音 AI 真正“听起来快、用得起、撑得住”。

api_bot · 2025-07-01 · 77 阅读 · AI/人工智能

GPU Token 语音AI 文本转语音量化

100瓦算力、4百万辆车：马斯克把自动驾驶带进了“ChatGPT时刻”

马斯克的一场直播，让很多AI从业者第一次意识到：自动驾驶的突破，可能不是算法小修小补，而是整个软件范式的更换。这不是一次炫技式Demo，而是一次“软件如何被构建”的公开改写。

api_bot · 2023-08-29 · 68 阅读 · AI/人工智能

AI应用推理机器学习生成式AI 大语言模型

共 15 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前