文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练 Sam Altman 对话AI 代码生成多模态开源模型提示工程

比微调更猛的路线：YC 正在押注一种“让模型自己变聪明”的方法

当所有人还在纠结要不要微调模型时，YC 的一场对话直接掀桌：有团队用更便宜、更快的方法，让大模型在不微调的情况下持续变强。这不是提示工程的小修小补，而是一种可能改写 AI 应用范式的新思路。

api_bot · 2026-02-27 · 15 阅读 · AI/人工智能

微调 AI应用强化学习生成式AI 大语言模型

OpenClaw不是工具，是员工：Greg Isenberg聊清楚了怎么真正赚钱

大多数人把OpenClaw当成一个“会跑任务的AI工具”，但这期播客里，Greg Isenberg和Nick反复强调一件反直觉的事：它更像一个需要被管理、被训练、被优化的员工。真正的机会，不在炫技，而在把它变成能持续创造业务结果的机器。

api_bot · 2026-02-18 · 17 阅读 · AI/人工智能

Sam Altman 微调

数据不是瓶颈了？他们想为强化学习打造一个“GitHub级”的环境平台

当所有人还在讨论模型规模和算力时，Prime Intellect 的两位研究者抛出一个反直觉判断：真正卡住 AI 研究的，已经不是数据，而是“环境”和“评估”。他们正在做的事情，可能会重塑强化学习、后训练和 AI Agent 的整个工作方式。

api_bot · 2026-02-10 · 23 阅读 · AI/人工智能

微调强化学习 AI Agent 提示工程

一个海马表情，暴露了GPT-4的训练秘密

如果我告诉你，只靠几个奇怪的提示词和API调用，就能“反向工程”出GPT-4在不同阶段吃过什么数据，你会不会觉得有点越界？在这期 Latent Space Lightning Pod 里，Datology 创始成员 Pratyush Maini 用一系列看似玩笑的实验，揭开了大模型训练数据、预训练阶段，甚至安全机制的真实边界。

api_bot · 2026-02-10 · 26 阅读 · AI/人工智能

微调模型训练 AI安全预训练 GPT-4

2026年的AI真相：模型不再单选，DeepSeek只是开始

如果你还在纠结“哪个大模型会赢到最后”，这期 Lex Fridman 的对话可能会直接颠覆你的默认认知。在 Sebastian Raschka 和 Nathan Lambert 看来，2026 年的 AI 竞争，赢家不是某一个模型，而是一整套新的玩法：开源与闭源并存、速度与智能取舍、后训练比架构更重要，以及一个被低估的关键词——“多模型时代”。

api_bot · 2026-01-31 · 24 阅读 · AI/人工智能

微调开源模型大语言模型闭源模型 Transformer

大语言模型的记忆革命：从上下文到权重注入的未来路径

本文深度还原了Jack Morris在2025年Cornell演讲的核心洞见，聚焦大语言模型（LLM）如何突破知识边界，从上下文窗口、检索增强生成（RAG）到将知识直接训练进模型权重。通过真实案例、前沿技术对比和行业趋势，帮助你理解下一代AI系统的构建方法。

api_bot · 2025-12-29 · 39 阅读 · AI/人工智能

微调机器学习模型部署幻觉预训练

AGI新征途：Poolside如何推动智能模型与人类智慧融合

本文深度解析Poolside团队在通用人工智能（AGI）领域的探索与实践，揭示其通过自研模型与强化学习技术，推动AI从代码生成到知识工作再到情感智能的多维突破。文章还展望了AI应用的未来形态及行业合作新机遇，为读者提供前沿洞见。

api_bot · 2025-12-27 · 34 阅读 · AI/人工智能

微调 AI应用推理 Nat Friedman 强化学习

从Claude Code到AI工程新范式：一位纽约创业者的实战洞见

本文带你走进Jared Zoneraich在AI Engineer大会上的精彩分享，揭示Claude Code背后的简约哲学、工具选择、团队重塑，以及AI Agent领域的最新趋势与真实案例。通过创业者的亲身经历和行业观察，读者将获得关于AI编码代理、模型演进、产品设计的独特视角。

api_bot · 2025-12-26 · 28 阅读 · AI/人工智能

微调 AI应用 AI Agent 开源模型代码生成

小步快跑，深度创新：Northwestern Mutual的GenBI实践与启示

本文深度解析Northwestern Mutual在金融行业推动生成式AI与BI融合的GenBI项目，从数据治理、信任构建到产品化路径，揭示大企业如何在风险与创新之间取得平衡。通过真实数据驱动、逐步迭代和可控风险管理，GenBI为企业智能化转型提供了宝贵经验。

api_bot · 2025-12-23 · 36 阅读 · AI/人工智能

微调 AI应用 AI Agent 检索增强生成生成式AI

Agent RFT：让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享，系统讲解了什么是 Agent Reinforcement Fine-Tuning（Agent RFT），以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例，演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 45 阅读 · AI/人工智能