文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
模型没错,是你不会提问:一位AI工程师的提示工程真相

模型没错,是你不会提问:一位AI工程师的提示工程真相

这篇文章还原了 AI Engineer 频道创作者 Dan 关于提示工程的完整方法论:为什么提示工程依然重要、Chain of Thought 和少样本提示为何改变了模型表现,以及在推理模型时代,哪些“老技巧”反而会拖后腿。读完你将知道,问题不在模型,而在你如何与它对话。

api_bot · 2025-02-22 · 5 阅读 · AI/人工智能
别再让AI猜答案:用“分层思维链”构建可验证的智能系统

别再让AI猜答案:用“分层思维链”构建可验证的智能系统

这篇文章系统梳理了AI Engineer频道中Manish Sanwal提出的“分层思维链(Layered Chain of Thought)”方法。它不仅解释了多智能体系统与思维链推理的结合方式,更揭示了如何通过逐步验证,让AI从“会答题”进化为“可解释、可纠错、可复现”的可靠系统。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
当AI有了“人设”:人格驱动型Agent正在重塑软件设计

当AI有了“人设”:人格驱动型Agent正在重塑软件设计

在这场分享中,Perpetual 的 Ben 提出了“人格驱动型开发”的概念:给 AI Agent 明确的角色、外形和性格,不只是设计噱头,而是一种强大的产品、工程与商业抽象方式。文章通过真实故事与一线经验,揭示这种设计范式的价值与代价。

api_bot · 2025-02-17 · 4 阅读 · AI/人工智能
当Claude走进Minecraft:一个可控AI Agent的真实诞生

当Claude走进Minecraft:一个可控AI Agent的真实诞生

这是一场把大语言模型从聊天框带进真实世界的现场实验。演讲者展示了如何用Claude和Amazon Bedrock构建一个能“看、想、做”的Minecraft智能体,并分享了在架构选择、工具编排和可控性上的关键经验。

api_bot · 2025-02-15 · 4 阅读 · AI/人工智能
YC眼中的AI革命:真正的分岔路口,创业者正在悄悄换挡

YC眼中的AI革命:真正的分岔路口,创业者正在悄悄换挡

这期来自 Y Combinator 的《Light Cone》并没有讨论模型参数或榜单,而是揭示了一个更隐秘的变化:AI 正在重塑创业的速度、组织形态和价值来源。YC 看到的,不只是“更强的工具”,而是一条正在分岔的未来道路。

api_bot · 2025-01-24 · 5 阅读 · AI/人工智能
10万亿参数、300智商:o1之后,创业者该恐慌还是狂喜?

10万亿参数、300智商:o1之后,创业者该恐慌还是狂喜?

YC最新一期节目围绕o1模型与未来10万亿参数AI展开,讨论了算力竞赛、AGI边界、创业机会与基础设施变化。本文提炼其中最有价值的判断、真实案例和反直觉洞见,帮助创业者理解:在超级智能逼近的时代,真正的机会在哪里。

api_bot · 2024-11-01 · 5 阅读 · AI/人工智能
OpenAI o1 为何重要:从“背答案”到“学会推理”的拐点

OpenAI o1 为何重要:从“背答案”到“学会推理”的拐点

Y Combinator 的这期视频解释了 OpenAI o1 为什么被视为一代分水岭模型。它不是靠更会聊天取胜,而是通过强化学习学会“思考过程”,在数学、代码和科学推理上逼近博士生水平,并开启了推理型大模型随算力持续进化的新路径。

api_bot · 2024-10-25 · 5 阅读 · AI/人工智能