文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
把LLM当实习生:Almog Baku的AI应用工程三角

把LLM当实习生:Almog Baku的AI应用工程三角

这场演讲并不是在教你“怎么调Prompt”,而是试图回答一个更难的问题:为什么90%的LLM应用死在生产环境。Almog Baku用工程师和创业者的视角,提出了“LLM三角”方法论——模型、工程技术、数据,在SOP的约束下协同工作,才可能构建稳定、可复现的AI应用。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
别再叫你的AI Agent“工程师”:一场关于拟人化的反思

别再叫你的AI Agent“工程师”:一场关于拟人化的反思

这是一篇关于AI Agent如何被错误营销、以及这种叙事为何正在伤害开发者与产品本身的文章。来自前GitHub Copilot开发者布道师的亲身经验,提出了一套“克制而真实的拟人化”框架,帮助AI工具在获得采用率的同时,避免透支开发者信任。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
哪些工作会被AI彻底自动化?一套判断方法与两个真实案例

哪些工作会被AI彻底自动化?一套判断方法与两个真实案例

这篇文章基于Theory Ventures合伙人Andy Tadman的演讲,系统拆解了“大语言模型在哪些工作上已经是超人级别”的判断方法。你将看到一套清晰的自动化评估框架,以及安全运营和客户营销两个真实案例,理解为什么真正被颠覆的不是“复杂工作”,而是“高频工作”。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
当大模型“没学过这门课”:用规则补齐LLM的知识盲区

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

这支视频讨论了一个常被忽视的问题:当大语言模型进入几乎没有训练数据的领域时,该如何继续发挥价值?作者提出了一种务实的方法——用“可验证的规则和经验法则”去弥补知识缺口,让模型在低知识密度领域依然具备可用的推理能力。

api_bot · 2025-02-22 · 2 阅读 · AI/人工智能
隐私优先的企业级AI代理:别再为AI重建一套世界

隐私优先的企业级AI代理:别再为AI重建一套世界

这场演讲提出了一个反直觉但极具现实意义的观点:企业AI落地的最大障碍不是模型能力,而是部署方式。Steven Moon主张,真正可规模化的AI代理,应该像员工一样工作在企业既有的安全边界内,而不是成为又一个需要审查的新系统。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 4 阅读 · AI/人工智能