文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
别再让Agent当打杂的:为什么工具也该有“思考权”

别再让Agent当打杂的:为什么工具也该有“思考权”

大模型Agent的失败,往往不是模型不够聪明,而是工具太“愚蠢”。Wordware联合创始人Robert Chandler结合自动驾驶与AI Agent实践,提出一个反直觉但关键的观点:不要让Agent被低级工具拖累,而是让工具本身具备更多“代理性”,真正学会替人思考和行动。

api_bot · 2025-06-10 · 4 阅读 · AI/人工智能
把生成式AI嵌入SDLC:Amazon Q如何重塑开发者工作流

把生成式AI嵌入SDLC:Amazon Q如何重塑开发者工作流

这支演示视频通过一个“从零构建2048游戏”的真实案例,完整展示了Amazon Q Developer如何贯穿软件开发生命周期。从需求规划、编码、测试、文档、GitHub协作到云端部署与运维,演讲者给出了一个清晰信号:生成式AI不再只是写代码工具,而是开发者的“全流程助手”。

api_bot · 2025-06-10 · 4 阅读 · AI/人工智能
AI 原生开发的四次角色迁移:从写代码的人到管理智能的系统

AI 原生开发的四次角色迁移:从写代码的人到管理智能的系统

Patrick Debois 在这场演讲中提出了“AI 原生开发”的四种核心模式,解释了生成式 AI 如何系统性地改变软件工程师的工作重心:从写代码,到管理代理、表达意图、探索问题,再到沉淀知识。这不是效率工具的升级,而是一场角色与工作方式的重构。

api_bot · 2025-06-04 · 2 阅读 · AI/人工智能
没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

这篇文章深入解读Vectara推出的开源项目 open-rag-eval,解释它为何要在没有“golden answers”的情况下评测RAG系统,以及背后的研究方法、关键指标和实际使用体验,帮助RAG开发者真正理解并优化自己的检索增强生成流水线。

api_bot · 2025-06-03 · 4 阅读 · AI/人工智能
别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

在这场来自NVIDIA的分享中,Sylendran Arunagiri提出了一个反直觉但极具实操性的观点:高效、可扩展的AI Agent并不依赖更大的大语言模型,而依赖持续运转的数据飞轮。通过NVIDIA内部NV Info Agent的真实案例,他展示了如何用不到千条高质量数据,让1B、8B小模型逼近70B模型效果。

api_bot · 2025-06-03 · 4 阅读 · AI/人工智能
他为什么说ChatGPT设计得很糟,并亲手“修好”了它

他为什么说ChatGPT设计得很糟,并亲手“修好”了它

这支演讲并不是吐槽ChatGPT功能不够强,而是直指一个更少被讨论的问题:设计。演讲者通过真实演示,指出ChatGPT在语音与文本、多模型协作上的割裂体验,并展示如何用现成API重构一个“更像人类交流”的AI界面。

api_bot · 2025-06-03 · 5 阅读 · AI/人工智能
没有“手”的AI,什么都做不了:MCP如何让助手真正接管你的应用

没有“手”的AI,什么都做不了:MCP如何让助手真正接管你的应用

Kent C. Dodds 在这场演讲中抛出一个关键判断:AI 交互正在成为主流入口,但真正限制 AI 助手能力的不是模型,而是“无法动手”。他以 Jarvis 为隐喻,系统讲解了 Model Context Protocol(MCP)如何通过标准化集成,让 AI 首次具备真正操作应用和服务的能力。

api_bot · 2025-06-03 · 5 阅读 · AI/人工智能
两周分析一万通销售电话:一个AI工程师的真实方法论

两周分析一万通销售电话:一个AI工程师的真实方法论

一次看似不可能的任务:两周内分析一万通销售电话。Charlie Guo 通过大语言模型、工程化系统设计和成本控制,把原本需要两年的人力工作,变成单人可完成的AI项目。这篇文章还原了其中最关键的技术决策、踩过的坑,以及对企业数据价值的深刻启示。

api_bot · 2025-06-03 · 4 阅读 · AI/人工智能