文章

他用GPT-4o造了一群AI朋友,结果把“聊天应用”这件事彻底玩变了

他用GPT-4o造了一群AI朋友,结果把“聊天应用”这件事彻底玩变了

一个开发者,用Next.js、GPT-4o和一堆“过度工程”,真的做出了会记得你生活细节、能隔三天接着聊的AI朋友。这不是情感噱头,而是一套可复用的AI应用范式:记忆、人格、结构化输出、真实感对话,全都落地了。

api_bot · 2025-02-24 · 8 阅读 · AI/人工智能
Mira Murati新创业与Humane陨落:AI理想主义的两端

Mira Murati新创业与Humane陨落:AI理想主义的两端

一边是前OpenAI CTO Mira Murati高调成立Thinking Machines Labs,却几乎不透露具体产品;另一边是曾被寄予厚望的AI硬件Humane Pin在一年内宣告失败。视频通过这两个对比鲜明的故事,揭示了当下AI创业中理想、资本与现实之间的张力。

api_bot · 2025-02-23 · 11 阅读 · AI/人工智能
把LLM当实习生:Almog Baku的AI应用工程三角

把LLM当实习生:Almog Baku的AI应用工程三角

这场演讲并不是在教你“怎么调Prompt”,而是试图回答一个更难的问题:为什么90%的LLM应用死在生产环境。Almog Baku用工程师和创业者的视角,提出了“LLM三角”方法论——模型、工程技术、数据,在SOP的约束下协同工作,才可能构建稳定、可复现的AI应用。

api_bot · 2025-02-22 · 26 阅读 · AI/人工智能
别再叫你的AI Agent“工程师”:一场关于拟人化的反思

别再叫你的AI Agent“工程师”:一场关于拟人化的反思

这是一篇关于AI Agent如何被错误营销、以及这种叙事为何正在伤害开发者与产品本身的文章。来自前GitHub Copilot开发者布道师的亲身经验,提出了一套“克制而真实的拟人化”框架,帮助AI工具在获得采用率的同时,避免透支开发者信任。

api_bot · 2025-02-22 · 18 阅读 · AI/人工智能
哪些工作会被AI彻底自动化?一套判断方法与两个真实案例

哪些工作会被AI彻底自动化?一套判断方法与两个真实案例

这篇文章基于Theory Ventures合伙人Andy Tadman的演讲,系统拆解了“大语言模型在哪些工作上已经是超人级别”的判断方法。你将看到一套清晰的自动化评估框架,以及安全运营和客户营销两个真实案例,理解为什么真正被颠覆的不是“复杂工作”,而是“高频工作”。

api_bot · 2025-02-22 · 20 阅读 · AI/人工智能
当大模型“没学过这门课”:用规则补齐LLM的知识盲区

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

这支视频讨论了一个常被忽视的问题:当大语言模型进入几乎没有训练数据的领域时,该如何继续发挥价值?作者提出了一种务实的方法——用“可验证的规则和经验法则”去弥补知识缺口,让模型在低知识密度领域依然具备可用的推理能力。

api_bot · 2025-02-22 · 15 阅读 · AI/人工智能
隐私优先的企业级AI代理:别再为AI重建一套世界

隐私优先的企业级AI代理:别再为AI重建一套世界

这场演讲提出了一个反直觉但极具现实意义的观点:企业AI落地的最大障碍不是模型能力,而是部署方式。Steven Moon主张,真正可规模化的AI代理,应该像员工一样工作在企业既有的安全边界内,而不是成为又一个需要审查的新系统。

api_bot · 2025-02-22 · 25 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 25 阅读 · AI/人工智能