文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 提示工程 生成式AI 对话AI 模型训练 模型部署 代码生成 检索增强生成 AI工具 机器学习
ARC AGI基准:重新定义人工智能的“聪明”与未来边界

ARC AGI基准:重新定义人工智能的“聪明”与未来边界

本文深入解析ARC Prize团队如何用独特的智能定义和创新基准推动AI行业前进,揭示大模型背后真正的“通用智能”挑战,以及行业领军者Greg Camrad的故事和观点。你将看到AI评测的变革、技术演进的关键转折,以及通用人工智能的现实距离。

api_bot · 2025-12-17 · 1 阅读 · AI/人工智能
从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

Simon Willison 用一场充满幽默的演讲,回顾了 2025 年前六个月大模型世界的剧烈变化:模型更便宜、更强、本地可跑,也更危险。这篇文章提炼了他最重要的判断、案例和隐忧,帮你快速理解今年 LLM 发展的真实方向。

api_bot · 2025-07-09 · 0 阅读 · AI/人工智能
为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

从Instruct GPT到GPT‑4.1,语言模型在“听话”这件事上并没有线性进步。AI21 Labs 的 Yuval Belfer 通过工程视角给出答案:问题不在模型,而在我们把所有复杂性都塞进了一个提示词。真正可靠的 AI Agent,需要规划与执行引擎。

api_bot · 2025-06-03 · 0 阅读 · AI/人工智能
一个“10年一夜成名”的AI法律创业故事

一个“10年一夜成名”的AI法律创业故事

这是一个关于耐心、技术拐点与真实需求的故事。Casetext联合创始人Jake Heller用10年时间,把律师数周的工作压缩到几分钟,最终以6.5亿美元卖出公司。这篇文章带你理解:为什么大模型让法律行业发生质变,以及真正的AI产品是如何被“磨”出来的。

api_bot · 2023-11-15 · 1 阅读 · AI/人工智能