别再迷信提示工程:保险业如何用DSPy把LLM拉回工程正道
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
如果你以为 ChatGPT 是在“理解”你,那这正是最大误解。Andrej Karpathy 用一场长达一小时的 Deep Dive,把大语言模型从神话拉回工程现实:它只是一个在模仿人类的统计机器,但正是这种“不会思考的系统”,正在重塑整个软件世界。
DeepSeek R1并非横空出世,而是长期工程积累的集中爆发。本文拆解其在训练效率、模型架构与强化学习推理上的关键解锁,解释为何它以更低成本逼近o1级能力,并由此改写AI应用的成本曲线。
OpenAI 在东京发布了一个反直觉的新能力:AI 不再追求“快”,而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新,而是一次对“AI 应该怎么工作”的彻底改写。
一周之内,DeepSeek把AI行业搅得天翻地覆:白宫关注、市场恐慌、创业公司争相接入。但当喧嚣退去,这真的是一次范式转移,还是被放大的误读?本文拆解技术细节、关键人物判断与真实成本,带你看清这一周AI真正改变了什么。
AlphaGo 之后,AGI 真的更近了吗?在这场对话中,AlphaGo 与 MuZero 的核心工程师 Ioannis Antonoglou 回顾了 DeepMind 从围棋出发的真实决策、技术不确定性与关键转折,并分享了他对强化学习、幻觉问题以及下一代 AI Agent 的判断。
围绕OpenAI即将发布的o3推理模型,社交媒体迅速将其解读为“AGI前夜”。但视频指出,真正重要的并不是AGI是否到来,而是推理模型在成本、规模和Agent形态上的关键转折,以及中美模型竞争正在发生的结构性变化。
一条六字推文、几位研究员的异常表态,以及Sam Altman最新的年度反思文章,让AGI时间线的讨论在几天内急剧升温。这期《AI Daily Brief》串联起这些信号,揭示了一个关键信息:OpenAI内部对技术轨迹的判断,可能已经发生了实质性改变。
在这场 DevDay 的 AMA 里,Sam Altman 抛出了一个足以改写 AI 创业和投资逻辑的判断:模型规模不再是核心变量,真正的分水岭是“推理能力”。从 o1、Agent、开源,到创业者会不会被 OpenAI 碾压,他几乎把未来 5 年的底牌摊在了桌面上。
在这场 OpenAI DevDay 的炉边谈话中,Mark Chen 抛出了一个反直觉观点:o1 这样的“推理模型”,既是能力飞跃,也是过去一年最重要的安全进展之一。从 AGI 的真实边界,到新加坡为何被 OpenAI 视为 AI 高地,这是一场只讲内部认知、不讲公关套话的对话。