Avsnitt Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent|对谈 Sheet0 创始人王文锋 42章经 Spela Dela Facebook Twitter Kopiera länk
活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息! 关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案: 1)怎么定义 Agent,Agent 最重要的是什么 2)今天的 Agent 和两年前的 Agent 的区别是什么 3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念 4)不同方式的区别是什么,有什么优劣之分吗 5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么 6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联 7)Workflow 和 Agent 的区别和终局 8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL 9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样 10)如何快速判断一家 Agent 公司做得好不好 另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。 【人类博物馆】 导游:曲凯,42章经创始人 33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。 【时光机】 00:47 Agent 三要素:LLM、Context、Tool Use 1:17 这波 Agent 和过去两年的区别是什么? 2:30 怎么理解 Agent 中的 Context? 4:21 快速理解 Tool Use 的不同方案 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么? 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具 7:07 两条支线各有优缺点,也可以混合起来 10:27 Manus、Devin、Genspark 各用的什么方案? 12:25 Browser Use 的核心价值是给用户提供「安全感」 14:19 AI Coding 和 Agent 最终会殊途同归吗? 16:15 Agent 的终局会走向通用还是垂直? 17:17 脱离了 RL,Agent 就不成立了 19:15 所以 Agent 创业公司该如何使用 RL? 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态 31:54 Sheet0 是一个怎样的 Agent 产品? 34:15 怎么把任务执行的准确率做到了 100%? 35:39 Workflow 会被 Agent 颠覆掉吗? 36:49 不同 Agent 的核心区别是什么? 39:05 AI Coding 是大模型的「灵巧手」 41:41 Agent 有两大「信任」命题 44:22 分享一个预测 Agent 未来发展的思考框架 47:33 如何快速判断一家 Agent 公司做得好不好? 【Reference】 文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》 【活动预告🥳】 4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros Rss Apple Podcaster →