2026/6/10 23:45:45
网站建设
项目流程
战酷设计网站官网入口,高端网站建设价格,公司简介模板表格,灵山建设局网站这是 AI 闹的新栏目 AI 实践派#xff08;AI Practitioners#xff09;。我们持续关注在 AI 领域使用新认知、新范式解决真问题的 AI builder。
过去半年#xff0c;AI 行业有一个能力变得刚需而紧缺#xff1a;为 Agent 架构流程#xff08;Agentic Process ArchitectAI Practitioners。我们持续关注在 AI 领域使用新认知、新范式解决真问题的 AI builder。过去半年AI 行业有一个能力变得刚需而紧缺为 Agent 架构流程Agentic Process Architect。这个能力简单概括就是把大模型变成一个「能办事的员工」。业内共识在发生变化在模型增速放缓的当下Agent 的架构将会越发重要。硅谷的一些大公司为一个初级 Agent 流程架构师开出的年薪达200万美元。本文分享者许长鹏CP yan5xu曾在 ManusMonica 担任工程师长期活跃在推特社区一直自称为 AI 野生研究员。他发现当大家在讨论如何架构一个 Agent 时常陷入两种误区第一是认为它无所不能什么都能干第二是过度简化认为它不过是把大模型多调用几次的产物。「核心原因是大家对 Agentic 循环过程的体感缺乏理解。」许长鹏告诉 AI 闹「相当于大家直接看了答案很多中间的思考跳过。」源于他开发 Agent 的实践经验和离职后与许多团队密集交流的结果他提出了一个重点观点构建一个有用的 Agent并非源于模型智力的飞跃而是源于如何围绕模型设计一套行之有效的「认知流程」。许长鹏认为这个过程本质是在用更多的计算步骤和更长的思考时间去交换一个在真实世界「真有用」的结果即以「时间换效果」「我们不做可以一次就拿到结果的乐观假设而是通过可信的过程来确保结果的质量。」他用了一个非常生动的比喻大模型是一个天才少年叫小明让小明直接参加高考他大概率不能获得一个好成绩。原因是他缺乏对学习—考试的基本认知。所以必须有人指导他写完要检查试卷否则容易出错基础 API 调用阶段推理按部就班否则避免跳步和漏洞思维链 CoT要主动复盘答题过程修正错误自我反思遇到老师没教过的难题要学会规划时间全盘考虑哪些放弃哪些保住调整策略取得高分经历这一系列训练小明才能拿到好成绩。「小明如何一步步通过流程的设立提高自己的成绩在这个过程中他的知识智力没有改变但流程发生变化就能大幅提升最终成绩效果。」许长鹏说。以下是他的分享我们在原文基础做了重新编辑经过了他的校正本文的重点围绕「如何为 Agent 建立一个有效的认知流程」三个方法为 Agent 装上「心脏」第一个办法是为 AI 设计流程。许长鹏认为很多人初次接触 Agent 会产生一种困惑怎么这么慢这么笨查个东西来来回回好几轮远不如直接问 ChatGPT 一秒出答案。但是这种「慢」恰恰是揭示了一个深刻的转变Agent 的流程架构正在从追求大语言模型LLM那种一次性的、直觉式的快思考转向设计一种结构化的、可验证的慢思考。这套「慢思考」的核心就是我们为 AI 设计的流程。许长鹏推荐书籍LLM 原生的思考方式是「发散的」、「扁平的」。在面对一个真实、复杂的任务时它的长链条推理非常脆弱很容易在中间某个环节「跑偏」或者干脆「忘记」最初的目标。而设计流程即规划Planning、思维链CoT、甚至更复杂的树状思维Tree of Thoughts其本质是在为 AI 混乱的思考过程强行建立一套「逻辑脚手架」。「规划」是将宏大到无法一次性思考的目标比如建一栋摩天大楼分解为一系列清晰、有序、可执行的步骤如第一步打地基第二步建主体第三步封顶它确保 AI 每一步行动都服务于最终目标。「思维链」保证每一步的内部逻辑是严谨的有点像《内部施工手册》比如钢筋要这么绑混凝土必须是 C50 标号强制 AI 的推理过程必须环环相扣。这套「逻辑脚手架」极大地提升了AI 解决复杂问题的能力上限。第二个办法是为解决 LLM 有限的注意力。设计反思Reflection、总结Summarization等流程本质上是在为 AI 的记忆打造一套「高效的压缩算法」。举一个旅行规划的案例当 Agent 用 browser-use 的方式访问完整后发现「故宫门票售罄」时Reflexion 流程被触发但是 Agent 不会把官网返回的所有 HTML 代码、弹窗提示等冗长的、原始的信息全都塞进自己本就宝贵的「记忆」。如果是那样它的上下文窗口很快就会被无用的信息撑爆。相反它启动了一次 「记忆压缩」将这次失败的交互过程提炼成了一句高信息密度的结论并将其作为一条「经验」存入记忆故宫门票需提前一周预订本周不可行。这个过程是一次「有损但极其有效」的压缩。它丢弃了99%的无关细节来实现用极小的上下文空间保留了对未来决策100%关键的信息。这套「压缩算法」让 AI 拥有了「长期记忆」而且是动态的使其在有限的注意力范围内处理更长的时间线完成更复杂的任务。第三个办法是设计「工具」让模型连接现实世界。一个流程无论设计得多么精妙如果它与现实世界完全隔离那就只是空中楼阁。因此流程必须拥有与世界交互的能力于是工具Tool这个概念出现了。工具不是一个与流程并列的概念它更像是流程的「神经触手」。ReAct 框架是一个将思考与行动调用工具深度绑定的框架。在这个框架的驱动下AI 在思考过程中如果意识到「我的内部知识不足以支撑下一步决策」就会主动伸出「search_api」去链接互联网把动态的客观事实传回大脑再继续思考。也因此架构 Agent 的首要职责是设计模型的思考结构、记忆机制和与世界交互的范式它通过两大核心机制来对抗模型的遗忘和混乱。1、高效的信息压缩如Reflexion流程它不会把冗长的失败日志直接塞入记忆而是将其提炼成一句高信息密度的经验教训。这是一种有损但高效的压缩用极低的 Token 成本保留了最关键的决策信息。2、精准的选择性注入流程在每一个 Think 环节之前会像一位顶级外科手术的器械护士精准地判断此时此刻我们最需要哪一条历史经验最需要哪一个工具然后将这些信息组合成一个干净、高效的上下文递给 LLM 进行处理。两个底层认知信息论和方法论这里要回溯两条重要理论为什么为 Agent 设计从思考 - 行动 - 观察 这个循环从根本上就是有效的。这里需要跳出 AI 范式理解「控制论」和「信息论」。先说控制论控制论可以体现 Agent 是如何一步步「逼近」解决方案的过程。控制论有两个系统开环系统与闭环系统 。一个典型的开环系统就像那种定时器的老式暖气。设定它运行一小时期望它能让房间变得温暖但它没有感知「当前室温」的能力。也因此如果今天恰好有太阳一小时后房间会很闷热其根本缺陷是 「缺乏反馈」。这正是标准 Chatbot 的工作模式接收指令并一次性生成结果不去验证这个结果是否真正解决问题。一个经典的闭环系统冰箱为例冰箱的核心任务是「维持冷藏室恒定在5°C」。1、目标 用户设定的“5°C”。2、传感器 内部的温度计持续观察当前的实际温度。3、控制器 温控芯片思考 「当前温度和目标温度之间是否存在偏差」4、执行器 压缩机。一旦控制器发现偏差比如温度上升到6°C就会命令压缩机行动5、反馈闭环 压缩机工作导致温度下降传感器将新温度反馈给控制器控制器发现偏差消失回到5°C于是命令执行器停止。我们可以清晰地看到Agent 逼近目标的步骤是和冰箱的内部运作系统是一一对应的。1、目标 用户的指令2、传感器 观察环节获取工具返回的结果3、控制器 思考环节LLM 进行推理和规划4、执行器 行动环节调用工具5、反馈闭环 将观察的结果作为输入传给下一轮思考「信息论」则揭示了 Agent 在探索复杂而未知的问题时究竟要「做什么」信息论将「熵」定义为对不确定性的度量。系统的信息量越大不确定性就越小熵值也就越低。解决问题的过程本质都可以视为一个「通过获取有效信息降低熵减」的过程。Agent 面对复杂工作正是在一个抽象的问题空间中进行一场「熵减」行动。它的每一次 行动-观察的循环都是一次科学实验目的就是为了获取更多不确定性的信息当「不确定」被完全消除通往答案的唯一路径也就清晰浮现。综上控制论为 Agent 提供了目标的纠错能力。信息论定义则是 Agent 探索未知空间的核心理论。这两个理论是我们必须理解 Agent 运行所依据的科学理论。三个突破让 Agent 性能提升自此我们明确了架构一个有效的 Agent 的核心工作包括1、 设计 AI 的思考流程定义 AI 如何进行规划、拆解、推理与反思。你设计的不是一个提示词而是 AI 的「心智内核」与「行事准则」。2、 赋能 AI 的行动工具为 AI 锻造与物理世界和数字世界交互的双手双脚。敏锐识别流程中的信息瓶颈并创造或接入合适的工具让 AI 的能力边界得以延伸。3、 构建 AI 的决策上下文不是上下文的搬运工而是通过精妙的流程设计确保在每一个决策瞬间AI 的注意力恰好聚焦在最有价值的信息上。但现在这套强大的「慢思考」在提升结果质量的同时也带来了一个全新的工程挑战执行效率。如何让 Agent 在追求高质量的同时也能拥有高性能一线的工程实践正从以下几个关键层面寻求突破。1、架构选型与剪枝并非所有任务都需要复杂的 ReAct 循环。通过实践发现能通过一两步直接解决问题的场景使用 LLM 内置的工具调用 范式会更高效。 可以降低 token 消耗和端到端延迟。2、并行化执行当 Agent 的规划结果包含多个「没有依赖关系的子任务」时例如查询北京的天气和搜索热门商铺现代 Agent 框架如 LangChain 已经能支持并行工具的调用 可以利用异步 I/O 的能力将原本需要串行等待的多个 API 请求并发出去从而将总耗时从「所有任务耗时之和」缩短为「最长任务的耗时」这是最显著提升执行效率的方法。3、模型特化与路由单一模型策略正在被淘汰更优的实践是采用混合模型策略。例如使用一个轻量、高速的模型如 gemini-2.5-flash, claude-haiku-4.5承担流程中「规划」、路由或简单工具选择等高频、低复杂度的任务遇到需要深度推理的复杂节点时才调用重量级、高成本的核心模型如 gpt-5-pro, gemini-2.5-pro。分层策略能以更低的成本和延迟完成大部分流程步骤。4、高效的记忆架构LLM 有限的上下文窗口决定了我们不可能将所有历史信息塞入提示。因此设计一个高效的「记忆检索」机制至关重要。这不仅仅是技术选型如使用向量数据库更是策略设计。如何将对话历史、过往的行动轨迹、成功的经验与失败的教训进行压缩、提炼并结构化存储。写在结尾当我们为 Agent 装上「心脏」和「加速器」之后未来最大的挑战就是为模型「构建大脑」。当前业界最前沿的探索也正聚焦于以下几个方向1、认知调度中心智能工作流编排一个成熟的 Agent 应当像一位经验丰富的项目经理面对不同的任务能自主规划并编排最优的执行流程。这正是「动态流程编排」的核心思想。Anthropic 最新发布的 Skills 功能是这一思想的最佳实践这代表着 Agent 的思考环节已从「下一步做什么」的战术决策进化为「如何分步达成最终目标」的战略规划。2、规约驱动的分层架构从单兵到团队对于复杂任务分层与分治是必然选择。其关键在于如何多个 Agent 高效、可靠地协作。答案是由规约驱动Spec-Driven。一个「规划 Agent」首要任务是生成一份详尽、明确的技术规约 如同工程蓝图成为所有下游「执行 Agent」工作的唯一契约。这正是以 GitHub 开源的 SpecKit 等为代表的前沿项目所探索的核心思想它标志着 Agent 协同正在进化为可追溯、可验证的「现代软件工程」。Ps这部分可延展阅读我们之前报道的多智能体协作前AWS科学家让 Agent 学会彼此合作、竞争甚至争吵和OpenAgents创始人 Raphael Shu 聊群体智能3、即时代码生成 从「使用工具」到「创造工具」传统工具使用是让 Agent 在固定的工具箱里做选择题。未来的方向是让 Agent 自己创造工具。Code Act (CodeAct: A Multi-Turn Code Agent with In-Context Learning) 等研究正在引领这一趋势。当面对没有现成工具可用时Agent 会动态地生成一段 Python 代码一个微型工具在隔离环境中执行并根据执行结果推进任务。这让 Act 环节从「调用API」进化为具备无限可能的「代码生成与执行」 Agent的能力边界会得到无限的提升。这些最前沿的探索才是未来架构一个「Agent 」最激动人心的工作。参考与延伸阅读Part 1: 核心学术论文1、思维链 (Chain of Thought, CoT)标题: Chain-of-Thought Prompting Elicits Reasoning in Large Language Models链接: https://arxiv.org/abs/2201.11903简介: 首次系统性地证明通过在提示中加入「思考过程」的范例可以激发大语言模型解决复杂推理任务的能力是结构化提示的奠基性工作。2、思维树 (Tree of Thoughts, ToT)标题: Tree of Thoughts: Deliberate Problem Solving with Large Language Models链接: https://arxiv.org/abs/2305.10601简介: 将线性的思维链扩展为树状的多路径探索。它允许 Agent 在一个思考节点上探索多个不同的推理路径并使用自我评估来决定最优解是更强大的结构化思考流程。3、Reflexion 框架标题: Reflexion: Language Agents with Verbal Reinforcement Learning链接: https://arxiv.org/abs/2303.11366简介: 首次将「自我反思/复盘」这一概念框架化、自动化。它证明了 Agent 可以通过对过往失败进行「语言反思」来迭代优化自身行为而无需重新训练模型。4、ReAct 框架标题: ReAct: Synergizing Reasoning and Acting in Language Models链接: https://arxiv.org/abs/2210.03629简介: 提出了里程碑式的 Thought - Act - Observe 框架将「思考」Reasoning和「行动」Acting深度交织是现代 Agent 框架与外部世界交互的理论基石。5、CodeAct 框架标题: CodeAct: A Multi-Turn Code Agent with In-Context Learning链接: https://arxiv.org/abs/2402.01030简介: 雄辩地证明了 Agent 的 Act 环节可以从「调用预定义工具」进化到「即时生成代码并执行」极大地扩展了 Agent 的能力边界。Part 2: 行业资料与实践资源1、奠基性的综述Lilian Weng的《LLM-powered Autonomous Agents》链接: https://lilianweng.github.io/posts/2023-06-23-agent/简介: OpenAI 应用研究负责人撰写的、行业内引用最广泛的 Agent 综述文章是建立该领域全局认知地图的第一站。2、核心思想LLM操作系统 by Andrej Karpathy简介: Andrej Karpathy (OpenAI创始成员) 在多个演讲中极具前瞻性地提出LLM 是新型计算范式的「CPU」而 Agent 框架则扮演了「操作系统」的角色。3、主流开发框架LangChain LlamaIndex链接: https://python.langchain.com/ 和 https://www.llamaindex.ai/简介: 当下构建 Agent 应用的两大事实标准库。LangChain 侧重于流程Chain AgentLlamaIndex 侧重于数据RAG是开发者将理论付诸实践的首选工具。4、前沿架构探索规约驱动的协同 (Specification-Driven Collaboration)简介: 解决多 Agent 协作的核心在于建立一套机器可读的「契约」或「规约」。这一方向的代表性项目包括 AI IDE Kiro (https://kiro.tech/) 和开源工具包 Spec Kit (https://github.com/braid-work/spec-kit)。5、复杂工具的智能编排简介: 强大的 Agent 应能为达成一个复杂目标自主地、多步骤地规划并调用一系列工具。Anthropic 的 Skills功能 (https://www.anthropic.com/news/skills) 将 Agent 的工具使用能力从「单次调用」提升到了「智能编排」是这一方向的最佳行业实践。6、社会行为涌现斯坦福的「西部世界小镇」论文: Generative Agents: Interactive Simulacra of Human Behavior (https://arxiv.org/abs/2304.03442)简介: 一项现象级的 AI 实验展示了当 Agent 拥有了记忆和反思能力后在一个虚拟社会中能够涌现出多么可信的自发行为是多 Agent 系统探索的绝佳延伸阅读。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取