奕道配资让Agent把成功经验固化成skills，跨模型复用成功率100%

AI 会用工具了，问题才真正开始…

这两年，大模型 Agent 在"用工具"这件事上进步很快。搜索、查信息、调 API，很多模型已经能把一串操作接起来，完成相当复杂的多步任务。

但一旦把场景拉近到真实工作流，问题很快就会显现出来。很多任务表面上不同，底层流程其实高度相似：先搜，再筛，再整理，最后再做一点汇总分析。换一个对象，这套流程往往又要完整走一遍。

麻烦在于，现有 Agent 虽然会做这些事，却不太会把已经做成功过的流程留下来。

圆满完成任务后，再遇到同样任务它还是会重新规划、重新传参、重新走一遍工具链。结果就是：任务也许做成了，但 token 越跑越多，上下文越来越长，成本和不稳定性也一起上来了。

为解决该问题，近期一项由 NIPS 时间检验奖得主等参与的新研究——SkillCraft，在圈内自发形成了一定热度。该研究尝试回答这个很具体的问题：Agent 能不能把已经跑通的工具链，逐渐变成以后还能继续用的 skill。

SkillCraft 让 Agent 工具"越用越熟"

SkillCraft 的核心思路是：让 Agent 在测试时一边做任务，一边把反复有用的工具链整理成 skill。

这个过程可以理解成四步：

先看看库里有没有现成的 skill 能用

没有的话，就先按老办法用原子工具把任务做出来

做出来之后，把这条成功轨迹抽象成一个带参数的 skill

最后过一遍 verifier，再放进 skill library

这个设计的妙处在于，它不是简单"记住答案"，也不是给模型多塞一段提示词。

它做的是更进一步的事：把经验变成一个能执行、能复用的高层操作单元。

让 Agent 在完美完成一个任务后将可行方案归纳整理，从而在下一次遇到类似问题时，快速复用已有的可行路径。

固化成功流程，收益立竿见影

论文结果显示，在引入 skill 保存与复用后，多数模型都出现了明显收益：

token 更少

工具调用更少

成本更低

成功率通常提升或者持平

一旦允许 Agent 在测试时保存并复用 skill，多数模型都会出现比较明显的收益：工具调用更少，token 更低，成本下降，成功率提升

以 GPT-5.2 为例，Skill Mode 下的成功率从87% 提升到 90%，平均 token 从1.23M 降到 0.26M，成本也从1.77 美元降到 0.43 美元。这说明，skill 的保存和复用不是一个可有可无的小技巧，而是会真实影响 agent 表现的能力。

换句话说，SkillCraft 最有价值的地方，不是单纯证明" skill 这个概念有意义"，而是证明：一旦 Agent 真能把成功流程保存为可复用的技能，效率和表现都会切实提升。

技能树不能只追求深度

论文测试了 hierarchical skill composition，允许 agent 通过在 skill 内部调用已有 skill 的方式，实现更复杂的 skill。结果发现：

层级更深，未必更稳

低层 bug 会向上级联

一个边界条件错误，可能拖垮整棵技能树

这说明现阶段更实用的路线，可能不是自动生成越来越深的技能树。

而是优先构建高质量、浅层、可验证的 skill library。

不只当前任务，还有"技能迁移"

SkillCraft 的另一个亮点，是它还评估了 skill 的泛化能力。

研究发现，高质量 skill 不仅在当前任务能用，在很多情况下还能：

跨任务复用

跨难度复用

甚至跨模型复用

以下两张图展示的，正是跨模型 skill reuse的两个关键结论。

通过 skill 跨模型复用的 Success Rate Heatmap，团队发现：

由更强模型创建的 skill，往往能在不同执行模型上都保持较高成功率

最典型的是 Claude 这一行，四个执行器上都是 100%；

真正高质量的 skill 往往具有较强的可迁移性，而不是只能被创建它的那个模型自己使用。

通过 skill 跨模型复用的 Token Saving heatmap，团队发现：

Skill 不只是"能不能用"，还要看"用了之后值不值"。比如 Claude 创建的 skill，在不同执行器上普遍都能带来很高的节省；而质量较弱的 skill，节省效果就明显更不稳定，甚至在某些组合下会出现负收益。也就是说

高质量的 skill 不仅成功率更稳定，也更容易带来显著的 token 节省。

SkillCraft 解决的，不只是 Agent 会不会用工具，而是它能不能把确认可行的工具链，变成随时可复用的技能。

这可能比"再多做几道题"更重要。因为真正有用的 Agent，不该永远像第一次做任务那样工作，而应该拥有自己的经验积累，产出真正可复用、可迁移、而且值得复用的 skill。

论文标题：

SkillCraft: Can LLM Agents Learn to Use Tools Skillfully?

论文地址：

https://arxiv.org/abs/2603.00718

项目主页：

https://skillcraft-website.github.io/page/

源码：

https://github.com/shiqichen17/SkillCraft

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

我们正在招聘一名眼疾手快、关注 AI 的学术编辑实习生 � �

感兴趣的小伙伴欢迎关注 � � 了解详情

� � 点亮星标 � �

科技前沿进展每日见

广盛网配资提示：文章来自网络，不代表本站观点。

奕道配资让Agent把成功经验固化成skills，跨模型复用成功率100%

国睿信配预防产品召回！深圳赛特：服装皮革偶氮致癌芳香胺检测｜CMACNAS认证，快速报告_偶氮染料_纺织品_样品

棒棒策略 2026年3月云南等多地银行降息存款利率进入0字头储户怎么应对

俊升配资摩恩电气(002451.SZ)发布2025年度业绩，归母净利润1058万元，同比下降40.79%

老钱庄 “让智能更安全”，安恒范渊：网络安全防护应以AI监管AI

360配资网销量低迷拖累Q2营利持续下滑，特斯拉发力无人驾驶和机器人

黑马配资春假叠加清明假期催热研学游

鸿岳资本评选明穿小说的十大杰出作家：柯山梦跻身第二，灰熊猫稳居第四_代表作_地位_作品

牛配资 7月22日福蓉转债上涨012%，转股溢价率1816%

国睿信配预防产品召回！深圳赛特：服装皮革偶氮致癌芳香胺检测｜CMACNAS认证，快速报告_偶氮染料_纺织品_样品

本信选配十余辆汽车被货车遗落铁片扎爆胎高速路突发状况引发关注

豪泰配资玄学提醒:为什么家里要放石头？不是装点门面，是镇宅的！