如何提高智能体系统准确率智能体系统准确率提升框架在生产级智能体系统里，大语言模型

量子位看科技 2025-08-04 13:26:19

如何提高智能体系统准确率智能体系统准确率提升框架

在生产级智能体系统里，大语言模型（LLM）执行多步任务，准确率始终是个难题。

而Digital China提出的Routine框架，能用结构化脚本来规范LLM的执行路径，从而显著提高执行准确率。

1. 提升准确率靠拆步骤

【图2】展示了一个典型任务：用户想查Project_X参与人数。Routine让模型明确写好下列步骤：

- 第一步：调用`get_project_id`工具查ID；

- 第二步：用ID去调用`get_participants`查人；

每一步都写清楚目标、工具名和参数格式，让执行模型只管按流程跑。

2. 模块拆分让执行更稳定

【图3】展示了整体结构：Routine把智能体系统拆成“计划-执行-工具调用-记忆”四大模块。

- Planning Model生成执行脚本；

- Execution Model负责照做；

- MCP Server中转工具指令；

- 两种Memory（Procedure+Variable）负责复用旧流程、压缩输入长度。

这种模块化设计降低了模型的自由发挥空间，执行自然更准。

3. 效果提升如何？从实验数据看：

- GPT-4o执行准确率从41.1%飙升到96.3%；

- Qwen3-14B从32.6%提升到83.3%；

- 用Routine蒸馏再精调后，Qwen模型准确率最高达到**95.5%**，几乎追上GPT-4o。

这再次印证，只要流程定得好，小模型也能精准完成复杂任务。

4. AI自己也能写Routine

【图4】展示了一个完整交互过程：专家先写出任务逻辑草稿，GPT-4o优化成标准Routine，执行模型根据任务调用多个工具完成操作。整个过程可以自动化、可复用，甚至支持知识蒸馏给小模型。

Routine的作用不是让LLM更“聪明”，而是让它不犯错。通过结构化流程引导、合理拆模、精准参数传递和记忆模块支撑，即使是轻量模型，也能在智能体场景里跑出高准确率。

原文链接：arxiv.org/abs/2507.14447

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

ChatGPT新增学习功能ChatGPT要变学习搭子ChatGPT要变“学习搭子

2

中国脑机接口登Nature截肢患者靠脑机接口意念玩游戏一个瘫痪多年的人，现在能用

3

对AI大模型祛魅了AI大模型不过如此这篇文章，帮你给AI大模型“祛祛魅”：看清本

4

阿里开源复杂信息搜索模型AI检索复杂信息新突破阿里通义开源了WebSailor，

5

AI挑战囚徒困境Gemini称霸囚徒困境让一群AI在重复囚徒困境中相互对抗，会擦

6

AI像侦探一样推断用户生活习惯喂给AI收藏夹被扒了个底朝天把多年的“收藏夹”喂给

7

不用N卡跑CUDA开源CUDA项目ZLUDA起死回生能让非NVIDIA芯片跑CU

8

ChatGPT测试一起学习功能ChatGPT变身家教ChatGPT测试“一起学习

9

液态玻璃再迎调整液态玻璃新版本被吐槽变磨砂玻璃丑上热搜的“液态玻璃”被削？那新版

10

英伟达发文秀与OpenAI关系OpenAI没有背叛英伟达英伟达发布了一条意味深长

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

2

【星链全球大断网！马斯克道歉：确保类似情况不再发生】据媒体报道，SpaceX卫星

3

首款可折叠iPhone屏幕尺寸曝光说实话我不是很期待果子的折叠屏，因为我并不觉得

4

本月早些时候，微软宣布裁员9000人，引发了外界对公司未来战略与员工士气的广

5

2025下半年新机打架谁是你的菜？

6

这4款千元机谁最有性价比，一目了然。与友商竞品相比，才显得荣耀X70实属良心

7

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

8

论手感的话，个人感觉还得是钛金属，大家觉得呢？[思考]

9

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

10

有谁更新了iOS26公测版？！新鲜出炉的iOS26公测版，有更的吗？？📱

科技最新文章

1

荣耀Power2来了！10000mAh+骁龙8sGen4！荣耀倒逼充电宝彻底退市

2

按照国际惯例，今年三大旗舰手机分别是iPhone17Ultra，三星S26U

3

荣耀Magic8系列已经定档，10月发布！骁龙峰会9月发布骁龙8Gen5，荣

4

真吓我一跳，难怪美国急着要卖H20芯片呢！据报道，这种芯片的价格一般是每片10万

5

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满

6

只有华为Mate80RS非凡大师才能打，荣耀Magic8Ultra影像究竟有

7

荣耀最新旗舰荣耀Magic8系列配置预测，为了满足消费者的需求，这次的荣耀Mag

8

荣耀是不是把高端旗舰的算法用在X70上了？表现太牛了吧，画面纯净度很高，

9

荣耀、小米、OPPO、一加，哪个更值？网友推荐7月值得买手机，荣耀Mag

10

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满