两阶段轮回:体系在 “草拟” 与 “深化” 两个状况间赓续瓜代。就像人类专家一样,写完一段草稿后,会急速停下来反思:“有没有须要弥补的处所?侧重点应当是如何的?”,然后回头扩大章节、弥补检索、填充新内容。
清华大年夜学天然说话处理实验室、中国人平易近大年夜学、面壁智能与 OpenBMB 开源社区结合宣布并开源 AgentCPM-Report,一个本地化、私有化、拥有 SOTA 机能的深度调研智能体。
AgentCPM-Report 核心亮点
-
极致效能,以小博大年夜:经由过程平均 40 轮的深度检索与近 100 轮的思维链推演,实现对信息的全方位发掘与重组,让端侧模型也能产出逻辑严密、洞察深刻的万字长文,在深度调研义务上以 8B 参数范围杀青与顶级闭源体系的机能对标。
-

据介绍,AgentCPM-Report 之所以能以 8B 参数媲美闭源体系源于两大年夜技巧立异:
立异一:“写作即推理”模式,让思虑更切近人脑
传兼顾划试图让模型“一口气”生成完全大年夜纲或内容,轻易造成产出申报的逻辑崩塌,对于小模型来说是更是难上加难。AgentCPM-Report 立异性地采取了“边写作,边筹划”的迭代精华精辟框架打破这一局限:
-
渐进式优化:将宏大年夜的万字长文义务,拆解为一系列可履行的渺小目标。模型在每一轮轮回中只需解决当下的局部问题,从而在较小的参数范围前提下产出逻辑严密、细节丰富的长篇申报。
立异二:“多阶段智能体进修”,全方位才能晋升
01 四大年夜核心才能拆解
将完全申报协作拆解为四个核心才能模块,并针对性地进行强化练习:
🔍 智能检索才能:以“召回率”为核心优化指标,确保检索内容高度相干,为写作奠定坚实基本;
📝 流畅写作才能:建立多维度质量评估体系,从内容深度到表达清楚度周全把关;
🎯 精准决定计划才能:采取“轨迹剪枝”技巧,构造高质量数据,解决“何时停止深化”的关键决定计划问题。
02 三阶段练习法:从入门到精晓
-
有监督微调:高质量范文引导,控制写作根本范式;
-
🗺️ 科学筹划才能:对生成大年夜纲进行构造化评估,确保申报逻辑严谨、层次分明;
原子才能强化:针对每项核心原子才能进行专项晋升;
-
物理隔断,本地安然:专为高隐私场景设计,支撑完全离线的本地化敏捷安排,彻底杜绝云端泄密风险。基于 UltraRAG 框架,它能高效挂载并懂得您的本地私有常识库,让核心计心境密数据在“不出域”的前提下,安然地转化为极具价值的专业决定计划申报。
全流程优化: 端到端全链路强化进修,以最终申报质量为独一目标,打通所有才能关节。
-
AgentCPM-Report 开源地址
- GitHub:https://github.com/OpenBMB/AgentCPM
- HuggingFace:https://huggingface.co/openbmb/AgentCPM-Report
- ModelScope:https://modelscope.cn/models/OpenBMB/AgentCPM-_Report
- GitCode:https://gitcode.com/OpenBMB/AgentCPM
- 魔乐社区:https://modelers.cn/models/OpenBMB/AgentCPM-Report

发表评论 取消回复