两阶段轮回:体系在 “草拟” 与 “深化” 两个状况间赓续瓜代。就像人类专家一样,写完一段草稿后,会急速停下来反思:“有没有须要弥补的处所?侧重点应当是如何的?”,然后回头扩大章节、弥补检索、填充新内容。

  • 清华大年夜学天然说话处理实验室、中国人平易近大年夜学、面壁智能与 OpenBMB 开源社区结合宣布并开源 AgentCPM-Report,一个本地化、私有化、拥有 SOTA 机能的深度调研智能体。

    AgentCPM-Report 核心亮点

    • 极致效能,以小博大年夜:经由过程平均 40 轮的深度检索与近 100 轮的思维链推演,实现对信息的全方位发掘与重组,让端侧模型也能产出逻辑严密、洞察深刻的万字长文,在深度调研义务上以 8B 参数范围杀青与顶级闭源体系的机能对标。

    • 据介绍,AgentCPM-Report 之所以能以 8B 参数媲美闭源体系源于两大年夜技巧立异:

      立异一:“写作即推理”模式,让思虑更切近人脑

      传兼顾划试图让模型“一口气”生成完全大年夜纲或内容,轻易造成产出申报的逻辑崩塌,对于小模型来说是更是难上加难。AgentCPM-Report 立异性地采取了“边写作,边筹划”的迭代精华精辟框架打破这一局限:

      • 渐进式优化:将宏大年夜的万字长文义务,拆解为一系列可履行的渺小目标。模型在每一轮轮回中只需解决当下的局部问题,从而在较小的参数范围前提下产出逻辑严密、细节丰富的长篇申报。

      立异二:“多阶段智能体进修”,全方位才能晋升

      01 四大年夜核心才能拆解

      将完全申报协作拆解为四个核心才能模块,并针对性地进行强化练习:

      🔍 智能检索才能:以“召回率”为核心优化指标,确保检索内容高度相干,为写作奠定坚实基本;

      📝 流畅写作才能:建立多维度质量评估体系,从内容深度到表达清楚度周全把关;

      🎯 精准决定计划才能:采取“轨迹剪枝”技巧,构造高质量数据,解决“何时停止深化”的关键决定计划问题。

      02 三阶段练习法:从入门到精晓

      • 有监督微调:高质量范文引导,控制写作根本范式;

      • 🗺️ 科学筹划才能:对生成大年夜纲进行构造化评估,确保申报逻辑严谨、层次分明;

        原子才能强化:针对每项核心原子才能进行专项晋升;

      • 物理隔断,本地安然:专为高隐私场景设计,支撑完全离线的本地化敏捷安排,彻底杜绝云端泄密风险。基于 UltraRAG 框架,它能高效挂载并懂得您的本地私有常识库,让核心计心境密数据在“不出域”的前提下,安然地转化为极具价值的专业决定计划申报。

      全流程优化: 端到端全链路强化进修,以最终申报质量为独一目标,打通所有才能关节。

    AgentCPM-Report 开源地址

    • GitHub:https://github.com/OpenBMB/AgentCPM
    • HuggingFace:https://huggingface.co/openbmb/AgentCPM-Report
    • ModelScope:https://modelscope.cn/models/OpenBMB/AgentCPM-_Report
    • GitCode:https://gitcode.com/OpenBMB/AgentCPM
    • 魔乐社区:https://modelers.cn/models/OpenBMB/AgentCPM-Report

  • 点赞(0) 打赏

    评论列表 共有 0 条评论

    暂无评论

    微信小程序

    微信扫一扫体验

    立即
    投稿

    微信公众账号

    微信扫一扫加关注

    发表
    评论
    返回
    顶部