Omni-Infer v0.8.0 已经宣布,超大年夜范围 MoE 模型推理加快技巧 Omni-Infer v0.8.0 已经发布,超大规模 MoE 模型推理加速技术。 v0.8.0 核心特性 *Pangu72B支持RL训练 支持模型列表 模型 硬件 精度类型 部署形态 openPangu-Ultra-MoE-718B A3 INT8 PD分离 openPangu-Ultra-MoE-... 应用软件 2026年01月22日 0 点赞 0 评论 134 浏览