在分发渠道上,除经由过程 Microsoft Foundry 面向企业和开辟者供给办事外,微软还宣布其 MAI 系列模型将陆续上岸 Fireworks AI、Baseten 和 OpenRouter 等第三方平台。 同时,Fireworks AI 也已在 Microsoft Foundry 内实现一般可用,为企业客户供给更多架构和安排选择。 经由过程与多家平台合作,微软欲望进一步降低接入门槛,加快 MAI 模型在不合云和对象生态中的落地。
在图像生成方面,微软此前宣布的 MAI-Image-2.5 及其“闪电版”(flash variant)已经由过程 Microsoft Foundry 向开辟者开放。 据微软转引的 Arena 最新文榜单数据,MAI-Image-2.5 在文本生成图像义务上超出了Google的 Nano Banana Pro,进入榜单前三名。 该模型已经集成进 PowerPoint,并正慢慢向 OneDrive 推出,为 Office 生态供给更高质量的图像生成功能。

微软表示,以前一年中 MAI 模型家族持续扩容,先后宣布了 MAI-Voice-1、MAI-1-preview,以及本年早些时刻的 MAI-Transcribe-1 和 MAI-Image-2,之后又推出在文本衬着、风格化插画和商用图像质量方面均有晋升的 MAI-Image-2.5。 本次在此基本上新增推理与代码模型,并同步进级语音、转写和图像产品线,形成更完全的产品组合。
MAI-Thinking-1 是微软官方颁布的首款推理模型,由 Microsoft AI 团队自零开端练习,没有采取其他模型蒸馏而来。 微软强调,该模型应用经由清洗、且具有贸易许可的企业级数据练习,旨在知足企业用户对数据合规和可商用性的请求。 MAI-Thinking-1 为中等范围模型,拥有 350 亿个激活参数,支撑 128K 高低文窗口,重要面向复杂多步调指令履行、长高低文推理以及代码生成等场景。
尽管微软并未在通知布告中公开具体基准测试数据,但其在博客中援引自力评审成果称,在盲测中,评审者在整体偏好上更偏向于 MAI-Thinking-1,而非 Anthropic 的 Claude Sonnet 4.6。 此外,微软还表示,在 SWE-bench Pro 代码义务测试中,MAI-Thinking-1 在编码表示上可与 Claude Opus 4.6 相当,显示出该模型在开辟者和复杂工程义务上的潜力。 MAI-Thinking-1 今朝已经由过程 Microsoft Foundry 向特定客户开启私有预览。
在语音转写方面,微软本年 4 月曾宣布 MAI-Transcribe-1,支撑基于其自有产品应用数据统计出的 25 种最常用说话的语音转文本转写。 本次微软推出进级版本 MAI-Transcribe-1.5,在语音辨认精确率方面达到业界领先程度,覆盖说话数量扩大至 43 种,并筹划很快为该模型参加流式转写才能,以知足及时场景需求。
语音合成偏向上,在本年 4 月宣布 MAI-Voice-1 一般可用之后,微软此次又宣布 MAI-Voice-2 以及其闪电版变体。 新一代语音生成模型支撑额外跨越 15 种说话,并供给更多语音风格选项,以适配更丰富的应用处景,例如多说话客服、内容配音和智能助手等。
面向开辟者的编码场景,微软同步推出 MAI-Code-1,这是一款针对 GitHub 工作负载优化的高效推理代码模型。 该模型已经在 GitHub Copilot 和 Visual Studio Code 中上线,面向日常编码、重构和代码补全等场景供给支撑。 固然微软尚未披露 MAI-Code-1 的具体基准测试成果,但此次宣布被视为一个重要旌旗灯号——微软在 GitHub Copilot 的底层模型上不再完全依附 OpenAI 和 Anthropic,而是慢慢引入自研模型。
从整体构造来看,微软正以 MAI 推理、编码、语音、转写和图像等多类型模型构建一套完全的企业级 AI 才能矩阵。 跟着 MAI-Thinking-1 和 MAI-Code-1 的参加,微软在复杂推理以及开辟者临盆力范畴的话语权明显加强,也为 GitHub Copilot、Office 系列及合作平台供给了更具竞争力的技巧底座。

发表评论 取消回复