阶跃星辰宣布旗下语音模型 Step-Audio-R1.1 在大年夜模型评测榜单 Artificial Analysis Speech Reasoning 中登顶全球榜首。

阶跃星辰介绍称,该榜单是今朝业界评估“原生语音模型”(Native Audio Models)最威望的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的才能,重要考察维度包含精确率、首包延迟等。和大年夜说话模型同理,语音模型同样须要具备强大年夜推理才能,才能供给更高阶智能、更天然交互。

Step-Audio-R1.1 以 96.4% 精确率,超出 Grok、Gemini、GPT-Realtime 等主流一线模型,刷新汗青最好成就。在机能与速度的综合衡量上,Step-Audio-R1.1 周全碾压同类语音模型。

Step-Audio-R1 是由阶跃星辰宣布的全球首个开源原生语音推理模型。它可以在不增长额外时延的情况下,端到端懂得语音内容,“像人类一样听到对话即可思虑”。

深度语音推理

  • 及时响应才能

  • 音频范畴的可扩大 CoT

  • Step-Audio-R1.1 是最新进级版本,兼顾更强及时对话和复杂语音推理才能。完全的及时语音 API 将在 2 月上线,今朝开放的 chat 模式已搭载 R1.1 核心,支撑边想边说的流式推理。

    今朝,Step-Audio-R1.1 权重已上传至 HuggingFace:https://huggingface.co/stepfun-ai/Step-Audio-R1.1

    体验地址:https://www.stepfun.com/studio/audio?tab=conversation

    核心才能包含:

    • GitHub 地址:https://github.com/stepfun-ai/Step-Audio-R1
      魔搭 ModelScope:https://modelscope.cn/studios/stepfun-ai/Step-Audio-R1

    点赞(0) 打赏

    评论列表 共有 0 条评论

    暂无评论

    微信小程序

    微信扫一扫体验

    立即
    投稿

    微信公众账号

    微信扫一扫加关注

    发表
    评论
    返回
    顶部