阶跃星辰宣布旗下语音模型 Step-Audio-R1.1 在大年夜模型评测榜单 Artificial Analysis Speech Reasoning 中登顶全球榜首。

阶跃星辰介绍称,该榜单是今朝业界评估“原生语音模型”(Native Audio Models)最威望的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的才能,重要考察维度包含精确率、首包延迟等。和大年夜说话模型同理,语音模型同样须要具备强大年夜推理才能,才能供给更高阶智能、更天然交互。
Step-Audio-R1.1 以 96.4% 精确率,超出 Grok、Gemini、GPT-Realtime 等主流一线模型,刷新汗青最好成就。在机能与速度的综合衡量上,Step-Audio-R1.1 周全碾压同类语音模型。

Step-Audio-R1 是由阶跃星辰宣布的全球首个开源原生语音推理模型。它可以在不增长额外时延的情况下,端到端懂得语音内容,“像人类一样听到对话即可思虑”。
深度语音推理
及时响应才能
音频范畴的可扩大 CoT
Step-Audio-R1.1 是最新进级版本,兼顾更强及时对话和复杂语音推理才能。完全的及时语音 API 将在 2 月上线,今朝开放的 chat 模式已搭载 R1.1 核心,支撑边想边说的流式推理。
今朝,Step-Audio-R1.1 权重已上传至 HuggingFace:https://huggingface.co/stepfun-ai/Step-Audio-R1.1
体验地址:https://www.stepfun.com/studio/audio?tab=conversation
核心才能包含:
-
GitHub 地址:https://github.com/stepfun-ai/Step-Audio-R1
魔搭 ModelScope:https://modelscope.cn/studios/stepfun-ai/Step-Audio-R1

发表评论 取消回复