ElevenLabs 推出 Scribe v2 转录模型 ,专注于离线批量转录和字幕制造场景。该模型在英语中的词错率约为 5% ,在印地语等 90 多种说话中低于 10% 。

Scribe v2 已集成至 ElevenLabs Studio,支撑跨越 10 小时 的大年夜文件处理,并相符 GDPR 和 HIPAA 等合规请求。其功能包含支撑自定义术语的 Keyterm Prompting 以及智能多措辞人日记。

此外,针对超低延迟需求,官方还推出了 Scribe v2 Realtime 版本,专门为 Agent 用例进行了优化。

亮点特点

  • 实用于大年夜范围转录和字幕:Scribe v2 专为批量转录、字幕制造和标题生成设计,其稳定性和精确度比 Scribe v1 更高,可以或许处理长音频、逗留、语调变更和长时光静音。模型支撑 90 多种说话,实用于跨语种场景。
  • 关键词提示:供给关键词提示功能,用户可供给多达 100 个词语或短语,模型会根据高低文决定何时精确转录这些术语,合适技巧文档、品牌名等。
  • 内置实体检测支撑 56 类实体的检测,并给出精确的时光戳,可用于辨认小我信息、健康数据或付出信息。
  • 多说话主动转录:无需手工分段即可处理单个文件中的多说话内容。
  • 企业级功能供给智能措辞人分别、精确的字级时光戳、动态音频标签(辨认笑声或脚步声)等特点,并相符 SOC 2、ISO 27001、PCI DSS L1、HIPAA、GDPR 等合规请求,支撑零保存模式。
  • Scribe v2 已经集成到 ElevenLabs Studio 中,开辟者也可经由过程 API 应用

详情查看:https://elevenlabs.io/blog/introducing-scribe-v2

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部