ElevenLabs 推出 Scribe v2 Realtime,增强语音转文字功能
realtime news Nov 11, 2025 09:29
ElevenLabs 推出了 Scribe v2 Realtime,提供低于 150 毫秒的多语言低延迟语音转文字转录,增强了实时语音应用。
ElevenLabs 发布了 Scribe v2 Realtime,这是一款尖端的语音转文字模型,旨在为实时应用提供低延迟转录。根据 ElevenLabs 的介绍,这一最新研发在行业内设定了新标杆,能够在低于 150 毫秒的时间内为包括英语、法语、德语、意大利语、西班牙语和葡萄牙语在内的多种语言,以及另外 90 种语言,提供实时转录。
革新实时转录
Scribe v2 Realtime 适用于语音代理、会议助手和实时字幕等应用。该模型能够处理复杂场景和背景噪音,显著优于市场上的现有模型。其卓越的性能得益于多项功能,如用于预测下一个单词和标点符号的负延迟、自动语言检测和语音活动检测(VAD),这些功能共同提高了转录的准确性和效率。
关键功能和合规性
该模型提供一系列高级功能,包括文本条件处理、手动提交以完成转录,并支持各种音频格式,如 PCM (48kHz) 和 μ-律编码。此外,Scribe v2 Realtime 已做好企业应用的准备,符合如 SOC 2、ISO 27001、PCI DSS L1、HIPAA 和 GDPR 等主要标准的要求。它还提供欧盟和印度的数据驻留选项,以及针对敏感工作负荷的零保留模式。
API 可访问性和实现
开发者可通过 ElevenLabs API 访问 Scribe v2 Realtime,从而将这个强大的工具集成到各种应用中。该 API 允许自然、近似人类的代理无缝部署,能够在实时环境中提供实时理解和响应能力。这项功能对开发用于客户支持、销售或产品内体验的语音助手特别有益。
扩展使用案例
凭借在 30 种常用的欧洲和亚洲语言中高达 93.5% 的准确率,Scribe v2 Realtime 注定能改变企业和开发者处理实时转录的方式。该模型处理复杂语言场景的能力使其成为企业增强客户互动和运营效率的宝贵资产。
欲了解有关 Scribe v2 Realtime 的更多信息以及探索其功能,请访问 ElevenLabs 的官方网站。
Image source: Shutterstock