Parakeet Brooder - 搜索 News

英伟达开源语音识别模型，ParaKeet-tdt-0.6b-v2仅需1秒可转录1小时音频 ...

「ParaKeet-tdt-0.6b-v2 语音识别」demo 已上线至 HyperAI超神经官网的「教程」板块。无论是在智能客服中实时理解用户意图，还是在会议记录、访谈整理、字幕生成等场景中识别多语速、多口音的音频，持续升级的使用需求对于语音识别技术提出更加苛刻的要求。

新浪网

英伟达开源高效ASR模型Parakeet

英伟达近日推出了一款先进的自动语音识别（ASR）模型 Parakeet TDT 0.6B，该模型已在 Hugging Face 平台全面开源。据相关技术报道，这款新模型在处理速度和转录质量方面表现出色。 Parakeet TDT 0.6B 最显著的特点是其极高的处理效率。该模型仅需 1 秒即可完成 60 分钟 ...

IT之家

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王：1 秒 AI 转录 60 分钟音频 ...

IT之家5 月 7 日消息，科技媒体 marktechpost 昨日（5 月 6 日）发布博文，报道称英伟达最新推出 Parakeet TDT 0.6B，是一款先进的自动语音识别（ASR）模型，已在 Hugging Face 平台上完全开源。 Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒 ...

中文科技资讯

英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2，语音转录能力再 ...

英伟达推出的Parakeet-TDT-0.6B-V2模型在自动语音识别领域取得了显著进展。该模型结合开源理念与商业应用，提升了转录效率，能够在一秒内完成60分钟音频的转录，且其词错误率接近市场领先水平。通过支持多种开发环境及优化多款GPU硬件，该模型为开发者提供 ...

搜狐

1秒转录1小时音频，英伟达重磅开源语音识别最强模型Parakeet！

Nvidia又一次刷新了开源AI模型的天花板！这款模型到底强在哪里？居然能在1秒内完成60分钟音频的转录！ 600M参数，不仅超高效，Nvidia还以CC-BY-4.0许可协议开源，意味着开发者可以完全免费将其用于商业用途。 Parakeet采用的是最新的FastConformer-TDT架构。这种架构 ...

腾讯网

英伟达推出 AI 语音识别模型 Parakeet，号称优于 Whisper

据站长之家 1 月 8 日报道，开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。英伟达宣布推出了四个 Parakeet 模型，这些模型基于 RNN Transducer/Connectionist Temporal ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果