「ParaKeet-tdt-0.6b-v2 语音识别」demo 已上线至 HyperAI超神经官网的「教程」板块。 无论是在智能客服中实时理解用户意图,还是在会议记录、访谈整理、字幕生成等场景中识别多语速、多口音的音频,持续升级的使用需求对于语音识别技术提出更加苛刻的要求。
英伟达近日推出了一款先进的自动语音识别(ASR)模型 Parakeet TDT 0.6B,该模型已在 Hugging Face 平台全面开源。据相关技术报道,这款新模型在处理速度和转录质量方面表现出色。 Parakeet TDT 0.6B 最显著的特点是其极高的处理效率。该模型仅需 1 秒即可完成 60 分钟 ...
IT之家5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。 Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒 ...
英伟达推出的Parakeet-TDT-0.6B-V2模型在自动语音识别领域取得了显著进展。 该模型结合开源理念与商业应用,提升了转录效率,能够在一秒内完成60分钟音频的转录,且其词错误率接近市场领先水平。 通过支持多种开发环境及优化多款GPU硬件,该模型为开发者提供 ...
Nvidia又一次刷新了开源AI模型的天花板! 这款模型到底强在哪里? 居然能在1秒内完成60分钟音频的转录! 600M参数,不仅超高效,Nvidia还以CC-BY-4.0许可协议开源,意味着开发者可以完全免费将其用于商业用途。 Parakeet采用的是最新的FastConformer-TDT架构。 这种架构 ...
据站长之家 1 月 8 日报道,开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。 英伟达宣布推出了四个 Parakeet 模型,这些模型基于 RNN Transducer/Connectionist Temporal ...