咨询热线 4001616691
联系我们 中国大陆 CNY

新闻中心

NVIDIA Nemotron Speech 助力临床语音识别:Agent Skills 加速医疗 ASR 评估 NEWS DETAIL

当前位置:首页 > 新闻中心
资讯分类 · 新闻中心 发布时间 · 2026-06-23

训练语音 AI 模型准确识别临床术语异常困难——药物名称和解剖学术语并非日常词汇,现成的语音系统即使听起来流畅,也可能漏掉临床工作流中最重要的词汇。

NVIDIA 发布的临床 ASR 工作流,利用合成数据生成、Agent Skills 和 Nemotron Speech 技术,帮助开发者快速建立领域基准。合成音频不含受保护的健康信息,因此团队可对其进行版本管理、共享和自动化测试,而无需经过耗时的标注流程或 IRB 审批。

该工作流通过 NVIDIA NeMo Data Designer 和 Nemotron Speech 提供数据生成和语音服务,Agent Skills 引导整个流程。开发者可定义一个可重复的临床语音评估循环:定义目标临床特征、创建基准、评估发音风险、测量 ASR 行为、改进模型,并决定下一轮应扩展术语范围、改进发音还是增加噪声。