
华为云实时语音识别
华为云实时语音识别用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。
阿里云计算有限公司
通义听悟是阿里云推出的一款基于大模型的工作学习AI助手,主要聚焦于音视频内容的处理。它融合了十多项AI功能,包括实时语音转写、文件转写、实时翻译和快速标记内容等,旨在全面提升知识从音视频向文字形态转化的效率。
具体来说,通义听悟具有高准确度生成会议记录的能力,能区分不同发言人,同时还能一秒给音视频划分章节并形成摘要、总结全文等。还能对10人以上说话场景进行角色区分。接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。