合作咨询

合作咨询
请完善以下信息,云知声期待与您的合作!
我们如何联系您
公司名称:
您的姓名:
手机号:
邮箱:
选择咨询的内容

首页

核心技术

平台服务

PaaS

AI开放平台

AI芯片应用开发平台

SaaS

云智云AloT平台

知识图谱平台

超算平台

云听-智慧办公

云贝-智慧营销

智音-智慧运维

智慧物联

云智云AIoT平台

智能家居

智慧酒店

智慧社区

智慧园区

智慧交通

智慧文旅

智慧医疗

智慧医疗解决方案

语音电子病历系统

智能病历质控系统

单病种质控系统

智能医保审核系统

导医机器人

智能随访系统

开发者

关于我们

了解云知声

开发者资讯

新闻中心

联系我们

加入我们

使用场景具体描述
取消
提交
音频文件转写3.0创新升级,实力上线!-云知声AI开放平台
2022-08-03

无论是会议、访谈录音的整理,还是各种视频的字幕制作与语音质检,快速解决各类场景下的音频转文字的需求,都离不开音频文件转写服务。

音频文件转写服务,是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用,将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。

转写升级3.0.jpeg

云知声音频文件转写3.0  创新升级  实力上线!


近期,云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚,云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级,尤其声学模型方面,首次使用了基于注意力机制的端到端模型,在准确率方面有了明显提升;同时,在快速纠错和热词识别等方面也进行了功能优化与实时更新,进一步满足了各使用场景用户的需求,提升音频文件转写使用体验。

01

创新性SMAD 技术  准确率提升

 

最新的版本中,云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统(Attention-based Encoder Decoder),又创新性地提出了SMAD(Self-and-Mixed attention Decoder)技术,即在解码中,采用文本和声学的混合注意力机制,从而得到识别的最优结果。

 

无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音,都可以实现准确转写。在通用场景测试中,云知声WER相对下降10%以上,达到行业顶尖水平。这不仅能带给终端用户更好的体验;对开发者来说,也是一次效率以及质量的升级,大大满足开发者精益求精的诉求。

02

更简单更易用   开发者0成本接入先进语音识别技术

 

音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口,具备流式传输能力和轻量、跨平台的特点,方便开发者直接调用、快速集成。云知声作为国内头部的人工智能独角兽企业,以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。本次升级只是技术提升,并不改动接口,所以原来对接过云知声音频文件转写服务的开发者没有任何影响。此外, 我们为新接入的开发者准备了免费体验包,注册即可认领;实名认证的个人开发者和企业开发者,还可以获得一大份认证礼包。

 

PC端登陆”云知声AI开放平台”领取大礼包

 

新手3步集成


 转写三步即成.jpg

作为新一代智能语音识别引擎,云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线,以优质的性能对外提供AI开放式服务,赋能更多对音频文件转写有需求的开发者与合作伙伴。

 

未来,团队会在继续打磨技术的基础上,赋能更多应用场景,加速语音识别技术的快速落地!

 


返回列表