知识图谱平台
基于自然语言处理和知识图谱技术的全生命周期知识管理平台。帮助企业把多源异构数据转化为知识,打造行业智能大脑,助力企业智能化转型
兽牙智能体平台
以“行业大模型+场景化智能体”为核心,深度融合多源数据与业务逻辑,构建企业全链路AI数智化基座。平台基于自主可控的行业大模型技术,首创轻量化智能体编排框架,支持外挂知识库、MCP服务、多模态API及数据库的动态调用与协同,实现跨系统数据融合与业务敏捷响应。平台依托行业大模型,创新推出三类智能体。自主规划型智能体可自主灵活调用多渠道多维度数据,实现高效决策。知识问答型智能体凭借精准的问题理解与解析能
云听-智慧办公
为各类会议和访谈场景,提供自动生成会议记录、 编辑、管理等功能,提升用户在办公场景下的效率
云贝-智慧营销
企业级一站式智慧营销服务,配套“智慧工牌”, “智能话机”等一系列软硬件产品,助力企业营销数字化转型
智音-智慧运维
助力企业级数字化转型,基于云知声核心算法的工作流平台和智能设备,可实现风险预警、 行为考核,全面覆盖各行各业工单、运维、巡检等实时远程可视化监管需求
蓝藻AI配音创作平台
基于云知声自研智能语音技术和自研大模型技术,为用户提供AI声音克隆、AI文字配音、AI文案创作服务。可在线轻松训练专属于用户的语音模型,并通过配音工具输入文字即可生成与原音高度相似的合成音频。支持提示词文案生成以及导入文案内容辅助创作。

合作咨询

合作咨询
请完善以下信息,云知声期待与您的合作!
我们如何联系您
公司名称:
您的姓名:
手机号:
邮箱:
选择咨询的内容

首页

云知学院

核心技术

平台服务

PaaS

AI开放平台

AI芯片应用开发平台

智算平台

SaaS

知识图谱平台

兽牙智能体平台

云听-智慧办公

云贝-智慧营销

智音-智慧运维

蓝藻AI配音创作平台

智慧物联

智能家居

智慧酒店

智慧社区

智慧园区

智慧交通

智慧车载

智慧文旅

智慧医疗

语音电子病历系统

智能病历质控系统

单病种质控系统

智能医保审核系统

导医机器人

智能随访系统

保险核赔风控-智能医疗审核平台

智慧交通

Uni-GPT交通大模型服务应用

Uni-lCS智慧客服

Uni-AVS数字人

Uni-PIS乘客信息系统

智聆降噪麦克风阵列

山海

投资者关系

关于我们

了解云知声

联系我们

加入我们

使用场景具体描述
取消
提交
音频文件转写3.0创新升级,实力上线!-云知声AI开放平台
2022-08-03

无论是会议、访谈录音的整理,还是各种视频的字幕制作与语音质检,快速解决各类场景下的音频转文字的需求,都离不开音频文件转写服务。

音频文件转写服务,是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用,将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。

转写升级3.0.jpeg

云知声音频文件转写3.0  创新升级  实力上线!


近期,云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚,云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级,尤其声学模型方面,首次使用了基于注意力机制的端到端模型,在准确率方面有了明显提升;同时,在快速纠错和热词识别等方面也进行了功能优化与实时更新,进一步满足了各使用场景用户的需求,提升音频文件转写使用体验。

01

创新性SMAD 技术  准确率提升

 

最新的版本中,云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统(Attention-based Encoder Decoder),又创新性地提出了SMAD(Self-and-Mixed attention Decoder)技术,即在解码中,采用文本和声学的混合注意力机制,从而得到识别的最优结果。

 

无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音,都可以实现准确转写。在通用场景测试中,云知声WER相对下降10%以上,达到行业顶尖水平。这不仅能带给终端用户更好的体验;对开发者来说,也是一次效率以及质量的升级,大大满足开发者精益求精的诉求。

02

更简单更易用   开发者0成本接入先进语音识别技术

 

音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口,具备流式传输能力和轻量、跨平台的特点,方便开发者直接调用、快速集成。云知声作为国内头部的人工智能独角兽企业,以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。本次升级只是技术提升,并不改动接口,所以原来对接过云知声音频文件转写服务的开发者没有任何影响。此外, 我们为新接入的开发者准备了免费体验包,注册即可认领;实名认证的个人开发者和企业开发者,还可以获得一大份认证礼包。

 

PC端登陆”云知声AI开放平台”领取大礼包

 

新手3步集成


 转写三步即成.jpg

作为新一代智能语音识别引擎,云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线,以优质的性能对外提供AI开放式服务,赋能更多对音频文件转写有需求的开发者与合作伙伴。

 

未来,团队会在继续打磨技术的基础上,赋能更多应用场景,加速语音识别技术的快速落地!

 


返回列表