首页
云计算产品
AI人工智能
企业应用
解决方案
服务支持
合作共赢
关于我们
最新活动
|
备案
|
注册有礼
网站服务
域名注册
云解析DNS
云虚拟主机
智能建站
商标服务
短信服务
计算与网络
云服务器BCC
专属服务器
物理服务器
GPU服务器
大数据服务器
容器实例BCI
商务安全主机
专有云ABC
弹性公网
负载均衡
私有网络
专线ET
VPN网关
流量管理
存储和CDN与DB
对象存储BOS
云磁盘CDS
文件存储CFS
CDN加速
存储网关
云数据库RDS
缓存服务Redis
数据传输服务h3S
时序数据库TSDB
安全与管理
SSL证书
应用防火墙WAF
安全检测服务
主机安全
流量审计分析
数据库审计
云监控BCM
云堡垒机
应急响应服务
智能多媒体服务
音视频直播LSS
音视频点播VOD
音视频转码MCT
移动直播SDK
短视频SDK
3D肢体关键点SDK
美颜滤镜SDK
智能大数据
日志服务BLS
Elasticsearch
MapReduce
消息服务
数据仓库
数据可视化
统计分析云
文字识别OCR
通用场景文字识别
卡证文字识别
财务票据文字识别
医疗票据文字识别
汽车场景文字识别
教育场景文字识别
其他场景文字识别
iOCR自定义模块识别
人脸识别
人脸识别云服务
人脸识别私有化部署
人脸离线识别SDK
人脸实名认证
人像特效
人体和活体分析
3D肢体关键点SDK
美颜滤镜SDK
明镜实名认证解决方案
语音技术
语音识别
语音合成
AI 同传
图像识别
图像识别
图像审核
图像搜索
图像增强
图像特效
车辆分析
自然语言处理
语言处理基础技术
语言处理应用技术
文本审核
机器翻译
智能文档分析
智能对话UNIT
智慧解决方案
数据采集与标注
人脸通行/考勤平台
内容审核方案
消费者评论分析
智能招聘
知识中台
人脸口罩检测与识别
工业质检
EasyMonitor视频监控
[AI智能建站]
[企业邮箱]
[企业网盘]
[微信小程序]
[发票验真]
[短网址服务]
[问卷调查]
[文档服务]
[百云建站]
[号码隐私服务]
[统计分析]
[内容审核]
[BD一站通]
[建站通DIY]
[百推BaiSEO]
[APP消息推送]
传统IT解决方案
抗攻击方案
运维增值服务
IT外包服务
网站建设方案
Web定制开发
渠道推广反作弊
云上服务解决方案
百度IPV6解决方案
存储分发解决方案
备份归档解决方案
业务迁移解决方案
云上安全解决方案
云原生解决方案
智能运维管理平台
裸金属物理服务器
智能数据解决方案
日志分析解决方案
报销一站式解决方案
智能工作解决方案
明镜实名认证解决方案
人脸识别闸机解决方案
AI产品私有化解决方案
智能客服解决方案
SDP远程办公解决方案
音视频创意新方案
视频创作分发平台
音视频点播平台
智能媒体解决方案
VR编辑管理系统
智能互联网视频
云顾问优化方案
智慧领域解决方案
智慧城市
文娱传媒
智慧医疗
智慧金融
智慧教育
智能制造
智慧能源
智慧案例
产品文档
文档中心
云产品价格
AI接口价格
计费方式
开发者
SDK下载(云版)
SDK下载(AI版)
API文档
快速入门
视频教程
视频中心
服务支持
客户服务
支持计划
备案指引
自助服务
技术工单
新老客户转介绍返佣金
寻求解决方案合作伙伴
公司介绍
了解智能云
新闻动态
联系我们
产品和服务>>>语音识别
短语音识别标准版
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景
立即咨询
功能介绍
技术领先识别准确
采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98%
多语种和多方言识别
支持普通话和略带口音的中文识别;支持粤语、四川话方言识别;支持英文识别
深度语义解析
支持50多个领域的语义理解,如:天气,交通,娱乐等。还可接入智能对话定制与服务平台UNIT自定义语义理解和对话服务,让您更准确地理解用户意图
中文标点智能断句
使用大规模数据集训练语言模型,根据语音的内容理解和停顿智能匹配合适的标点符号(包括,。!?),使识别结果的表现方式贴合表述,更加可懂
数字格式智能转换
根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然
支持自助训练专属模型
支持在语音自训练平台上自助训练模型,上传词汇文本即可零代码完成训练,精准提升业务领域词汇识别率5-25%,并可专属使用
应用场景
语音输入
语音搜索
语音指令
社交聊天
游戏娱乐
语音输入
摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅
合作案例
特色优势
技术世界领先
采用领先国际的流式端到端语音语言一体化建模方法,近场中文普通话识别准确率达98%
服务稳定高效
企业级稳定服务保障,专有集群承载大流量并发高效灵活,以及99.9%服务稳定性保障
模型自助优化
中文输入法模型可在语音自训练平台上零代码自助训练,上传文本语料即可有效提升业务词汇的识别准确率5-25%
产品定价
次数包预付费
适用于调用量可预估的企业
免费调用量
200万次/企业账号
有效期
1年
并发量
50(支持扩容)
技术支持
7*24小时
100万次
2400
元
调用量后付费
适用于不便预估调用量的企业
免费调用量
200万次/企业账号
并发量
50(支持扩容)
技术支持
7*24小时响应
调用量≤600万次
0.0034
元/次
模型训练优化
适用于专业领域名词识别不准,需要对语音识别语言模型进行规模训练的客户
上传文本、词汇即可训练
专业评估,精准提升
模型自动上线专属使用
按设备授权购买
适用于语音遥控器、语音鼠标等近场硬件终端,支持在线短语音识别Android SDK按设备授权方式购买
按设备数
每台终端使用一个单独授权序列号激活
按产品线
一个授权序列号安装在多台终端设备使用
支持交流
新手指南
找到适合您业务的AI技术能力,快速创建应用,开始便捷的开发之旅
技术文档
开放百度语音识别技术开发文档,帮助使用API或SDK的开发者赋能产品
技术社区
在百度AI 开发者社区了解 AI 技术的最新动态,与开发者们一起学习和交流 AI 技术
即可获得语音AI能力
注册即可领取产品免费体验套餐
立即咨询
相关推荐
语音自训练平台
使用业务场景语料,零代码自助训练语音识别语言模型,精准识别语音内容,有效提升业务领域识别准确率
呼叫中心语音解决方案
呼叫中心场景的端到端的语音技术解决方案,包括呼叫中心场景专属的8K采样率语音识别、语音合成、MRCP服务,助力企业更高效快速的接入呼叫中心语音能力
在线语音合成
基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性