原标题:Google更新云端语音转文字服务听写电话的错误率减少54%
继上个月发表云端文字转语音(Cloud Text-to-Speech)服务之后,Google在周一(4/9)更新了云端语音转文字(Cloud Speech-to-Text)服务,提供全新的影片及电话转录模型,也新增了自动化标点符号功能。相较于原本的电话模型,新的强化版电话转录模型(enhanced phone_call model)让语音辨识的错误率减少了54%。
Google于2016年发表的Cloud Speech-to-Text原名为Cloud Speech API,可辨识包括中文在内的逾120种语言,本周则是该服务建立以来最大规模的改版,它提供了4种客製化模式,包括命令与搜寻(command_and_search)、电话(phone_call)、影片(video)与预设(default),其中,电话模型适用于基于8khz取样率记录的电话内容,而预设模型则多用在音质较好、时间较长、取样率高于16khz以上的音频,使用者可依照不同的使用情境选择适用的模型,以顺利将语音转换成文字。(来源:Google)
Google Cloud AI产品经理Dan Aharon表示,有许多云端供应商利用客户的请求来改善相关服务,但基于资料及隐私保护的立场,Google并不打算採用这样的作法,取而代之的是推出业界首创的「选择加入计画」( opt-in program),让客户主动提供资料供Google纪录与分析,而首个成品就是强化版电话转录模式,该计画成功地让Cloud Speech-to-Text的电话转录服务减少了54%的错误。
至于新的影片模式则可用来将影片中的语音转换成文字,或是转录同时有多人开讲的语音,该模式所使用的机器学习技术与YouTube自动化字幕背后的技术雷同,相较于原本的预设模式,影片模式的转录错误率也降低了64%。
不管是强化版的语音模式或影片模式现在都只支援英文,预计很快就会扩张至其它语言。
除了全新的语音及影片模式之外,新版的Cloud Speech-to-Text还準备在将语音转成文字之后,自动加入标点符号,以让文字更容易阅读,目前该模式仍属于测试阶段,可提供逗点、句号或问号等标点符号的建议。
除了影片模式每15秒的收费为0.012美元之外,其它模式的费用皆为每15秒0.006美元,为了推广全新的影片模式,截至今年5月31日可享用每15秒0.006美元的优惠价。
相关阅读
猜您喜欢
- 手机黑客查手机定位吗(手机位置怎么查踪迹)
- 老婆查手机位置吗(怎么查对方的手机位置)
- 微信查他人的聊天记录软件(怎样可以查看别人的微信聊天记录)
- 手机定位如何查(如何找手机定位)
- 十八公里长的南极冰块将破裂: 科学家
- 在线查开宾馆记录app(宾馆住宿查询个人信息)
- 捡到手机如何查定位(查询手机位置定位)
- 三星Galaxy S8设计曝光,首次涉嫌照片泄露
- 微信聊天记录怎么查地图(怎样可以查看别人的微信聊天记录)
- 微信查聊天记录图片视频教程(怎么可以查聊天记录)
- Sennheiser推出适用于Rs 6,490的高清200专业监控耳机
- 手机教程:长图拼接网页截屏骤分享介绍 长图拼接怎么进行网页长截图
- 手机APP教程篇:Keep怎么设置音乐
- CES 2017: 从技术到未来的汽车,该活动将推出新的产品
- 能不能用身份证查酒店入住记录(酒店住房记录查询)
- 华为手机查位置关定位(查询手机位置定位)
图文推荐
热门文章
-
Google更新云端语音转文字服务听写电话的错误率减少54%
通信 2022-06-25 14:04:25 -
美国联邦航空局周一授予SpaceX恢复火箭发射的许可证
数码 2022-06-25 13:35:07 -
亚马逊的Alexa进入Google的Android系统
评论 2022-06-25 13:35:06 -
NASA的哈勃为未来的银河跋涉创建了星际路线图
原创 2022-06-25 13:35:06 -
FBI在文档发布中删除了有关Apple iPhone黑客活动的详细信息
手机 2022-06-25 13:35:05 -
数字原生: 半机械人的梦想
通信 2022-06-25 13:35:05