在语音识别方面的一项重大突破中,微软的研究人员声称已经开发了第一种技术,可以像人类一样识别对话中的单词。微软人工智能和研究公司的一组研究人员和工程师创建了一个语音识别系统,该系统与专业转录学家相比产生相同或更少的错误。他们报告的单词错误率 (WER) 为5.9,低于团队上个月报告的6.3。5.9的错误率大约等于被要求转录相同对话的人的错误率,这是有史以来针对行业标准总机语音识别任务的最低记录。
“我们已经达到了人类的平等。这是一项历史性的成就,”该公司首席演讲科学家黄学东在一篇博客文章中说。
这一里程碑意味着,计算机第一次可以像人一样识别对话中的单词。这样一来,球队就实现了不到一年前设定的目标-也大大超出了其他所有人的期望。这项研究的里程碑是在对语音识别进行了数十年的研究之后进行的,该研究始于与负责技术突破的美国机构DARpA的20世纪70年代初。在过去的几十年中,大多数主要的技术公司和许多研究组织都参与了这项工作。
“这项成就是二十多年努力的结晶,” 管理演讲和对话研究小组的杰弗里·茨威格 (Geoffrey Zweig) 说。
这一里程碑将对消费者和商业产品产生广泛的影响,语音识别可以大大增强这些影响。其中包括Xbox等消费娱乐设备,可访问性工具 (例如即时语音到文本转录) 和个人数字助理 (例如Cortana)。
“这将使Cortana更加强大,使真正智能的助手成为可能,” Shum说。
研究里程碑并不意味着计算机可以完美地识别每个单词。实际上,人类也不会这样做。相反,这意味着错误率-或计算机听错诸如 “有” 表示 “是” 或 “一个” 表示 “该” 的单词的速率-与您听到相同对话的人所期望的相同。
Zweig将这一成就归功于在系统的各个方面系统地使用了最新的神经网络技术。推动研究人员超越顶部的是使用神经语言模型,在该模型中,单词表示为空间中的连续向量,而诸如 “快” 和 “快” 之类的单词紧密结合在一起。茨威格说: “这让模型从一个词到另一个词都能很好地概括。”
相关阅读
猜您喜欢
- 微信聊天记录查男朋友(怎么找到微信的其他聊天记录)
- 手机gps查定位(怎么查手机位置)
- 有没有办法可以查微信聊天记录(怎么查询微信的聊天记录)
- 怎样查三个月前的微信聊天记录(微信聊天记录去哪里查)
- 怎么把图片内存变小(手机怎么把jpg照片内存变小)
- 宾馆可以任意查开房记录吗(宾馆住宿查询个人信息)
- Facebook视频流在您的电视上?这是怎么可能的
- 买车贷款需要多久(买车贷款需要几天通过)
- 克利夫兰诊所启动临床人工智能中心
- 三星Chromebook Pro的上市揭示了一款售价499美元的高级Chrome操作系统敞篷车
- 每日支付宝小鸡答题:庄园小课堂今天答案5月10日庄园小课堂今天答案最新
- 顾家家居为什么这么贵(美克美家和顾家哪个档次高)
- 银河注7: 据报道,三星在内部测试了电池
- 苹果手机被偷如何查定位(如何定位已经丢失的手机)
- 室内设计培训哪个好(室内设计培训哪家比较好)
- 三星Chromebook Pro的上市揭示了一款售价499美元的高级Chrome操作系统敞篷车
图文推荐
热门文章
-
微软新语音识别系统达到人类平价
原创 2022-06-01 11:35:06 -
机器人飞行员有一天可能会驾驶客机和货机
手机 2022-06-01 11:35:05 -
时间线: 三星Galaxy Note 7危机如何展开
通信 2022-06-01 11:35:05 -
车充哪个好(车充电器多少安好)
数码 2022-06-01 11:05:06 -
微信只能查当天的聊天记录(微信聊天记录去哪里查)
评论 2022-06-01 11:05:04 -
脖子僵硬酸痛怎么办(整个脖子僵硬疼痛)
手机 2022-06-01 11:05:03