您的位置:首页 >通信 >

微软引入AI来改善印地语,孟加拉语,泰米尔语的实时翻译

时间:2023-02-20 11:35:01 来源:

在印度庆祝第69个共和国日之际,微软周四宣布将引入人工智能 (AI) 和深度神经网络,以改善印地语,孟加拉语和泰米尔语的实时语言翻译。使用深度神经网络支持的语言翻译,结果更准确,声音更自然。

“微软在印度庆祝语言的普及,并希望使庞大的互联网更加易于访问。微软印度人工智能和研究总经理Sundar Srinivasan表示: “二十多年来,我们一直支持印度语言在计算领域,最近,在基于语音的访问和跨语言的机器翻译方面取得了重大进展。”

斯里尼瓦桑补充说: “今天的发布证明了我们寻求将尖端的机器学习 (ML) 技术引入印度每个人的信息获取民主化。”用户可以利用深度神经网络的优势-增强的印度语言翻译,同时在Microsoft Edge浏览器,Bing search,Bing Translator网站以及Microsoft Office 365产品 (如Word,Excel,powerpoint,Outlook和Skype) 上浏览Internet。

Android和iOS中的Microsoft Translator应用程序可以从文本,语音甚至照片中识别和翻译语言。自21世纪00年代初以来,微软一直在开创传统的统计机器翻译 (SMT) 范式,以翻译全球和印度语言。将深度神经网络整合到翻译复杂的印度语言中,旨在为翻译带来更高的准确性和流利性。

虽然SMT仅限于在一些周围单词的本地上下文中翻译一个单词,但深度神经网络的操作方式有所不同,因为它具有编码更细粒度的概念的能力,例如性别 (女性,男性,中性),礼貌水平 (语,休闲,书面,正式),和单词类型 (动词、名词、形容词)。

为了进行准确的翻译,该系统需要在每个语言对中以所有排列和组合使用数百万个平行句子。“然而,由达罗毗荼语和雅利安语组成的印度语言很复杂。在为印度翻译语言时,复杂性增加了,印度有29个不同的州有22种官方语言,“微软在一份声明中说。

增加挑战的是缺乏印度语言的数字内容,可以从互联网上提取这些内容来训练神经网络。“按人口计算,六种印度语言是全球20大语言的一部分。具有讽刺意味的是,这些语言不在数字内容列表的首位。互联网上没有足够的材料可以用来训练这个系统,“克里希纳·多斯·莫汉 (Krishna Doss Mohan) 解释说,他是微软印度高级项目经理,也是印度语言团队的一员。

尽管存在障碍,但基于深度神经网络的翻译系统在自动和人工评估指标方面都显示出显着改善。该公司表示: “更具体地说,我们目睹了微软目前支持的所有印度语言的翻译质量至少提高了20%。”为了打破语言障碍,微软20年前开始与印度语言合作,并启动了 “Bhasha项目” 1998年,以加速印度语言的计算。

“从那时起,我们已经走了很长一段路 -- 支持我们产品中所有22种宪法认可的印度语言的文本输入,以及12种语言的视窗界面支持,” 该公司表示,为印度语言提供计算工具的bhashamindia.com迄今已收到4000万次点击。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。