全球数百万人为语言障碍所扰,未来AI听懂你想说
Google投入各种AI应用,透过科技让世界更加无障碍,特别针对语言障碍者开发出AI语音识别。
人工智能(AI)能有各种不同的应用,其中如何改善人类的生活就是一个很重要的思考方向。
Google AI负责人杰夫?迪恩(Jeff Dean)举例,像是印度科技学院的学生,开发一款名为Air Recognizer的App,作为侦测空气污染的工具;只要用手机拍摄一张照片,AI模型就可以透过照片判断空气中的分子量,来告诉使用者此刻的空气污染状态为何、是否适合外出。
「这只是开源软件库TensorFlow应用的一个小案例,AI还有很多潜能,」迪恩这样说。在2018年第一届Google AI Impact Challenge竞赛的前20名得奖主中,也有许多开发者把应用主轴摆在无障碍应用方向上。
AI帮失聪者听见世界,70种语言听障人士受惠
听力受损的人们难以与世界沟通,Google AI产品经理Sagar Savla提出数据指出,「现今全球有超过4.66亿人耳聋或有听力障碍,占全球总人口的15%;而且预计听力障碍人士将会在2055年成长至9亿人口。」
「像是我的祖父母晚年失聪,我们沟通就很困难,我发现他们的生活渐渐与世界隔离,我想这是很常见的情况,」Savla这样分享,老年失聪在全世界非常常见,不仅造成生活不便,对于心情的影响也非常大。
为了帮助听力障碍人士了解其他人的口说语言,今年2月Google推出一款「即时转录」(Live Transcribe) 应用程序,目前有70种语言版本,透过将现实世界中的语音转录为屏幕文字,帮助聋人和听障人士与他人沟通。
Google建立特殊AI模型,让语言识别更加无碍
Google AI产品经理Julie Cattiau则说明,目前全球有数百万人被「语言障碍」所困扰,他们在发音上可能与一般人不同,造成这样语言障碍的原因,有中风、肌萎缩性脊髓侧索硬化症 (ALS)、帕金森氏症等神经系统疾病。但目前的AI语言识别模型,大多无法符合这些人的需求。
「对于障碍人士来说,因为他们发音上有很大的困难,因此他们不能使用Google Home等语音识别技术,」Cattiau表示,今年Google启动Project Euphonia计划,建立语言障碍者的语言识别AI模型。透过这个模型,可以让语言障碍者也可以使用声控设备;另外,也可以让机器将语言转为文字,让语言障碍者透过文字与更多人对话。同时,Google也针对手势、眨眼等其沟通方式建立电脑视觉模型,让语言障碍者能够更独立。
时间:2019-07-25 22:50 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论: