首页 >> 产业 >> 产业 >> 正文
科大讯飞周舟:智能新通信,让世界沟通无障碍
  • 工联网
  • 2022年1月12日 21:38

工联网消息(IItime) “沟通障碍不只存在于听障人士,不同方言、语种之间的沟通往往也存在困难。如今我们所说的沟通无障碍是更为广义的概念,面向的是全量人群,智能新通信要让世界沟通无障碍。”科大讯飞运营商事业部副总裁周舟在“无障碍智能通信合作伙伴启动大会”期间接受通信世界全媒体记者采访时谈道。

大会现场科大讯飞周舟发布无障碍智能通信产品

科大讯飞让更多的听障人士享受到平等、自由和爱

第二次全国残疾人抽样调查显示,我国目前约有2780万听障人士。世界卫生组织发布的数据显示,全世界约有3.6亿人听力具有不同程度的损失。听障人群在生活中往往面临这样的困境:声音细节丢失,听到的人声和音乐声,淹没在嘈杂的噪音里。而这一切,往往不能被健康人群所理解,甚至因此引发许多不必要的矛盾。

随着全球数字化程度的不断提高,人们的交流越来越依赖手机、网络。当对方语速快、环境有噪音的时候,听障人士更难听清,即便是植入昂贵的人工耳蜗,也无法完全解决这一问题。因此他们在打电话时,往往需要旁人代接、转述。

在数字浪潮席卷的当下,5G、AI等新技术能为他们做些什么?

其实,新技术加持下,我国信息无障碍建设步伐不断加快!我国制定了关于信息无障碍的国家技术标准,推动政务和公共服务网站的信息无障碍建设;加强了信息无障碍标准体系建设,发布多个国家及行业标准,为残疾人便利使用信息通信设备、获取互联网信息、操纵辅助装置等提供有效标准支撑。就在2021年11月,中国残联等13部门联合印发的《无障碍环境建设“十四五”实施方案》提出,应“大力发展信息无障碍建设”,并“支持研发生产科技水平高、性价比优的信息无障碍终端产品”。

作为首批国家新一代智能语音开放创新平台的承建方,科大讯飞一直致力于用智能语音技术关爱听障人士。“回望科大讯飞创业22年,一直致力于让机器能听会说,能理解会思考。人工智能发展史上有众多的里程碑都是由科大讯飞推动的。那么我们能否通过人工智能技术帮助听障人士‘能听会说’?帮助他们更快的听到、更好的沟通,融入社会的能力更强,最终实现更加和谐的美好社会。”周舟谈道。

据悉,科大讯飞与听障人士及其家庭进行深入沟通,从每一个真实的需求出发,进行“沉浸式”研发。截止到2021年12月,科大讯飞累计为听障人士提供4744万分钟的免费转写服务。“科技是冰冷的,但为科技注入了人性的温度,它带来的力量巨大的。它让更多的听障人士能够享受到平等、自由和爱。”周舟感慨道。

在周舟看来,“平等”是指声音是一个人独一无二的生命印记,每一个人的声音都不能被忽略,能让外界听到自己的声音,这是每一位听障人士热切的渴望。科大讯飞的声音复原技术,让每一个声音都能被“听见”。

据介绍,科大讯飞通过海量语音迁移学习和音色空间解耦,只需录制1分钟甚至1句话就能采集声音特征,生成“他”的专属声音,让他们拥有跟自己音色类似的发音人。无论是接打电话、参加会议,还是为家人读书、读文章,都可以用自己的“原声”去表达。该项功能也属讯飞首创,是首次将业界领先的声音复刻技术创造性的应用于听障人士声音修复领域。

“自由”是希望以AI之能帮助听障人士实现自由发声。听障人士在通过文字转语音的通话过程中,难免出现打字回复较慢,影响正常通话的情景。科大讯飞引入了3种技术——话术智能推荐、输入智能联想、行为智能记忆,可以为他们自动推荐回复语,自动补齐输入内容,并且自主学习回复习惯,甚至智能提示疑似诈骗电话。这样,可以最大限度地缩短响应时间,让通话得以安全、顺利的进行。据悉,早在2016年,讯飞就首创“代接电话”的智能应答产品并持续深耕;2019年正式上线后,累计服务用户超过3000万,成为重度通信用户的必备。

“爱”:科大讯飞应用拍照识图、取字朗读的AI功能,为听障家庭提供正常交流的机会。周舟强调:“科大讯飞希望通过科技、产品改变听障人士的沟通方式,帮助每一位听障人士将声音传向全世界。”

“爱听助理”2月1日上线,打造“无声”世界的有声连接

依托自身的智能语音技术能力和通信领域的经验积累,科大讯飞已研发出多款无障碍智能通信产品。其中,无障碍智能助理软件“爱听助理”将于2月1日正式上线,支持通话时文字语音实时转化、帮接帮打、智能代接等服务,让更多的听障人士能够享受到平等、自由和爱。

此外,科大讯飞推出的无障碍智能视频通话平台让听力重度受损人士也能与健听人无障碍交流。科大讯飞通过多模态识别技术,对手语和唇语进行识别,结合声音复原、智能降噪等技术,基于运营商的5G视频通话能力,为包括听障人士在内的全量人群提供创新的视频通话体验。沟通过程中,听障人士的手语可识别为文字,并朗读给健听人;健听人的语音则可实时翻译为文字,从而实现“手语听得懂、语音看得见”。

“其实沟通障碍不只存在于听障人士,不同方言之间的沟通往往也存在困难。”周舟表示,“目前科大讯飞支持识别28种方言、7大民族语言,包括维语、藏语。随着全球数字经济的发展,跨语种的沟通也在全面转向线上。在5G视频通话场景下,科大讯飞可以支持80多个语种的实时互转互译。期待在不远的将来,不管是哪一种语言,我们都能无障碍的沟通和交流。”

助力打造首届沟通无障碍奥运会

2022年北京冬奥会、冬残奥会即将召开,值得一提的是,科大讯飞是其官方自动语音转换与翻译独家供应商。“我们正在致力于将这次赛事打造成史上首届沟通无障碍的奥运会,实现残障人士与健全人之间的沟通无障碍,实现不同方言之间的沟通无障碍,实现不同语种之间的沟通无障碍。”周舟谈道。

据介绍,科大讯飞将为北京冬奥会提供技术支持,通过语音识别、语音合成、机器翻译等产品和服务,创造良好沟通环境、减少重复性劳动、提高赛会保障服务效率,在冬奥会赛场内外实现人与人、人与机器之间语音和语言交互无障碍。

据周舟介绍,科大讯飞在冬奥场馆、赛区等已经布置到位,在场馆、赛事方面主要有四方面助力。一是实现多语种翻译功能。二是提供技术保障,助力残疾人群无障碍沟通。三是讯飞打造的元宇宙虚拟形象将在科技展馆、奥运赛事导播、咨询、展馆录影等运用。四是虚拟主播可支持24小时不间断播报,助力全球不同时差的转播、传播。

“科大讯飞希望借助冬奥会、冬残奥会这个更大的国际舞台,吸取更多经验,加快产品迭代。”周舟最后说道。“我们所做的产品,对于信息无障碍的伟大事业,只是刚刚开始。无障碍通信事业,任重而道远。希望能够携手运营商以及更多的生态合作伙伴,以科技创新之力,科技向善之心,赋能无障碍通信建设,帮助所有人更加平等的融入社会,享受5G时代的生活便利。”

编 辑:刘艳玲
分享到: