AI

要创造一个虚拟俄语主播,拢共分几步?

也许,不需要到2049年,电影中的想象就能真切地成为现实了

2017年秋天,《银翼杀手2049》上映,相信许多人都记得,电影中的男主角K拥有一个虚拟形态的女友,她由投影产生,看上去却与真人无异,能做饭,能点烟,还能与K交流谈心。当时,不少人发出疑问,2049年的科技水平真能实现这一点吗?

事实上,不必等2049年,就在此时此刻,技术发展已经让我们无比接近电影中的想象了。

今年6月,在第23届圣彼得堡国际经济论坛上,出现了一位虚拟的俄语主播。和真人主播一样,她说着一口流利的俄语,能够声情并茂地播报新闻,如果不加以提醒,不会有人发现她其实是一个虚拟的形象,而这正是由中国新华社、俄罗斯塔斯社和中国搜狗公司联合推出的全球首个俄语AI合成主播,名叫Lisa。

虚拟主播Lisa的真人原型,是俄罗斯塔斯社的国际关系部专家伊丽莎白·泽莲斯卡娅,即便是伊丽莎白本人站在Lisa旁边,你也会发现,她们的面貌相似程度非常高,而且由于Lisa充分学习了伊丽莎白的说话方式,Lisa在播报起新闻来,也是字正腔圆的“伊丽莎白腔”。而Lisa比伊丽莎白厉害的地方是,她不会疲惫,无需休息,更不会出错,只要把新闻的文字给她,她就能24小时无休地播报新闻了。

相信所有人都能想象,虚拟主播已经来了,虚拟女友也不会太远了。从技术上来看,搜狗研发的虚拟主播已初步达到电影中AI人工智能机器人的标准,即可以实现简单的逻辑思考,又可以运用不同的表情和动作对文字内容做出阐释——今天我们则要向大家揭秘,看看要创造一个充满未来感的俄语虚拟主播,拢共分几步。

第一步:研发一个AI分身技术

关注搜狗在人工智能领域研发动向的专业人士会发现,搜狗虚拟主播技术并不是一条单独的研发线,而是以搜狗AI分身技术为基础,延展出的众多研究领域中的一个。搜狗AI分身技术可以利用少量目标说话人的音视频数据,完成目标说话人AI分身的定制。换句话说,除了定制俄语主播之外,搜狗AI分身,可以在未来定制任何人。

搜狗AI分身技术总体来说,是由两大引擎组成,分别是语音合成和图像生成。语音合成引擎负责将输入的文本转换为对应的语音,图像生成则负责生成AI分身的视觉形象。通过这两大引擎,虚拟主播拥有了基本的形体和语言系统。划重点,电影中K所拥有的“虚拟女友”,也离不开这两项基础技术。

(友情提示:前方高能,技术小白可跳过

违法和不良信息举报电话:010-64158500-8113,18610056652    举报邮箱:infoweb@zero2ipo.com.cn    举报网上不良信息