利用 AI 合成假视频,川普竟能宣布「美国与加拿大合并」?
本篇文章1693字,读完约4分钟
你有没有想过人工智能真的可以用来伪造图片、音频甚至视频?今天引入的黑技术不仅可以在朋友间轻易被欺骗,还可以被别有用心的人用来诽谤和欺诈。
文本|田羽杨
编辑|富博
千万不要以为人工智能的应用场景只是无人驾驶、打败全人类最好的棋手、协助甚至领导医疗行业等等。
你有没有想过人工智能真的可以用来伪造图片、音频甚至视频?这种黑技术不仅可以在朋友间轻易被欺骗,还可以被别有用心的人用来诽谤和欺诈。
以ps为代表的米托工具让我们意识到了“欺骗”的存在,通过这种“嫁接”声音和嘴巴的技术,我们可以选择对一切都持怀疑态度。
人工智能在音频视觉领域的神奇黑技术来自美国华盛顿大学(位于美丽的西雅图,微软、fb和亚马逊的总部都在这里)。这个项目背后的赞助商名单上满是大牌——三星、谷歌、脸书和英特尔。其应用的技术原理不难理解。
科学家首先创造了一个大规模处理音频文件的工具,然后是整个过程中最关键的一步——创造真实的嘴形变化来对应音频内容,从而达到真正的效果。最后一步相对简单,只要这些伪造的嘴的变化是为其他视频中无辜的被欺骗的人安排的。
特定技术流程显示
结合uw图形和图像实验室开发的新的嘴形合成技术,项目团队成员最终可以将嘴形及其纹理移植到现有视频中的人脸上。
从这里,我们可以看到演讲者讲述他们从未想过的精彩场景。
例如,特朗普郑重宣布“美国和加拿大将从明年1月1日起合并为一个国家”,或者巴基斯坦总理纳瓦兹·谢里夫宣布整个巴基斯坦将纳入中华人民共和国的管辖范围。
在视频中,左边的图片被应用到声音源的原始视频,而右边的视频来自一个完全不同的演讲(因为视频包含奥巴马,上传到国内网站还没有被批准,所以大家都可以凑合着用)。
研究人员已经通过该算法成功地将左边的嘴形移植到右边的人身上。虽然效果并不完美(如果你仔细观察,你会发现奥巴马的嘴巴有点模糊,这是人工智能生成图像的常见问题),但这足以让不知道真相的人相信。
为什么研究人员选择奥巴马作为实验对象?他们给出的理由如下:由于前总统的出色曝光,高质量的语音视频数量巨大且容易获得,这使得训练神经网络的过程变得容易。
该项目的研究员ira kemelmacher教授通过电子邮件告诉《边缘》杂志,目前,如果他们想实现视频中显示的完美嘴部“移植”,他们需要一个完整的17小时视频作为机器分析和学习的数据。然而,将来技术成熟后,在这个过程中花费的时间将大大缩短。
当然,开发这项技术的团队希望扩展其应用场景,例如,改善使用skype等视频聊天软件的体验。
用户可以收集自己的语音图片,并将其用于软件的训练,以解决当前视频通话中声音信号传输良好但图片模糊的问题。如果一切顺利,理想的情况是用户可以完全关闭视频图像,软件会自动将语音转换成相应的图像,并发送给另一端的用户。当网络连接不好或用户想节省手机流量时,这将显示很大的力量。
当然,从诞生之日起,这项技术的伦理问题和社会影响将永远处于公众舆论的漩涡中。光是这项技术带来的破坏力就不容忽视。如果再加上黑技术,只要几分钟的音频就可以伪造任何人的声音,罪犯就可以制作假视频来制造混乱或进行欺诈活动。其他类似这一原理的技术包括改变他人的表情,用一些图片制作三维人脸模型,等等。
华盛顿大学的研究人员也意识到了这一点,他们只在训练中使用奥巴马的声音和视频,并试图与上面提到的灰色应用场景保持距离。
但原则上,只要我们能掌握技巧并熟练运用这种黑色技术组合,我们就能把任何人的声音移植到任何人的脸上,创造出各种意想不到的真实视频。
这项技术的具体细节将在今年8月2日举行的全球最具影响力的图像技术活动siggraph 2017上以论文的形式披露。
(部分信息源:边缘)
点击关键词查看过去两周的潮汐技术:
环保:“城市鸟街”、“快速植树”和“无电池手机”
天堂:“和霍金一起去空旅行”
消费:“科学剁手”
技术:“虚拟眼跟踪”“虚拟设备的超声波干扰”
教育:“虚拟现实体验药物滥用”
情感:“虚拟爱情装备”
智能生活:“蜘蛛侠电梯”、“环球魔戒”、“自动除臭衣架”和“汗水充电”
电影和电视:“裸眼3d阿凡达”
标题:利用 AI 合成假视频,川普竟能宣布「美国与加拿大合并」?
地址:http://www.qdpdly.cn/qdxw/10661.html
免责声明:青岛新闻网是一家综合的新闻资讯门户网站,部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,青岛新闻网将予以删除。