谷歌黑科技:能把照片变立体

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統

利用 DeepStereo 制作的视频片段
利用 DeepStereo 制作的视频片段

利用 DeepStereo 制作的视频片段
利用 DeepStereo 制作的视频片段

   北京时间 7 月 10 日下午消息,据美国科技博客 Gizmodo 报道,本周《麻省理工科技评论》(Technology Review)杂志发布的一篇论文披露了谷歌研发的新系统 DeepStereo,该系统可以通过人工智能技术将一系列照片无缝组合成为视频。

  论文作者名为约翰-弗林(John Flynn),是一名谷歌工程师,其他三位合着者也都在谷歌工作。在论文中,弗林阐述了谷歌研发 DeepStereo 系统的全过程。

  早在 DeepStereo 之前,就有类似利用静态图片输出动画的技术存在。美国计算机协会计算机图形专业组(SIGGRAPH)就曾通过网上图像制作过延时动画。

  但与其他静态图像生成动画技术相比,DeepStereo 系统最大的不同在于,它可以猜测出图像的缺失部分,在空白处创造出来源图片中没有的新图像。据英国媒体 Register 报道,和传统动画利用视觉暂停的原理不同,DeepSteoreo 可以想象出两幅静止图像之间的画面。

  弗林和他的合着者在论文中写道,这项技术与之前的产品截然不同,我们尝试采用新型深度架构直接合成新图像,不需要预先设置景深、焦距等训练数据。

  该系统背后的网络架构原理十分复杂,借鉴了各种先例。但作者在文中介绍了该技术的独到之处:系统在工作时会采用两套独立的网络架构。其中之一会根据已有的 2D 数据预测各个像素的景深。另外一个则会对色彩作出预测。两者共同以 2D 图像的形式完成对景深和色彩的预测,最终合成视频。

  DeepStereo 仍有不足之处:视频角落的画面很不清晰。算法没有涉及到的区域往往是模糊的,无法被覆盖,也无法使用像素填充,开发团队解释说。不过,这套系统暗藏了一个通过模糊的图源生成物体的小技巧:移动对象在训练数据中非常常见,我们的模型可以优雅地完成这个动作:开始出现的时候是模糊的,然后逐渐转换为运动模糊效果。

  虽然该系统生成的最终产品与通过图像简单合成的动画区别不大,但该技术能够为谷歌的街景技术锦上添花。同时也能为谷歌的人工智能技术提供一个更加实用的范例。

  本月,谷歌的梦想机器人在互联网上走红,这是该公司超级先进的人工神经网络,由谷歌的工程师团队开发而成。设计初衷是要找到一种切实可行的方法,让计算机辩认出图像中的内容。谷歌工程师正在教这些不可理喻的人工大脑辨识动物或架构,顺便也做做梦,此举令人感到震惊和恐惧。


Cnblogs 新浪科技 2015-08-23 08:57:40

[新一篇] 西祠老矣,尚能飯否?

[舊一篇] 資本的秘密
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表