上海Google推广:谷歌推出AVA数据库 视频中的人类行为可被机器识别

+ 首页 > 谷歌学院 > 谷歌新闻动态 > 谷歌推出AVA数据库 视频中的人类行为可被机器识别

谷歌推出AVA数据库 视频中的人类行为可被机器识别

文章来源:http://google.trueland.net/发布日期:2017-10-24浏览:

  对于科技公司来说计算机视觉无疑是一大福音,不仅能加速机器的运转,还能完成很多目前只能由人类完成的任务。多家科技公司都纷纷在自家产品中使用了该技术,比如eBay添加了新的搜索功能,用户可以利用照片寻找类似的商品,Shutterstock也推出了测试功能帮助用户搜索股票照片,而近日谷歌照片应用也推出了新的宠物图像识别功能。谷歌推广小编带大家了解一下。

宠物图像

  目前计算机视觉领域的发展越来越激动人心,科技公司对人工智能领域的投资也逐渐突显出成效。大多数计算机视觉技术的进步都体现在静态图像领域,从视频内容中我们也能看到计算机视觉技术的成果,具体比如俄罗斯方面就在实时监控网络中应用了面部识别技术。还有现在备受关注的无人驾驶汽车行业,它在很大程度上也依赖机器对现实世界行为理解的能力。

  如此背景下谷歌推出了一个新的名为“AVA”的视频数据库,旨在推动计算机视觉识别影像中行为的研究。“AVA”是英文单词“原子视觉行为”的缩写,它是一个由多标签组成的数据库,用户可以在视频序列中进行操作。视频中动作识别的困难主要在于视频中各种复杂的场景交织在一起,多个动作也在同一时间由不同的人发出。

  谷歌软件工程师顾春晖和大卫罗斯在一篇博客文章中解释道:“教会机器去识别影像中的人类行为是发展计算机视觉的一大基本难题,但是对于个人视频搜索和发现、体育分析和手势界面等应用至关重要。”“尽管过去几年在图像分类和寻找物体方面取得了激动人心的突破,但识别人类行为仍然是一个巨大的挑战。”

  从本质上来说,AVA数据库是一批被80个原子动作标注的YouTube网址,并且延伸到了大约5.8万个视频内容中,因此涉及到很多日常动作,具体比如握手、踢腿、拥抱、接吻、散步等。

  利用对外开发数据库的操作,谷歌希望能够改进机器的“社交视觉智能”,帮助他们理解人类在做什么,并预测他们下一步会做什么。此外谷歌还表示:“我们希望,AVA的发布将有助于改进人类行为识别系统的开发,并有机会基于时空间隔标签对复杂的活动进行建模。”