谷歌黑科技可识别照片拍摄地

作者: 赞美教师诗歌 发布时间:2016-02-27 阅读次数: 293


   2月27日,对于许多人而言,单单从一张平淡无奇的照片中辨认出照片的拍摄地点并不是一件容易的事,尤其是对于那些照片中没有出现诸如埃菲尔铁塔或者尼瓜拉大瀑布这些地标性建筑的图片来说,而在室内拍摄的宠物、食物图片则更是如此。不过,谷歌最新开发的深度学习程序PlaNet则可以帮助我们仅仅通过照片内容判断出拍摄地点。,   据悉,这个名为PlaNet的深度学习程序是由谷歌计算机视觉处理专家托拜斯-韦扬德(Tobias Weyand)及其团队主导开发的。这一程序通过对图片进行像素级分析的基础上,与图片库中的存储数据进行像素比对以实现二者之间的最佳匹配,并为用户提供图片拍摄地点的最好解读。
  更令人惊讶的是,PlaNet可以运用深度学习技术在图中没有特定地标的情况下判断照片的地理位置,即便照片上只出现了家庭宠物或者食物这些根本没有任何地理位置线索的内容也不例外。
  据悉,谷歌PlaNet程序的开发过程非常简单明了。开发团队工程师首先挑选了全世界人口密集或者摄影师常去的地区,在排除了人迹罕至的荒郊野岭和海洋后将这些区域划分成26000个大小不一的方块。因此大城市通常就占据了很大一块方格区域,而诸如南北极以及海洋这些很少有人拍照的区域则并没有纳入PlaNet开发团队的收录范围。
  接着,开发团队建立了一个包含位置信息图片的庞大数据库,这一数据库拥有超过1.26亿张包含GPS信息的图片,并将它们投入到机器学习算法之中让PlaNet学习不同地方的图片有哪些特征。而且,每一张图都会对应一个区域方块。换言之就是,PlaNet开发团队希望通过这一不断学习、练习的方法让程序逐渐具备识别图片有可能所在地点的能力。
  韦扬德透露,PlaNet在开发过程中总共收集了互联网上超过9100万张带有地理信息标记的图片,并让其用剩下的3400多万张图片进行验证测试。最后,开发团队还从Flickr上采集了230万张标有地理信息的图片,在去除地理信息数据后把这些图片上传至PlaNet进行判断。测试结果显示,PlaNet在街道一级上判断的准确率为3.6%,在城市级别上的准确率为10.1%,在郡县一级的准确率为28.4%,在全球各大洲级别上的准确率为48.0%。
  为了更好的说明PlaNet的强大,韦扬德还特地为PlaNet举行了一场小小的测试。开发团队招来了10名具有丰富旅游经验的人,并为他们随机抽取了数张来自谷歌街景的图片让他们和PlaNet一起判断图片所在位置。最后,PlaNet在总共50场游戏中赢得了28场,识别错误的次数只有人类玩家的一半。而且,PlaNet给出的图片平均位置偏差距离为1131.7公里,远远低于人类玩家2320.75公里的平均偏差距离。
  “这个小规模的游戏证明了PlaNet可以在识别街景图片地理位置时达到超人般的表现。”韦扬德说道。
  值得一提的是,PlaNet在识别过程中并没有主要参考诸如建筑风格、植被种类等这些人类通常用于辨别图片拍摄位置的信息。对此,韦扬德是这么解释的:“我们认为PlaNet相比起人类肉眼更为优秀是因为它‘去过’许许多多的地方,并注意到了许多即便是旅行达人也很难注意到的细节信息。”
  在识别诸如室内图片方面,PlaNet也并不是完全没有可能做到,因此该程序完全可以通过识别整组图片的拍摄位置进行大致判断。更为重要的是,整个PlaNet深度学习模型的大小仅为377MB,这相比许多其他深度学习模型的容量有着极大瘦身。
  “我们的模型大小仅为377MB,它甚至可以被轻易安装在智能手机上。”韦扬德最后说道。(汤姆)
  
版权声明 :除非注明,本站文章为互联网聚合,如有问题请及时联系!谢谢。
0 个评论

要回复文章请先登录注册