在新近发展的人工智能技术的帮助下,研究人员能够分析大量的图像、提取可以进行排序和挖掘的数据来预测一些事情,比如某个社区的收入水平、政治倾向、购物习惯等。
据了解,来自斯坦福大学的研究人员们完成了一个雄心勃勃的项目——通过分析谷歌街景(Google Street View)上收集到的数百万张照片,可以对社区投票模式作出准确的预测。这一迹象表明,计算机能够像文本分析一样流利地进行图像分析。
虽然其他学术项目早已开始使用人工智能挖掘谷歌街景来获取社会创见的见解,如街道变化,但是此项目值得注意是因为在整个过程中,AI软件处理了大量图像。
在斯坦福大学计算机视觉科学家Timnit Gebru的带领下,研究人员使用软件分析了近五千万幅街景和位置数据的图像。他们的目标是找到可用于预测邮政编码和分区(通常包含大约1000人)水平的人口统计数据。
从这些图像中,他们能够搜集到大约2200万辆汽车(占全国所有汽车的8%),3000个邮政编码和39000个投票区的信息。研究人员将这些数据与包括人口普查局的美国社区调查和总统选举投票记录在内的其他资料交叉引用后发现,他们能够准确预测邻里的收入,种族,教育以及投票模式。
为了让他们的人工智能算法准确地对汽车进行分类,研究人员通过招募来自Mechanical Turk等地方的数百人以及汽车专家来对其进行训练,以识别出数百万张图片中的汽车。最终,他们的软件能够在短短两周内对5000万张图片中的汽车进行分类。《纽约时报》称如果是人类完成这项任务的话,至少需要15年的时间。
在《美国国家科学院院刊》上发表的一篇文章中,研究小组写道,他们的技术可以作为美国社区调查的补充,这项调查每年的花费都要超过2.5亿美元。由于调查也是劳动密集型的,调查员需要挨家挨户地进行调查,这意味着人口少于6.5万的小地区往往会被忽视。随着技术进步,人口统计数据最终可能会实时更新。但研究人员指出,政策制定者需要小心确保数据只在社区层面收集,以保护个人隐私。