你认为只有企业才会面临大数据问题吗?想一下纽约市:这个美国***的城市拥有820万人口,每天产生大量的数据,其中大部分数据位于很多市政机构和部门的高度分散的孤岛中。
这些数据涉及商业识别码(BIN)、BBL税号、营业执照、违规停车罚单、交通违法行为、健康检查、犯罪行为、救护服务召唤、火灾等。
纽约市市长办公室政策和战略规划分析主管兼纽约金融犯罪特遣部队主管Michael Flowers表示:“我们每天需要处理各种数据:邮寄地址、税号、建筑标识号等等,但当我们试图利用所有这些数据时,从本体论和分类学的角度来看,这变得非常困难。此外,所有这些数据都被存储在城市的不同位置,可以说是支离破碎。存储系统本身也存在巨大差异,有些系统很先进且易于使用,而有些系统则早已过时。”
纽约市的311热线每天接收超过65000次呼叫
让事情更具挑战性的是,纽约市的311非紧急热线每天接收超过65000次呼叫,其中涉及对噪音的投诉以及对破烂和坑坑洼洼的人行道的报告,还有询问如何获取契据或者养食人鱼是否合法。
“我们只是基于简单的先后顺序来分配我们的资源,”Flowers表示,“有电话打进来,我们就会对这个电话做出响应。”
唯一的问题是:但是311的呼叫情况并不能说明这些资源的真正去向,它们是数据,但是不完整的数据。
于是,Flowers对纽约市进行了臭鼬项目(用来形容高度灵活、高度自治、不受约束的项目),他和他的团队需要向纽约市政府社区展示纽约的大量数据如何可以用来更有效地分配资源。
“我们正在努力使你们的生活更加轻松,同时尽可能地有效地分配这些资源,这样你们就不需要想过去一样付太高的税额,”Flowers表示,“我们需要做的是想办法展示一个共用平台的效用。我需要向纽约政府社区证明我们能够整合和利用这些信息,这是我们的工作。”
大数据和非法改建
这个项目“雄心勃勃”,Flowers想要利用这些数据来帮助识别可能存在非法改建的建筑物,例如,原本只能容纳六个人的建筑物居住了60个人。
根据对311热线的投诉,你会认为大部分非法改建发生在曼哈顿下城。但实际上,我们发现非法改建出现在布鲁克林、皇后区和布朗克斯各区的外围。
Flowers表示:“在2011年春天和夏天,我们有两栋非法改建的建筑物发生火灾,一些消防员受重伤,还有一些人死亡。”
Flowers称,非法改建的建筑物更容易发生火灾,更重要的是,在这些建筑物中,消防员更容易受伤或者死亡,因为这些建筑物的逃生出口往往被阻塞。“我们的任务就是想办法解决这个问题。”
成功的数据项目从与人们沟通开始
对于Flowers的团队来说,这似乎是不可能完成的目标。他的团队都没有很高的学历,并且都在25岁或者以下。此外,因为这是一个臭鼬项目,很少人明白他们在做什么。但他们下决心改变局面。Flowers做的***件事情就是与***线的人们交谈。
他表示:“我跟消防员谈,跟警察谈,跟屋宇署的督察谈,我问他们:‘当你们看到一个不安全的建筑,你们看到了什么?’然后我将这些用数据来体现。”
Flowers让其团队研究实际“腾出”情况,即当检察院发现建筑物不安全时,他们会要求腾空整个或者部分建筑物。
“我不需要解构人们的投诉,”Flowers表示,“而是解构问题,我使用城市数据来解构问题。”
Flowers的团队找出了几个可行的指标,包括以下:
-- 这个建筑物是否位于“高风险地区”,即较贫穷的市民更可能居住的危险的地区?
-- 这是1938年以前的建筑物吗?1938年建筑规范有所改变,在规范改变后的建筑往往更加安全。
-- 建筑物是否已经丧失抵押品赎回权或者税收留置权?“这两个问题的答案很重要,这表明业主的财务状况,”Flowers表示,“我并不是说当业主破产后,他们会向对待垃圾一样对待他们的房屋。”
--是否有过投诉?Flowers表示:“如果此前有过投诉,六个月后又有投诉,那么这个建筑物很有可能会发生火灾。”
通过这些正确的数据,Flowers的团队创建了一个工具,可供检察员直接使用。在检察员使用该工具前,当他们发现建筑物不安全时,他们不得不腾空13%的建筑,而在Flowers项目的18个月后,检察员现在可以腾出70%的建筑物。
“我们取得成功的原因在于我们使用了正确的数据,”Flowers表示,“这个城市的数据是好的,我们采用了正确的方式来使用这些数据。”
“我们所做的就是分清轻重缓急,”他补充说,“这是需要立即采取行动的情报信息。”
随着受数据驱动的决策的价值得到证明,Flowers表示在现任市长2014年1月离任之前,他还有三个目标:
-- 建立全市范围内的分析,主要集中在更有效地利用机构资源
-- 发展和启动基于数据的资源分配文化
-- 将动态纽约市数据推向公众、技术/创业界和学术界