大数据分析:川普赢定大选了?

大数据
昨天川普和希拉里的辩论大家都看了吗?川普大叔和希拉里进行了第一场总统候选人辩论,数据显示,全美有超过8000万人观看直播。单从辩论能力来说,川普一个商人能和律师出身的高级政客辩到这份儿上,大数据分析科学家们帮了不少忙。

 

[[172643]]

 

昨天川普和希拉里的辩论大家都看了吗?看这篇就够了。

要说这场辩论赛,确实很有看头。因为这两人在政策取向、个人风格方面反差很大,而所受的争议也为美国历史所罕见。川普大叔和希拉里进行了第一场总统候选人辩论,数据显示,全美有超过8000万人观看直播。

单从辩论能力来说,川普一个商人能和律师出身的高级政客辩到这份儿上,大数据分析科学家们帮了不少忙。

最早运用大数据技术的是奥巴马,但在目前数据源的渠道越来越多、先进的分析工具陆续开发,以及大规模计算能力增长,2016 年这场大选简直就是大数据的盛宴。

本篇不打算重复他们说了什么,而要扒一扒他们背后使了什么高科技?

希拉里堪比硅谷公司的大数据团队:希拉里拥有一支由50名专业的程序员和开发者构成的技术团队,他们原本供职于 Facebook、Google、Twitter等大型的科技公司,现在想利用更多技术手段帮助希拉里赢取更多选票和资金。比如,民主党对于竞选页面进行细微的调整,让捐赠人可以储存信用卡信息。电商公司的经验告诉我们,这是将窗口用户变为付费用户的关键,在政治上也同样如此。

[[172644]]

 

此外,希拉里的技术团队还能应对一些突发的技术问题。2015 年,联邦竞选委员会报告竞选筹资截止日当天,外部邮箱系统突然崩溃,竞选团队在 4个多小时内搭建了一个临时邮箱系统 Balloon,以应对突如其来的危机。

那么,希拉里科技团队就是一硅谷公司,川普只有Twitter?错!

在辩论中起效果的川普大数据团队:川普的竞选团队则运用大数据来分析希拉里过去十来年的辩论演讲,寻找她的弱点与习惯性语言和动作。

[[172645]]

 

因此,此次辩论与初选期间比较,川普的表现比较平和,没有叫对手外号,也没有说些尖刻的挖苦话。这也许是为了争取那些对川普个性感到不舒服的选民,但是另外一方面,也让他在进攻时显得畏首畏尾。在对手发言的时候,川普脸上表情很多,令人觉得有点孩子气。看来自身问题还得靠自己改变。 不过,川普已经很努力了,综观整场辩论会,川普开场26分钟就打断希拉里25次,推特上的相关讨论亦有六成以上有关川普,仅三成不与希拉里相关,换句话说,川普再度以一个走入美国主流政治的非典型候选人形象,吸引普罗大众的目光。

重点来了,大数据当真能助选吗?

早在 2012 年奥巴马竞选时,民主党的竞选团队中就吸纳了一批有类似特质的科技人员,开发了一套数据库 Narwal 用于管理投票情况。助奥巴马连任成功,功不可没。

与过去相比,现今的总统选举在利用大数据分析这一块更加旗鼓相当。拼的就是谁做得更好。

任何数据分析工作的执行,都需要做好三方面的准备:

1. 幕后的两家大数据公司收集和整理数据

从目前来看,大数据分析现在是大型政治选举的桌面筹码。当需要帮助政治家尽可能有效地拉选票时,大数据收集和整理就必不可少。

先扒一下两家大数据公司。

TargetSmart 给民主党派和州民主党派以及他们的同盟提供大数据分析和服务;Deep RootAnalytics,给共和党及其从属团队提供数据分析。

 

Deep Root 和 TargetSmart 都是利用 Alteryx 的软件来说明他们容纳、净化、混合以及分析来源不同的大规模资料。这种分析软件以一种最有效的方法,来分析所有选民的年龄结构,根据不同年龄段来分段并且打分,然后利用这些资讯来优化他们在媒体上的花销,特别是在非常重要的电视广告上。

Deep Root 利用它的分析模型来告诉参选者,在他们已有电视预算的条件下,哪些地方能获得最大的收获。正如 Seawright 表示,资料分析在每天的决策过程中发挥很重要的作用。

资料将会指示客户该将他们的竞选广告放到哪,才能让他们的目标人群最有可能看到,也会提示他们花销的纪录,透过让客户在情景中能够意识到这个问题,不仅提供他们所做的与目标人群相关的理由,而且也会分析竞争对手或同盟所做的,对目标人群的影响,这就允许他们能够对正在进行的分配任务具有策略性,并对广告投放更聪明——把广告投放在最不显眼而又最高效的地方,同时根据其他人或组织的移动来及时做出反应。

TargetSmart 也提供相似的分析服务,但是透过利用资料来优化移动不仅只是在电视广告投放上,也在客服中心活动、传统邮件及社区拉票,TargetSmart 在它的 360 度投票者联系技术上比他们的老对手走得更远。

2.“精准”,了解个性化需求

大数据技术显然已经推翻了美国历史上总统选举的定律:谁筹的钱越多谁胜出可能性越大、谁花的钱越多谁就会赢。

但要做到“精准”是一个与业务定制的过程。

曾经奥巴马团队能取得颠覆性的胜利,是因为他们做到了三个最根本目标:让更多的人掏更多的钱,让更多的选民投票给奥巴马,让更多的人参与进来!这些都缘于他们对选民的认知达到了“微观”层面:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?这些都缘于他们对选民的认知达到了“微观”层面:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?

机器学习是数据挖掘中常用的方法,它的基本原理是让计算机从历史数据中“学习”其中的规律,并利用该规律对未来数据进行预测,这个过程也就是建模和预测的过程。因此,当用户数据因业务而异时,每一组数据中都会有自己独特的数据模型,这也就是与实际业务相定制的过程。比如,奥巴马的数据团队就会对每一个群体的选民都进行建模,进而预测他们的捐款行为方式(通过网络捐款,还是会汇款)。

因此,在激烈的市场竞争中,谁能够深入的了解他的每一个用户的个性化需求,谁就能在竞争中击败对手,获取胜利。

两家公司还帮助川普和希拉里在社交领域进行加码:

两家大公司都正在越过电视领域来到类似社交媒体的数码媒介来探险。但是这种尝试是非常艰难的,因为数码媒介上的资料更概略,透过媒体分析并不容易知道你所要到达的目标人群。

TargetSmart 在这一领域正在做一些创新性的工作,透过利用个人可辨识的资讯,这家公司将2.55 亿国内投票者资料与类似 Facebook、Google、Yahoo 及 MSN 等数码平台上的使用者匹配。他们不能够将每个推特用户与注册的投票者相匹配,但是能得到一个内部可以利用的相当规模的资料。如果按正确的方法来做这件事,它就会注入到你的模型中。这也是这次选举一个重要的副产品。

利用社交媒体资料来更广泛地理解人们的消费方式,还有人们与社交媒体连接的方式,这对于大数据分析而言将会更有价值。

3 .动态调整模型

模型需要根据实际情况进行动态调整。用户因环境、喜好或其他因素常常会导致其行为规律发生一定的变化,使得其产生的数据也随之变化,这些变化将会影响模型的精准性。

比如奥巴马在第一次电视辩论结束后,选民的投票倾向发生改变。而数据分析团队可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。

不过,自从英国公投后,民调变得不那么靠谱了。

据CNN于辩论后公布的最新数据,有62%的民众认为希拉里技压全场,只有27%的民众认为川普占了上风;而彭博发出的数据显示,川普已经领先了两个百分点。

进一步分析,亚裔多数不喜欢川普,支持川普的华裔多是新移民有强烈的民族主义,崇尚财富,认为美国必须严执移民法。

但川普已经步步为营,与希拉里拉小了差距,未来结果还未可知,想必数据科学家们此时还在针对投票趋势在调整模型中。

11月8日,美国大选日见分晓!

责任编辑:赵宁宁 来源: 36大数据
相关推荐

2021-11-11 11:27:55

大数据分析系统

2015-08-14 10:28:09

大数据

2015-08-11 15:52:52

大数据数据分析

2022-03-29 14:49:14

大数据数据分析

2021-10-12 15:25:08

大数据数据分析

2013-04-09 09:28:20

大数据大数据全球技术峰会

2015-07-23 09:34:57

大数据数据分析

2021-08-06 11:01:23

大数据数据分析技术

2017-09-02 10:03:10

大数据分析大数据数据

2019-07-31 14:16:35

大数据人工智能算法

2016-10-17 14:14:55

大数据人才招聘

2017-07-22 00:41:27

大数据数据存储

2015-10-28 10:01:52

数据分析大数据小数据

2019-04-15 15:32:12

大数据开发数据分析数据科学

2015-09-11 11:33:21

大数据百科分析

2019-08-01 13:09:57

大数据分析建模信息化

2012-11-01 14:03:49

Teradata 大数据天睿

2015-09-08 09:24:26

大数据分析采购

2013-03-19 10:33:48

大数据相亲数据分析

2019-09-04 19:58:46

数据挖掘数据分析学习
点赞
收藏

51CTO技术栈公众号