人们需要关注并使用的公共数据集

译文
大数据
如今,很多企业领导者通常将对于大数据的需求不断增长视为一种新的“石油繁荣”。实际上,数据现在可能比石油更有价值,尤其是对于营销人员而言。

[[345806]]

【51CTO.com快译】如今,很多企业领导者通常将对于大数据的需求不断增长视为一种新的“石油繁荣”。实际上,数据现在可能比石油更有价值,尤其是对于营销人员而言。

为了帮助市场营销转型,数据用于从目标广告到用户分析的所有方面。它非常有价值,因为能产生可操作的见解,从而为企业带来商业利益。数据使个性化用户体验和自动化过程成为可能。

但是实际上,获取数据要比获取石油容易得多。很多用户和消费者经常免费提供数据,尽管他们也知道数据对业务的价值。例如,现在很多用户授予Facebook Pixel访问浏览习惯的权限。而如果在网络聊天时谈到休假,也许会看到旅游广告。人们会看到复杂的数据技术驱动广告商预测出他们想要的东西。

人们从各种来源收集数据很容易,有些工具或程序是专门为这项工作设计的。人们需要关注并使用一些有用的公共数据集,以下是特别关注的一些公共数据集。

1.Google Trends

全球规模最大的公开数据存储库是Google Trends。该工具长期以来一直是存储搜索和有关谷歌用户其他数据的首选平台。Google Trends是通过在预定时间段内处理谷歌搜索数据而产生的见解。

Google Trends随着时间的推移而变得更加先进和全面。如果想从搜索趋势和其他数据集中获得更深刻的见解,用户可以选择导出这些数据集并运行自己的计算。

用户可以使用谷歌自己的工具(例如Google BigQuery)来处理Google Trends导出的文件。另外,也可使用特定目的第三方数据处理工具,其中包括Lambda和VAYU等工具。用户如何处理数据完全取决于自己。

2.ProPublica Data Store

很多组织都在收集数据,包括媒体公司和新闻机构。ProPublica公司是为数不多的公开其数据集的公司之一。ProPublica公司以其调查性新闻而闻名,其中包括对数据隐私的调查。

得益于媒体公司的广泛网络,ProPublica公司在经济、健康和政治等领域拥有庞大的数据仓库,以及金融市场的详细信息。

另一方面, ProPublica维护一系列高级数据集,通常具有更深入、更全面的数据点。用户可以检查原始数据并执行更深入的分析。

3.CDC Prevention

CDC Prevention是另一人值得关注的大型公共数据集。对于应对健康危机(包括人们现在面临的冠状病毒疫情)非常有用。卫生官员和专家使用CDC Prevention来获取有关疫情危机的见解,其中包括有关医疗服务提供商以及如何优化服务的知识。

这些数据集使人们能够看到新趋势并做出预测。疾病预防控制中心(CDC)的专家们正与政府密切合作,以确定应对某些危机的措施是否合理。这种趋势助于预测市场的变化方式。

疾病预防控制中心(CDC)维护着一整套数据集和工具。人们可以在其网站上找到有关癌症患者的治疗、基因组学、食源性疾病,甚至是糖尿病等特定疾病的数据。美国艾滋病、病毒性肝炎、性病和结核病预防中心(NCHHSTP)图集和交互式数据库工具也非常便于跟踪和处理特定数据集。

4.FiveThirtyEight

如果熟悉用于管理问题和捕获趋势的营销工具,那么用户一定会喜欢采用FiveThirtyEight数据集。该网站允许访问从各种来源收集的集。这些内容主要与国际政治有关,而其内容正在迅速增长。

FiveThirtyEight的数据集对于在更广泛的范围内生成见解非常有用。例如,当需要了解更加突出的市场趋势时,可以使用市场和经济数据集来获得所需的见解。唯一需要注意的是,FiveThirtyEight使用调查和问答的方式,因此,虽然其数据是在法律和道德层面上收集的,但规模并不是特别大。

公开可用的数据集同样值得探索。例如EarthScience,包括有关地球地壳运动的数据,但也可以找到农业、物理、医疗、能源、交通,甚至电子竞技和数字体育赛事的信息。用户不必自己收集数据,其所要做的就是寻找和使用更好的公共数据集。

数据就像石油一样具有巨大的价值。而像化石燃料一样,数据已经成为营销领域创新的动力。而用户对数据的需求和有用性正在不断增长,这是为什么很多组织关注和使用各种专有和公共数据集的原因,可以确定在跨行业的转型营销中的适用性,并利用数据的潜力实现巨大的增值。

原文标题:The Big Data Boom,原文作者:Dave Sutton

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

责任编辑:庞桂玉 来源: 51CTO
相关推荐

2020-09-21 07:00:00

混合云

2020-01-03 11:04:27

云计算技术公共云

2018-06-15 21:59:26

2015-09-02 10:26:58

主机机房

2021-02-04 10:13:08

大数据趋势大数据Gartner

2019-12-02 10:42:24

数据中心安全IT

2023-03-02 08:27:34

能源安全数据中心

2024-04-01 14:14:05

2020-08-24 10:54:47

智能电网大数据数据分析

2021-02-02 08:00:00

边缘计算云计算公有云

2017-05-11 11:16:33

公共云私有云辩论

2020-07-07 09:29:19

物联网医疗领域IOT

2020-03-18 10:40:27

安全 数据网络罪犯

2022-12-09 09:48:43

云计算

2017-06-15 16:24:32

闪存存储缓存

2022-10-08 14:29:58

数据安全钓鱼邮件

2022-03-14 14:35:25

数据中心净零数据中心卫星宽带

2020-02-12 10:37:41

数据安全信息安全网络安全

2024-03-06 13:17:50

2010-10-13 16:16:50

MySQL并集
点赞
收藏

51CTO技术栈公众号