新浪科技讯 北京时间5月27日上午消息,每天有5亿条Twitter消息发布,内容涉及人们生活的方方面面,而现在,这家社交网络决定将这一巨大的数据宝库向科学家开放,帮助他们研究人类的行为模式、预判健康风险并追踪传染病的传播情况。
例如,微软研究人员通过对Twitter上的怀孕妇女透露出的情绪,开发了一种新的算法来预测产后抑郁症的风险。美国地质调查局则可以使用Twitter追踪地震发生地。
直到目前,多数对相关问题感兴趣的科学家都只能使用有限的Twitter消息。尽管多数Twitter消息都对外公开,但科学家却希望能够随意搜索这些内容,他们目前只能通过Twitter的API(应用编程接口)实现这项功能,但却只能访问1%的数据。
不过,这种情况很快就将改变:Twitter今年2月宣布,将把2006年以来的所有数据免费提供给研究人员,有望使得Twitter成为一项广受欢迎的研究工具。借助如此庞大的数据,科学家可以展开更加复杂的研究,回答更具体的问题。
Twitter的这一计划令人兴奋,但也引发了一些问题。Twitter能否对相关科研结果享有任何权益?由于用户未必想将自己的内容贡献给研究人员,因此Twitter的这一工具是否有违道德?
为了解决这个问题,弗吉尼亚理工大学计算机流行病学家凯特琳·里夫斯(Caitlin Rivers)和布莱恩·刘易斯(Bryan Lewis)今年2月针对Twitter数据的使用方式发布了道德规范。他们建议科学家不要披露相关用户的名称,也不要公布研究目的。
例如,尽管从公共空间搜集信息并不违反道德,而Twitter也的确是一个公共空间,但在未经他人许可的情况下分享其身份信息却有违道德。里夫斯和刘易斯认为,科学家需要将保护用户隐私列为Twitter研究项目的基本原则——数据越大,责任越大。