本文转自雷锋网,如需转载请至雷锋网官网申请授权。
我们的人生轨迹可能受家庭、社会、时代影响,也因大大小小的决定被改变。我们无法预知的未来,AI 可以准确地预测吗?
来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160 个研究小组参与了“脆弱家庭挑战赛”(Fragile Families Challenge),通过建立统计和机器学习模型,试图预测、衡量美国各地儿童、父母及其家庭的人生轨迹,寻求上述问题的答案。
当地时间 2020 年 3 月 30 日,这一挑战赛的研究成果在线发表于《美国国家科学院院刊》,论文题为 Measuring the predictability of life outcomes with a scientific mass collaboration(通过科学合作探究人生轨迹的可预测性),合著者多达 112 位。
来自 4000 余个家庭的大样本数据集
实际上,探究人生轨迹,更像是一个社会学问题。这不仅仅是预测未来那么简单,它在提供家庭援助、了解社会僵化程度、改善相关政策方面都有一定的参考意义。
这一研究基于一个名为“脆弱家庭与儿童健康研究”(Fragile Families and Child Wellbeing Study)的高质量出生队列数据集——由社会科学家 15 年来收集的大样本数据集,包含来自 4000 多个家庭的 1.3 万个数据点。
研究人员对出生于 1998-2000 年间美国大城市的儿童进行了研究,其中未婚父母所生儿童的占比较大。不难看出,这一纵向研究的目的也在于了解出生在未婚家庭的孩子的生活。
具体来讲,随着孩子年龄的增长,相关数据总共收录了 6 个阶段的情况——小孩刚出生时、1 岁、3 岁、5 岁、9 岁和 15 岁。
值得一提的是,每个年龄段数据收集的范围不同。比如,孩子刚出生时,仅仅收集父母的调查访谈信息;孩子 9 岁时,需要对父母、孩子的主要照顾者(如果不是父母的话)、老师和孩子自己都进行调查访谈,进而收集信息(如下图)。
此外,针对不同年龄段,研究人员对数据的关注方向不一。
例如,孩子刚出生时,对母亲的采访主要涉及儿童健康与发展、父母关系、父亲身份、父母对婚姻的态度、与家人的关系、环境和政策因素、健康状况、人口特征、教育程度、就业及收入情况;而在孩子 9 岁时,对孩子本人的采访主要涉及的话题有父母关系、父母的要求及督促孩子的情况、与兄弟姐妹的关系、日常生活、在校情况、青少年犯罪倾向、任务完成和行为表现及健康、安全状况。
脆弱家庭挑战赛
实际上,这一名为“脆弱家庭挑战赛”的项目可以说是一款游戏——游戏开发者是项目组织者,玩家是参与进来的各个研究团队。
而游戏设定是,项目组织者不公开上述家庭中孩子们 15 岁时的数据,各个研究团队可利用任意的 AI 模型高能玩法准确预测孩子们 15 岁时的人生发展。开发者为玩家提供了 6 种衡量维度,如孩子们的平均学习成绩、孩子们的毅力、家庭经济水平、孩子的主要照顾者的工作和接受培训情况等,玩家需要预测其中的至少一个维度。
如下图,这一研究的背景数据包括来自 4242 个家庭的孩子刚出生时、1 岁、3 岁、5 岁和 9 岁时的共 12942 个变量。而训练数据即是孩子们 15 岁时的 6 种人生轨迹。
实际上,这一游戏设计思路正是计算机科学领域常用的一种研究设计方法「共同任务法」。
雷锋网了解到,项目组织者收到了来自全球 68 所大学的 457 份申请,最终这一项目由全球 160 个研究小组协同开展。挑战赛于 2017 年 3 月 5 日至 2017 年 8 月 1 日展开,参与者只要将预测结果上传至挑战赛官网即可。
【脆弱家庭挑战赛官网】
在脆弱家庭挑战赛结束后,组织者将 160 个团队的结果进行分析比较,发现各团队使用了不同的数据处理、统计学习等技术来生成预测,虽然各个团队得到的预测结果之间相差不大,但各预测结果普遍与真实情况差距较大,即便是最准确的预测结果也与训练数据的实际情况存在不小的差距。
如下图,研究团队对家庭经济水平、孩子们平均学习成绩的平均预测准确度在 0.2 上下浮动,而对其他几种维度的预测准确度平均约 0.05(雷锋网(公众号:雷锋网)注:值越接近 1,吻合程度越高;越接近 0,则吻合程度越低)。
当然不可否认的是,各团队对部分预测也是准确的,比如具体某个孩子的学习成绩。
目前看来,我们可以回答文章开头的那个问题了——AI 并不能很准确地预测人生轨迹。
这一结论对 AI 模型在刑事司法、儿童保护服务等场景的应用带来了启示,同时社会学家、数据科学家今后也应谨慎使用 AI 预测模型。正如普林斯顿大学和哥伦比亚大学 “脆弱家庭与儿童健康研究”首席研究员 Sara McLanahan 所说:
结果令人大开眼界,要么运气在我们的生活中扮演着重要角色,要么我们作为社会科学家在研究中忽略了一些重要变量。