大数据文摘出品
作者:宋欣仪
当你将自己的DNA数据上传到互联网时,你等于是把自己和所有亲属置于执法部门的监督之下。
今年三月,一位华盛顿州温哥华的普通妇女布兰迪·詹宁斯意外得知,她的DNA数据帮助爱荷华州解决了当地一个小镇上1979年的谋杀案。
詹宁斯在去年夏天决定要更多地了解她的家庭,于是将自己的DNA数据上传到家谱网站 GEDmatch。这之后她就忘记了这件事,直到今年爱荷华州的警方通知她,她的一个远方亲戚杰里伯恩斯由于她的DNA被捕了。
詹宁斯和她的犯罪堂兄
杰里伯恩斯65岁,生活在爱荷华州曼彻斯特市,是詹宁斯从未见过的远方堂兄。警方是通过詹宁斯上传的DNA数据找到他的。警方与弗吉尼亚州雷斯顿的Parabon NanoLabs公司合作,通过将杀手残留在被害者衣服上的血迹中的DNA数据与GEDmatch数据库当中的数据进行比对,在与詹宁斯的基因获得匹配之后逐渐描绘出一个杀手的家谱,通过伯恩斯喝过苏打水的杯子上残留的痕迹确认了他是凶手。
一、金州杀手被捕,掀起刑侦届的数据革命
说到用高科技逮捕杀手,不得不提轰动一时的金州杀人案。
1. 金州杀手是谁?
金州杀手是一名连环杀手,连环强奸犯和连环窃贼。他枪法娴熟,常常潜入民宅,直面酣睡中的夫妇。他会先用手电光束将床上的夫妇晃醒,将丈夫绑缚后,再对妻子施暴。有时他会把夫妇两人一并杀害。有时则只针对单独在家或只与孩子留在家中的女子。在1976年至1986年期间,他在加利福尼亚地区谋杀了至少12人,强奸45人,并且犯下了100多起住宅盗窃案。其中8起谋杀案通过DNA证据联系起来,另外两起案件通过作案手法联系起来。尽管警方发现了大量线索,却始终不能缩小调查范围,负责该案件的加州探员霍尔斯前后追踪过数千名嫌犯和无数线索,都无疾而终。警方还曾经悬赏5万美元,希望民众提供帮助。
直到去年,杀手才慢慢浮出水面。
警方所做杀手画像:白人,男性,身高约5英尺10英寸,一头金发或呈浅棕色。
突破点是探员霍尔斯在发现GEDmatch这个网站后,把“金州杀人狂”的DNA数据上传到了网站上。虽然没有完全匹配的DNA数据,但是他找到了一个和“金州杀人狂”部分DNA匹配的人,也就是找到了“金州杀人狂”的亲戚。在GEDmatch的帮助之下,他的怀疑对象从上百万的人缩小到了一个家族。
之后,霍尔斯在基因学家Barbara Rae-Venter博士的帮助之下,从外形,年龄,工作经历,作案手法和心理画像等等,在家谱成员范围里一步步缩小,最终锁定了那个躲藏在加州附近20余年的杀手。
2018年4月24日,Joseph James DeAngelo Jr.被萨克拉门托县警方逮捕,被控八项一级谋杀罪。
金州案由此成为罪案侦破史上技术革命的里程碑。它的意义在于为警方破案提供了新的可能——通过DNA族谱树追查罪犯。未来,任何人犯罪,警方只要找到他留下一丁点DNA,都有可能通过各种基因数据库 ——无论是警方的犯罪数据库,还是执法人员数据库,又或者是GEDmatch这样的第三方网站,进行各种比对,不但匹配个人,还可以匹配亲戚画出族谱,从而一步步追查到罪犯本人。
2. 技术与我们基因的交叉:基因家谱刑侦学
GEDMatch:基因匹配数据库网站,将DNA数据上传,网站会给出潜在匹配表
“基因家谱刑侦学”被science列为2018年一大技术突破。这项技术的贡献,就在于它做到了“模糊匹配”。过去警方从犯罪现场搜集到DNA之后,想要找到嫌疑犯,必须精准匹配。如果数据库没有这个人的DNA,罪犯就可以逍遥法外。但基因家谱技术能让警方可以通过找到嫌疑犯的远亲,再顺藤摸瓜找到他,这极大地缩小了搜索范围。
science报道:
https://www.digitaltrends.com/cool-tech/biggest-science-news-breakthroughs-2018/
基因家谱技术背后有两个非常重要的突破。
首先是公共基因数据库的兴起。过去警方的DNA数据库里,一般只包含有前科的罪犯的DNA,而如今因为普通人只要花一点钱,用棉签刮一下口腔黏膜,寄给专业的公司,就可以对自己的DNA进行检测。这些数据逐渐累积,出现了庞大的公共基因数据库。
另外是一种叫做“长线家族搜索”的方法,这也是基因家谱能实现模糊匹配的关键。过去通过DNA比对进行的家族搜索,只能匹配到近亲,而“长线家族搜索”可以实现个体DNA一直到第三代表亲的匹配。这种方法的使用很大程度上归功于一些退休的家族历史爱好者的倡导,他们多年来一直试图说服执法官员,他们的技术不仅可以用于寻找被收养者的亲生父母,还可以有更广泛的用途。
基因学家CeCe Moore绘制的家谱树
另外,基因家谱不仅能帮助破案,还能帮我们了解人类其他的秘密。2018年3月《science》杂志的一篇文章说,研究人员利用公共基因数据库,绘制了人类有史以来非常大一张家谱。这张家谱绵延了五个世纪,涵盖1300万人。从这张巨大的家谱中,科学家发现,长寿这件事情并不是完全由基因决定的,影响寿命的因素其实远比我们想象得要多。科学家还从中发现,某些特定疾病,在家族中有一定的传播模式。
二、生物技术创新正在影响我们生活:关于正义、关于伦理
Barbara Rae-Venter博士是遗传系谱学家和退休专利律师,是她帮助确定了金州杀人案中的嫌疑人
基因家谱刑侦学发展迅速,现在已经被使用做出了49个基因鉴定,让警方得以重新开始对于一些悬而未决的旧案的调查,诸如1987年加拿大一对年轻夫妇的双重谋杀案,北卡罗来纳州的6起强奸事件以及46年前斯坦福大学毕业生被杀的事件;成功抓住至少17人,包括从未受到过任何怀疑的人,例如一直公众形象良好的政党D.J.。美国国家失踪与被剥削儿童中心也正在重新审查约700起涉及身份不明儿童遗骸的案件,并在过去一年中查明了其中约15起。根据各种系谱学家和调查人员的估计,还有300起案件正在进行中,包括过去的谋杀案件和一直身份不明的尸体调查。
有些案件曾经被认为是永远无法解决的,躺在太阳无法照到的阴暗角落。在这些案件中,正义不会得到伸张,犯罪者逃之夭夭。但是,由于DNA技术的突破,世界另一边的兄弟,女儿,孙子甚至远房亲戚都可以成为破解案件的关键,并帮助警方将罪犯绳之以法。金州杀手案只是一个开始,通过新的家谱技术,数以百计的陈年旧案再次有了侦破的可能——虽然代价可能是非常棘手的伦理问题。
1. 新的伦理问题:哪些案件应该被选择
这些案件引发了警方,系谱学家和受害者家属的一些问题:为什么选择一个案件而不是其他案件?哪些案件是媒体关注的焦点?过去的案例是否值得再拿出来讨论,即使凶手可能已经死亡?为什么不用解决这些老案件的时间去处理新的案件?
我们当然可以把所有的案件都放到对面,然后按重要性加以排列,然后冷酷地剔除那些看似已经过去,无法被解决的案件。但是有些执念就是无法轻易被放下,有些事情不可以就这么过去。
至今未被侦破的殖民地公园谋杀案——杀手被认为在1986年到1989年间在美国弗吉尼亚州的殖民地公园大道上杀害了至少8人。没有明显的动机,没有抢劫、强奸或抵抗的迹象。联邦调查局、州和当地警方花了数千小时的时间来处理这些案件,但仍然无果。比尔托马斯是这一案件的受害者家属,他的妹妹凯茜是被杀害的八个人之一。他这样说:“我和我的家人根本不在乎杀手是不是死了,我们甚至不在意他能不能被抓,我们只想知道他是谁。“
也许到了生活深处,世界不是分成你和你要选择的东西,你跟你周边的人与事融合为难解难分的命运。在从小疼爱到大的妹妹突然被杀的那一天,一个兄长应该做什么?一个女儿被奸杀的母亲,她的后半生该如何度过?除了真相,我们还能拿什么面对他们?
三块广告牌里的女主说过:“建立一个DNA数据库每个人出生的时候就把DNA录进去,也许这样以后抓罪犯会容易的多吧。”
同时这一技术的运用也让人发现,我们每个人都与凶手有着或近或远的关系。人类基因的大部分是相同的,变化的只有其中0.1%的部分。正是这微小的0.1%的差别形成了我们不同的指纹,构成了我们独特的识别信号,但也意味着我们与另一个人可以有多么相似、多么相关。没有人可以是一座孤岛,我们彼此都分享着遥远的相似性。这会让你反思:我做错了什么?
2. 大数据时代:要隐私还是安全?
另外,警方利用基因家谱刑侦学破案的做法还引发了对隐私和安全的质疑。有人质疑,家谱网站的用户没有意识到他们会被卷入刑事调查,尽管GEDmatch透露可以使用档案来调查暴力犯罪——GEDmatch公开通知用户没有隐私保证,提醒他们的DNA数据可以被用于除了查询祖先之外的用途。
而FamilyTreeDNA(最初定位于家谱查询目的的基因测试网站)最近宣布会与F.B.I秘密合作,直接将自身定位为追捕杀手的手段,这无疑是为许多人敲响警钟——政府和公司是否应该获取我们的遗传信息?如果可以,他们应该怎么处理这些数据呢?
除了法律之外,个人几乎没有办法保护他们的基因数据。即使一个美国人即使从未进行DNA测试,在一个先进的家谱侦探的手中,通常只需要从一滴唾液,血液或精液中识别出的他的两个三代内表兄弟的DNA数据,就可以被获知名字。三代内的表兄弟意味着什么?这是你16位曾曾祖父母中的一个的后代,至少有800个人分散在世界的不同角落,而这其中很可能一些人就曾经在GEDmatch上传过基因数据——GEDmatch拥有大约100万用户。根据最近的一项研究,90%的欧洲裔美国人的DNA都将通过遗传谱系得到识别。
也许在不久的将来,你能够轻松地从公司冰箱中吃剩一半的火腿三明治上的口水,发现一起吃饭的同事身世秘密。虽然听起来很荒谬,但是已经有一家公司正在收集公寓大楼的狗粪,以查明是哪些主人没有清理他们家狗狗的排泄物。
Blaine Bettinger:知识产权和技术律师
而目前每个州对于这一技术的法律规定不尽相同,在马里兰州,警方被禁止通过刑事DNA数据库中的数据识别嫌犯。
不同的律师也有不同的看法,与GEDMatch合作的知识产权律师Blaine Bettinger认为,法官可以决定从家谱网站处理线索,就像处理来自Codis或Instagram的证据一样。
而来自The DNAGeek的DNA分析服务中心的Leah Larkin 博士认为该技术违反了第四修正案对非法搜查和扣押的保护:“既然警察不能在没有逮捕令的情况下闯入住宅进行调查,那也不该使用这些数据——我DNA中的私人信息比我的内衣抽屉里的信息要多得多。”
萨克拉门托地区检察官Anne Marie Schubert在金州杀人案中取得成功之后创建了一个遗传家谱单位,则认为这些担忧是多余的。“我们不会在这些家谱数据库中得到人们的DNA,”她保证只会获取网站用户与嫌疑人关系的信息。
议论纷纷,一边是成千上万的刑事案件,一边是整个基因隐私的未来,孰轻孰重?
在面对金州杀手的公共安全威胁下,我们可以很容易地在隐私和公共安全之间做出选择,这项新技术的确可以将滔天罪行的罪魁祸首绳之以法,然而,不受约束的执法机构可能会滥用我们和我们亲属的DNA信息。信任执法机构以道德的方式行事,就像信任Facebook编写自己的法规一样——我们只能期望政府可以做到兼顾二者。
相关报道:
- https://www.nytimes.com/2019/04/25/us/golden-state-killer-dna.html
- https://www.nytimes.com/2019/02/04/business/family-tree-dna-fbi.html?module=inline
- https://kuaibao.qq.com/s/20181228A08JJC00?refer=cp_1026
【本文是51CTO专栏机构大数据文摘的原创文章,微信公众号“大数据文摘( id: BigDataDigest)”】