我是谁?大数据与DNA解答人类大困惑

云计算
系谱学(搜寻并考证人类祖先)的下一阶段,将很快得到实现。大量累积的、数字化的可访问数据结合DNA检测的最新进展,意味着人类对家庭的困惑——他们是谁?他们怎样到达这里?他们如何关系到我们?——这些很快能得到解答。实际上,对家族史(假定家族史存在)的追求不会超过20年:大部分的奥秘正在快速消亡。

导读:据国外科技媒体TheVerge报道,对人类祖先的永恒探求正走向结局。

系谱学(搜寻并考证人类祖先)的下一阶段,将很快得到实现。大量累积的、数字化的可访问数据结合DNA检测的最新进展,意味着人类对家庭的困惑——他们是谁?他们怎样到达这里?他们如何关系到我们?——这些很快能得到解答。实际上,对家族史(假定家族史存在)的追求不会超过20年:大部分的奥秘正在快速消亡。

因此,我们是谁?我们怎么到达这里?我们从何而来?我们去往何处?

上帝之子

对祖先的兴趣可以追溯到历史本身,但对于地球早期的人类来说,只有皇室和超级富豪才能研究血亲家系,目的是巩固权力与财富。然而,现代爱好者家谱目前的做法,则植根于1845年在波士顿创立的新英格兰历史家谱协会,使用家庭“树”推广系统图表。19世纪20年代John Farmer发展了家庭树,并沿用至今。在接下来的10年,类似协会在纽约建立,之后,寻找与开国元勋和其他革命战争人物间的关系十分普遍。“当美国革命之女创建后,五月花协会也随之创建,”托马斯·麦克恩特说,“这就是我所说的系谱学的第一阶段”。美利坚联邦共和国一成立,美国的系谱学就随之应运而生。

新英格兰历史家谱协会成立后不到50年,美国系谱学领域最重要的角色诞生了,就是西部的盐湖城。

托马斯·麦克恩特表示,盐湖城是家族史研究的“麦加”圣地。因为,盐湖城也是耶稣基督后期圣徒教会及其家庭史图书馆的所在地,教会创建于1804年,是犹他州家谱协会;家庭历史图书馆这是系谱学界最大的图书馆,而其在线门户网站FamilySearch,日均浏览量约为1000万。

摩门教的基础教义之一即是家谱

1847年,杨百翰和其他一些后期圣徒创建了盐湖城,盐湖城人口刚过100万,其中半数为后期圣徒教会成员。家庭史图书馆赞助与合作伙伴服务部高级副总裁唐纳德·安德森称,摩门教坚信“永恒的家庭”,坚信家庭有能力去“在生命之外延续”。因此考证祖先是“摩门教义的重要部分”。站在大型银行的微电影当中,他说,“我们都是上帝之子”。

摩门教的基本教义之一就是进行系谱学研究,因为其成员们相信摩门教可以为死去的祖先施洗入教。由代理人施洗家族的行为——即,不知道祖先或未经祖先允许,因为祖先们通常都已过世——备受争议,但那并不是多数系谱学者关注的焦点。FamilySearch和家族史图书馆工作人员欢迎摩门教徒和非魔门教徒,因为图书馆的使用,已经远远超过其宗教目标,且后期圣徒坚信他们的信息传播甚广,且所有信息全部免费。

家族史图书馆是一幢角状的不规则现代建筑,每周六天对外开放,所有服务均免费。家族史图书馆收集了全球最多的与家谱研究相关的文档资料、图书和微电影,因而每年吸引了50万人来此参观,其中许多都是系谱学爱好者,或是专业系谱学者,他们不信仰摩门教。

后期圣徒开始于20世纪30年代末期,他们承办了一个巨型计划,那就是在全球范围内寻找系谱学记载并制作成微电影。借助志愿者和传教士大军,后期圣徒会参观了全球政府和教堂(教堂中保存了大量记载,直到20世纪之交),使用了240万微缩胶卷。家族史图书馆还招募了4600位志愿者,在全球范围内的家族史中心工作。家族史中心是小型研究便利机构,赞助者可以在主要的图书馆订购微电影和图书,然后通过离家近的线下工厂寄送。但在脏兮兮的图书馆(家族史中心是艺术殿堂,实际上一点都不脏),在那些长期被遗忘的泛黄的文件中发掘数据,将迅速走向历史。感谢互联网。

“看起来似乎互联网为系谱学而生”

对家人的研究过程艰苦,往往吃力不讨好,直到互联网出现。与多数人一样,如果你从头开始——可能你知道四位祖父母的名字,其他所知甚少——就这样开始研究几乎完全不可能。托马斯·麦克恩特的研究开始于20世纪70年代,他说,“不得不直接去档案馆或者仓库”。他很幸运,就读了位于华盛顿特区的一所大学,国家档案馆就在华盛顿特区,那里保留了美国人口普查和军事记载的所有收集资料。“全都是纸质版本”,他说。记载要么是纸质版,要么是微缩胶卷。访问资料需要实地前往,如果实地访问失败的话,就需要一封邮件命令。所有记载当然不可能有索引,因此你得准确知道你需要什么东西:如果你在寻找祖父母的死亡证明,但又不知道确切的死亡日期,那么事情很难办到。当然,所有的家庭树图表,也是纸质版的,因此也很难确定一个表亲与另一表亲间的关系。直到2000年中,这些信息几乎都不能在线阅览。现在,除了某些重大记载(国家法律确定其可用性)和许多军事服务档案外,几乎所有的记载,都有电子版本。

大数据结合DNA检测

3月,近7000人赶至盐湖城的盐宫会议中心,在RootsTech中度过周末。RootsTech是一个年度专注于技术的系谱学会议,由非盈利家族组织FamilySearch和其他一些大牌家族行业赞助。当前系谱学的技术并不总是完全可靠,但RootsTech会议讲述并鼓励两人发展关系。传统而言,近退休年纪的人(多数为女性)希望找到家族组织的这个爱好,在当前是产值达到10亿美元的行业,且年轻人口越来越多。

过去几年,寻找并图表描绘家族史已变成一种潮流,开始搜寻的技术也变得更加简单。许多企业如Ancestry.com和FamilySearch等耗费近十年时间,将他们拥有的工具、文件记载和数据等放在网上,供使用者进行互联网查询,这带来了家谱研究革命——同时,大幅降低搜寻过程的进入门槛。过去老人或拥有可支配收入的专业人士才能参与的事情,现在则迅速变成更为主流的追求。只需稳定的网络连接和一台笔记本电脑,就能一窥过去。

DNA检测几年前还需要花费数千美元,且仅能提供极少的家谱信息。而现在,越来越多的消费者选择采用DNA检测,追溯至数百年前,获取做梦也想不到的大量的关于人类祖先的信息。

植根于普洛佛的家庭树——Ancestry.com

Ancestry.com总部位于犹他州普洛佛市的一座山脚下,距盐湖城仅45英里。Ancestry.com创建于1990年,创始人为保尔·B·艾伦(不是微软的保尔·艾伦)、丹·塔格特(同为杨百翰大学摩门教毕业生)。企业最初作为信息库为人所知,后来则因在软盘上分发圣徒出版物而知名。早年Ancestry.com是一家软件公司,他们在艾伦的汽车旁销售带有圣徒出版物文档的软盘,每份300美元。到1995年,二人将精力放在互联网上,Ancestry.com迅速成为在线家谱研究的领头羊。创建在线家庭树、索引和记载的工具对外免费,但历史文档的真实扫描图片需要付费浏览。通过付费用户,企业赚取了大笔收入。现在,拥有全部访问权限的用户每年服务费用为359美元——每月30美元左右——付费用户则超过了200万。

Ancestry的记载包罗万象,这意味着所有人都可以搭建自己的家庭树。一旦用户找到某个记载——比如说,20世纪40年代的人口普查图——他(她)相信祖父的姓名也在人口普查图中,那么他可以将该记载链接到家庭树上写有祖父姓名的地方。用户的家庭树可以是隐私的,也可以与其他人共享,并将自己的家庭树链接到他人的家庭树上。Ancestry记载功能强大、性能集中,可以合并用户几乎所有的研究数据。许多年前,等量的人类信息就已经填满了手写活页夹与复印纸活页夹的货架,没法简单进行分享。

Ancestry.com是系谱学领域最出名的企业

Ancestry公司CEO蒂姆·沙利文在RootsTech会议上做了主题演讲,他为Ancestry工作了10年。在那之前,他先是世界上最大的婚恋约会网站Match.com的COO,然后担任了Match总裁,他也曾任职于TicketMaster和迪士尼。在沙利文的领导下,Ancestry变成系谱学领域最知名——可能也是最成功的企业。但他仍然平易近人,不似其他多数CEO。当我们走过会展中心的大厅,想找个可以交谈的安静地方时,其他人围过来,对着我们微笑,偶尔也靠近他。“过去五年来,我们一直在搜寻,”但是现在“家族史完全社交化.”人们在一起工作——不管他们知不知道——这改善了他们自己的个人家庭树,也改善了企业数据,因为企业可以将他们的信息拼接在一起。

沙利文的观点十分正确,Ancestry的早期成功几乎可以完全归功于数据搜寻,Ancestry提供了不太匹配但不断改善的搜索算法。基因搜索引擎如谷歌等不能分辨姓与名,而这往往意味着此类工作的全部不同之处,尤其有些祖先的名字相当常见如史密斯或泰勒。但Ancestry(和其他类似企业)创建了特制的用于单一目的的搜索引擎,这种搜索引擎能处理一种需求:与姓相关联的名(包括变化多端的拼写的不同组合)、日期范围、特定范围或宽域文档搜索、宽地理位置(如某一国家)或特定地理位置(如某个小镇)、一些出生日期、出生地点、其他人(如亲戚家的小孩)的名字等。这款搜索引擎每日处理约4500万次搜索量(谷歌搜索数据约为30亿),或许不尽完美,但功能非常强大,且在不断修改升级。搜索结果反馈每次数百条,按匹配度排名。通过挖掘大量的文档和联系数据库,Ancestry也能自动推送“线索”——通过惊人的图文并茂的家庭树之叶展示——基于用户的家庭树,指向潜在亲戚和主要来源。最近,它还首次亮相Facebook分享功能,用户可以将自己和家人的Facebook账号链接到家庭树中,这同样提高了企业搜索的能力。#p#

凯蒂的家庭树

 

 

凯蒂·诺托普洛斯就是系谱学家,技术上的进步是这些变成可能。她自我描述为“业余爱好者系谱学家”,作为BuzzFeed编辑,凯蒂大约五年前开始了家谱研究。当时,一位朋友告诉她研究家谱的很有趣很好玩。她不参加系谱学会展,也不去冲洗墓碑上看不清的日期。“我只在网上研究”,她说,而这在几年前完全不可能。

“我认为系谱学一门滞后于技术的行业,”麦克恩特说,可能因为记载的拥有者——小教会和当地政府——没花钱去将他们的记载进行微影像化、彻底地目录化(后来数字化)。 通常,小的县级法院只有一个人专门处理家族史记载要求。在数码摄影、扫描软件、OCR(光学字符识别)技术上的进展最近才带来了成本。

为了创建家庭树,我们不得不成为历史学家、侦探、语言学家

早些时候,创建家庭树是一段孤独的路程,常常只有过度操劳的图书管理员或档案管理员在那,帮助我们,了解我们发现的东西。为了获得成功,我们还不得不掌握系谱学、历史学、世界大事件、过去200年的移民模式等广泛有效的知识。所有这些都发生了变化。

凯蒂已经创建了自己的家庭树,回溯了四代血亲,其中包括英国、希腊和德国祖先。使用Ancestry.com,凯蒂几乎完成了所有工作。“最开始的时候,我找到了一个人,他已经研究了我所在家庭的一个分支很多年,这是个重大突破。”找到另一个人——不管与她多么远亲——两人一起为同一个计划奋斗。她说,“这十分有用,快速追溯过去变得十分容易,这看起来超级浪漫,超级兴奋。”她喜欢在碎片化的时间里进行家谱研究:坐在长条凳上,看电视的时候。正是能够解决“这些小奇迹”,才使她养成了家谱研究的良好习惯。研究活动,帮助她暂时远离“现实生活”,她甚至找到了第三个表弟,他也在Ancestry网站上研究家族的某个分支。等他们来纽约玩时,她去看他们,还共享晚餐。在研究祖辈的网络世界,这种现象十分常见。

我们常能听到这样的观点,“所有人都相互关联”

在系谱学社区,我们常能听到这样的观点“所有人都相互关联”, 观点不完全错误:往前回溯10代,我们中的许多人会找到共同的连接点,但直到人们广泛持有互联网,并以所有有用的组织方式使用互联网,这个观点才变得正确。“看起来似乎互联网是为系谱学而生,”托马斯·麦克恩特说。他在盐湖城Radisson舞厅举办了自己的生日派对,这是RootsTech的第三个夜晚。这是一个大型的友好聚会,系谱学领域众多名人也纷纷参会:创建了Cyndi名单的Cyndi Howells也在那里,同行的还有FamilySearch和以色列企业MyHeritage的工作人员。托马斯认识所有人,社区人员联系紧密,每年在会议上相逢数次。

然而,其他时间里,他们在网上,通过互联网帮助挖掘其他。系谱学的核心是追寻、搜索——有时甚至长达数年——只为找到通往另一位祖辈人物的关键线索。搜寻工作当然本质上是无止境的:绝大多数人很幸运地找到了5代或6代人物图,到那时候,他们的家庭树将会囊括总计5000多人。

凯蒂的DNA

 

 

(图源:23andMe)

在互联网的早期,系谱学家见面的最佳场所是邮箱列表和留言板,在那里,他们集中资源,互相帮助寻找剪报或出生记录。1984年,后期圣徒出版了系谱学文件的公开标准格式,称作GEDCOM。元数据的纯文本文件可以将文件记录链接到其他文件记录中,GEDCOM可被不同类型的专有软件读取,并保留标准文件格式,到现在依然可以。这意味着可以彼此共享大量信息——他们的发现、他们的家庭——以一种简单、便携的在线方式。小型网站专注于单亲家庭或编制小镇上的讣告名单,并在网站上公示。有些人走遍整块墓地,记下每块墓碑内容,精心抄录并将其登载在网上。本质上受数据驱动的爱好不可能永远滞后。“我们知道这实际上可以赶上”,托马斯说,当然也的确做到了。到90年代中期,小型初创企业开始看到互联网可能意味着系谱学的巨大商机,后期圣徒会也注意到了。#p#

继续搜索

搜索是关键。Ancestry.com工程部副总裁斯科特·索伦森解释道,每次搜索结果都与元数据系列紧密相连——索引、基础信息如某个人的名字,也与高质量的文件扫描紧密相连,尽管该文件可能距今数百年。“我们拥有100亿份记录文件、4PB数据与搜索结果紧密相连”。所有搜索都可能挖掘到10或数百的结果,按照匹配度结果排序。随着每次的搜索,搜索引擎也得到改善:“消费者在网站上的所有交互行为,我们都能从中学习。使用机器学习技术,我们可以观察总体消费者行为,久而久之,就能改善我们的算法,因为他们持续增加数据架构。网站的用户,不断对文件记录进行评价,这样我们可以从中学习。”最后,通过消费者交互行为,索引与记录文件,同3800万个单个的用户创建的家庭树紧密相关,在不断扩展的庞大数据矩阵上,进一步连接到其他家庭树,数据则代表了人们的家庭。

那么记录文件从何而来?许多来自于后期圣徒会的家庭史图书馆。Ancestry.com与大型企业、中小型企业签订协议,付费后,方能访问有价值的记录文件。自从后期圣徒会“成为第一个吃螃蟹的人”后,在很多情况下,他们的数据相当有用——例如,将人口普查数据微缩影像化。FamilySearch CEO 丹尼斯·布林哈尔表示,由于FamilySearch是一家非盈利机构(作为教会的一部分),共享记录文件很简单。“我们对寻找记录文件的人很感兴趣,我们希望采用这些财务模型能有所帮助。使用我们的数据可能有效,因为我们并没有一个财务模型,但我们真正想要做的事情是让全球更多人可以使用更多的记录文件。”这个想法使多数的企业考虑到系谱学商机:访问时关键,不管什么人拥有什么东西,因此企业分享数据,而不是通过数字化冗余复制,互相逼迫,制造“双倍努力”。Ancestry.com也与非盈利机构、最大的犹太人家谱网站JewishGen,以及全球最完整的用户创建的墓碑抄录数据库Find A Grave建立关系。有些合作伙伴允许用户直接访问记录文件,不需要离开Ancestry网站门户;而有些合作伙伴,如英国重大记录和人口普查索引等,允许用户查看姓名和其他基础信息,但如果想访问实际图片,用户就需要前往该网站,接受网站的直接管理。

但同时,Ancestry在购买记录文件上也十分活跃。斯科特·索伦森表示,Ancestry每年花费200万美元购买新内容。在我们参观清洁图书馆的哪天,雇员们正在使用数码相机和专用软件创建高中年鉴的高分辨率浏览文件。年鉴对系谱学而言至关重要,托马斯麦克恩特表示,“因为年鉴是找到女性姓氏的好方法,已婚妇女经常冠以夫姓,确定女性姓氏比较困难”。Ancestry已经购买了大量的类似“次级”来源,如城市目录、电话薄和教会目录。一旦扫描图像,就能转录名称,嵌入元数据,同时将带索引的图像上传至Ancestry网站。Ancestry还收购了一些其他的系谱学和档案企业——小型竞争对手——以掌握他们的资源。2012年四月,Ancestry斥资10亿美元收购了Archives.com,同年10月,收购了照片数字化服务公司1000memories。

FamilySearc也拥有类似功能网站,一切皆免费。当然搜索功能不如Ancestry那么强大,他们的家庭树制作软件业不够健壮,但数据的大量收集每日递增,这一增长得益于超过15万个义务打字员,他们使用自己开发的专门的Java软件应用程序打字抄录。所有在家的人都可以下载该应用程序,在几分钟内,抄录一系列的出生、死亡或婚姻记录。这个过程被称为“索引”,是FamilySearch公司最珍贵最有价值的工具之一。每年通过其成熟的转录和索引系统,FamilySearch公司增加了4亿带有索引的有组织的图像。这家企业——过去通过微缩胶卷和CD刻录机分配其记录文件——现在可以轻而易举地快速移动,系谱学家可以完全使用数据。从掌握该领域图片到用户可以读取记录文件的处理过程,过去需要18个月,而现在,则只需要2个月不到,当然——是在线,而不是微缩影像。

 

 

家族史蕴含巨大商机

Ancestry.com和FamilySearch可能是在线系谱学领域最出名的企业,但到目前为止,他们并非唯二的两家,新企业正快速崛起,试图分一杯羹。MyHeritage是一家以色列企业,创建于2003年,运营服务更偏向于家族成员的社交网络——不管是过世的,还是活着的人——而不是传统的家庭树。该网站最近成功融资2500万美元,支持38种语言。MyHeritage早期重点关注东欧等地——Ancsetry实力较弱的地盘——MyHeritage向美国用户提供一些相当独特的内容,在市场上获得了很好的反响,发展迅速。英国的FindMyPast.com在美国也获得不错的进展,公司与英格兰、苏格兰、威尔士政府的独家关系从根本上为其提供了这些地区的重要记录的垄断优势。公司CEO克里斯·范·科尔同时也是4J工作室总裁,4J工作室负责制作游戏《上古卷轴:湮没》在索尼掌机PS3上的移植和Xbox版Minecraft游戏。他自我形容为“技术极客”,并从该角度思考系谱学。他很偶然地进入家族史行业,彼时,朋友请他申请某系谱学企业软件的一些用户体验创建技巧。5年后,他仍然在这个行业,执掌英国最强大的家族史来源。“授权技术后,越来越多的人获得正确的技术,并带来他们自己的数据和自己的经验,所有人就能在更大的范围内做得更好。我们的使命是创造最惊人的家族史体验,为尽可能多的人发掘他们的故事。”

到2010年,Ancestry已经与NBC合作,向主流美国观众推出《你认为你是谁?》的英国电视节目。节目特邀专业系谱学家与知名人物如莎拉·杰西卡·帕克、史蒂夫·布西密、斯派克·李等合作,开始他们的祖先故事搜寻之旅。2012年十月,Ancestry.com——这时已经上市——被一些投资者和欧洲私募股权机构Permira顾问有限公司以16亿美元的金额收购,其中包括公司CEO蒂姆·沙利文。确实,家族史蕴含着巨大的商机,但在线搜索文档并不是知道我是谁的唯一方法。如果我们想严肃思考、放眼未来,那么我们不得不丢开某些东西。#p#

一模一样:DNA解决问题

在山景城,谷歌总部的角落附近,坐落着23andMe公司总部。2006年四月,一小群人创建了这家公司,其中就有生物学家安妮·沃西基,她嫁给了谷歌联合创始人谢尔盖·布林。23andMe是一家个人基因公司,主要目标为让人们自己掌握自己的健康,公关总监凯瑟琳·阿法连介绍到。尽管这听起来只是个简单的愿景,在短短几年前,却是闻所未闻。

出于对科技与自己最近的研究发现间的匹配度的好奇,凯蒂最近接受了23andMe的DNA检测和Ancestry公司的DNA检测。她注册了网站账号,预定DNA测试,等轮到她后,输入网站的条形编码。八周后,个人祖先与健康结果显示在她的收件箱中。

测试推出后,售价为999美元,相当便宜。但考虑到所有情况,也不是任何人都能买得起。去年12月,自宣布已经积累了18万个DNA检测数据库后,23andMe将检测成本永久降低至99美元,以获取大笔融资,并宣布今年目标为积累100万个检测数据库。尽管仅有2%的美国人接受了类似检测,23andMe的研究表明,近71%的人虽没有接受检测,但他们很有兴趣。

DNA如何继承

 

 

Ancestry和23andMe的系谱学DNA结果都有相似性能。一旦处理结果——两家企业都将测试结果传给实验室萃取,然后进行室内研究——用户可以登录账号,查看祖辈DNA的近似组成,可追溯至500年前。例如,如果我们的祖父母是波兰和爱尔兰混血,那么我的DNA结果不一定密切反映这一结果,但他们告诉我们10代以前的家人来自哪里。两种测试的结果都以地图形式展现(如图所示)。“有点混乱,Ancestry测试显示我有17%的斯堪的纳维亚DNA,但我的研究中并没有发现任何斯堪的纳维亚人。”凯蒂表示,这打开了系谱学家追求的过去被忽视的领域新大门。

尽管23andMe在线推送某些祖先结果,其“祖辈组成”功能——在22个全球人口基础上,提供了相当明确、先进的信息——2012年8月推出,3个月后,Ancestry.com也推出了新的DNA检测功能。23andMe和Ancestry.com现在都提供一样的测试类型:正染色体DNA检测提供所有人的具体的祖先信息。早期女性检测只能测试MtDNA,且只提供来自母亲的祖辈结果:实在是很不具体、不实用。两家企业推出更强大的检测后,成本骤降,意味着更多的人会去注册账号、检测DNA。今年3月,Ancestry宣布其数据库已拥有12万多个DNA检测结果。

但怎么进行分析呢?意料之中地,分析很复杂,而且很无趣,23andMe高级研究总监表示。基本上,我们的DNA检测使用数百个“记号”,并与全球系谱学人口的常见“记号”进行比对。有些记号与特定地点有很强的关联性,结果也会更加可靠,然而有些记号——比如与中欧、法国、德国有关的信号——则远没有那么可靠,很难做出高准确度的区分。处理过程则更加负责,事实上,在几个世纪内,随着人们不可避免地迁移和移民,现在活着的多数人拥有多种祖先。

因此,如果我们做了检测,我们的DNA将与一整套的“参考”测试进行比对,参考测试收集了数千个人的DNA,他们资料完善,有较精准的系谱学位置。在最简单的模式中,DNA与这些参考数据集匹配的地方,可以推出祖先来自那些区域的百分比。

23andMe和Ancestry.com的DNA网站次级却可能更强大的功能提供了一些其他完全类似的比对方法:向用户展示可能与他们有亲戚关系的做了同样测试的人。两个网站都提供匹配度的可靠性比例,因此,举例来说,匹配度可能表明“有95%的可能性表明,某位成员X是四代或六代表亲。”如今,六代表亲是很远的远亲,但二代或三代表亲(Ancestry.com检测的许多人,找到了1至2个有如此近亲关系的人)就不一样了。二代表亲是我们一代表亲(父母的兄弟姐妹的孩子)的孩子;三代表亲意味着你和其他人的曾祖父母是同一个人。平均而言,23andMe表示,参与检测的每个人都能在数据库中找到1000多个基因匹配。用户可以选择联系他们——先匿名——来进行信息比对。很显然,参与检测的人越多,找到匹配的人越多,匹配的准确率也随之提高,因此,两家公司都大力推动越来越多的人参与检测,也帮助解释了最近的大减价行为——永远的降至99美元。

我们正在接近未来过去祖先的奥秘将不复存在

“我们可以创建一个全新的市场,客户们可以发现家族史,无需研究老的历史文档,”蒂姆·沙利文把最近的发展称作是“人类基因学的革命”。Ancestry.com直接将用户DNA检测链接至家庭树上,23andMe功能没那么强大,但也允许用户将GEDCOM文件上传至网站,同时将数据链接至家庭树上。系谱学的个人DNA检测至今仍不普遍,也没能发挥其全部潜能,但未来已不再遥远。

但对于只喜欢挖掘文档(无论是线上文档还是线下文档),搜寻任何能他们与过去相连的细微线索的人来说,这又意味着什么呢?在最短的短期内,搜寻工作还会继续。但是事实上,接下来的5到10年,知道哪怕几代以前的祖先是谁,会变得越来越简单,只需相对较少的努力:系谱学疑惑是技术可以解决,且已经奠定了基础的问题。在更远的未来,完全可以相信类似“谁是我的曾祖母”这样的血脉问题将不复存在。Facebook等社交网络为未来亲属关系文档奠定了基础,他们扮演着至关重要的角色——我们创建了比过去多得多的数据。不难想象到,我们多数人的祖先的奥秘未来将不复存在。

所有的数据引领我们了解到的所有的“故事”。我们不仅仅通过图表上列出的出生证明、出生日期与过去相连,还通过在我们之前的人的故事,与过去相连。过去10年,系谱学作为一种爱好,已经获得了成倍增长,则归因于大量的可搜索数据累积在互联网上:通过Ancestry.com等企业、通过政府、通过个人。这股潮流未来只会加速发展,人们能更方便地在有限时间或资源内研究系谱学。凯蒂表示,“对我来说,我很快从意识到’他们是我的亲戚’中脱身,只一心去发掘那些还活着的人,从中学习历史。我都没法想象‘啊,我找到了我想要知道的所有事情,这是个秘密’。”很不幸,对于那些热爱搜寻的人来说,未来就是一次减少奥秘的旅程。

责任编辑:王程程 来源: 中云网编译
相关推荐

2012-02-29 08:48:43

大数据非结构化数据

2018-03-28 14:58:42

虚拟机内核系统

2015-07-28 13:36:19

互联网互联网+

2020-04-22 10:15:33

DNA数据存储

2015-06-08 10:22:40

基因亚马逊谷歌

2021-03-07 22:27:23

大数据网络视频

2016-11-07 12:30:59

大数据互联网

2011-07-01 14:21:22

2011大数据世界论坛大数据云计算

2017-11-06 13:39:20

大数据隐私个人信息

2017-07-10 10:15:34

2015-07-20 16:32:27

大数据新时代

2013-04-27 14:39:40

大数据全球技术峰会

2013-08-05 10:19:34

小时代电影大数据

2020-03-27 11:39:24

大数据云计算综合科技

2010-09-25 10:56:32

WebLogicJVM

2022-02-08 11:31:23

Linux端口命令

2022-01-13 09:58:26

Linux端口命令

2022-09-16 10:01:58

编程

2018-01-11 16:17:12

物联网大数据Hadoop

2012-12-11 10:39:08

点赞
收藏

51CTO技术栈公众号