马斯克点赞SpaceX天才实习生:课余用AI破解上古卷轴,获Nature头版关注

人工智能
直到今时今日,三名大学生,终于借助AI的力量,成功破译了其中的段落,打开了全新的考古研究范式。他们通过给卷轴拍摄CT影像并借助机器学习技术分割识别,把卷轴中的2000余个字符,揭示开来。

Nature官网头版,最新刊发的是最新考古成果,轰动全球的成果——

时隔2000年,上古卷轴(赫库兰尼姆卷轴)的神秘面纱,终于被揭开!

而且,这项研究还是AI完成的,背后的背后则是一名年仅21岁的天才少年,马斯克点赞的SpaceX实习生。

图片

不同于一般的密码破解,分析这份卷轴之难,无异于解读一本“无字天书”——

因为在公元79年,这组卷轴在一次火山爆发中被烧成了碳,1752年才被挖掘出土。只要稍有不慎,脆弱的卷轴就会分分钟变成残片,想要通过物理方式展开,难如登天。

图片

直到今时今日,三名大学生,终于借助AI的力量,成功破译了其中的段落,打开了全新的考古研究范式。

他们通过给卷轴拍摄CT影像并借助机器学习技术分割识别,把卷轴中的2000余个字符,揭示开来。

这一消息也迅速引发了全球轰动,目前为止,浏览量已经超过了1500万次,转评赞接近6万。

图片

马斯克也给三人团队点了赞,表示这实在是泰裤辣。

图片

DeepMind的创始人Demis也大为赞叹,还表示自己已经迫不及待地想要读一读这段神秘的文字了。

图片

那么,这份神秘的卷轴是如何一步步被破译的呢?

不用打开,也能破译内容

交出这份成果的,是三名学生组成的队伍,他们分别是:

  • Youssef Nader,来自埃及,在德国柏林的一家院校攻读博士
  • Luke Farritor,SpaceX 实习生,在内布拉斯加大学林肯分校计算机专业读本科
  • Julian Schilliger,瑞士苏黎世联邦理工学院机器人专业硕士

图片

想要在没有损伤的前提下破译这团被烧成碳的卷轴,打开看几乎是不可能的。

1865年,有人尝试用物理方式把卷轴打开,结果以失败告终,一部分卷轴直接成为了碎片。

此后近两百年,便再也没有人敢尝试物理展开了。

图片

直到2019年,肯塔基大学EduceLab的Brent Seales教授通过粒子加速器给卷轴拍摄了分辨率高达4μm的三维CT影像。

Seales教授的博士生Stephen Parsons长期致力于使用机器学习模型检测CT图像中的墨水,他利用已经展开的部分带有可见墨水的卷轴碎片,建立了一个ground-truth数据集。

图片

网友们对此事展开了热烈讨论,并通过一场播客中传到了Luke的耳朵。

这引起了他极大兴趣,开始利用空余时间训练机器学习模型,以便对墨迹进行分析。

图片

最终,Luke的模型成功分析出了卷轴中肉眼不可见的符号,并发现了一个完整的单词。

这个词是希腊语的“ΠΟΡΦΥΡΑϹ”(小写:πορφυ̣ρ̣ας̣,拉丁转写:porphyras),意思与“紫色”相关。

这一发现,让他成为历史上第一个从赫库兰尼姆古卷内部读出整个单词的人。

图片

Youssef是第二个破译出这个单词的人,他采用了不同的方法,但得到了内容相同且更为清晰的结果。

也正是看到Youssef提交的结果之后,专家们对Luke的发现,更加确认了。

图片

Julian则参与研发了EduceLab的3D模型分割工具Volume Cartographer。

Volume Cartographer将三维CT图像沿卷轴展开,并映射到了二维平面,为Luke和Youssef的破译工作奠定了基础。

此后,Julian又提出了新的分割方法ThaumatoAnakalyptor,通过重新分割的方式对已破解区域进行了验证,并探索了更多未知片段。

此后,为了更快破译出更多内容,三人组成了超级团队,最终成功解读出了2000多个字符。

图片

他们使用了三种不同模型架构进行了分析,之间的结果可以相互印证,墨水检测程序代码还直接在GitHub上做了开源。

他们分析出的这两千多个字符,位于其中一卷的结尾,篇幅大约是该卷的5%,内容被认为与伊壁鸠鲁哲学有关。伊壁鸠鲁(Epicurus)是古希腊哲学家,主要关注个人的幸福和心灵的平静,但讲理性、在自然科学领域提出了原子论,对后世的伦理学和心理学发展都产生了重要影响。

而在这个卷轴的两个连续片段中,作者提及了商品(例如食物)的可获得性(availability)是否以及如何影响它们能带来的快乐(pleasure)。

所以这次考古发现,实际上或许能进一步帮助了解古人对于世界的认知和探究。

图片

一场挑战赛,三名学生,500万奖金

而让这三名学生走到一起的,是一场名为“维苏威火山”的挑战赛。

在Stephen建立了数据集之后,硅谷企业家、GitHub前CEONat Friedman对此产生了浓厚兴趣,并出资赞助了这场比赛。

主办方于去年3月公布了评选标准,参赛者需要破译至少4个段落,每个段落140个字符,其中至少85%的字符可恢复。

当时,专家组普遍认为一年之内有人挑战成功的概率还不到三成,但结果却出乎意料——

据介绍,比赛的消息发布后他们收到了许多作品,直到ddl之前几分钟还有团队交出成果。

经过为期一个月的审查,这份包含了2000个字符的文本,被认定破译成功。

图片

这三位获奖者将瓜分70万美元的奖金,折合人民币500多万。

此外,还有三个团队因提交的结果具有显著可读性,获得了二等奖,这三个团队将各获得5万美元的奖励。

其中就包括谷歌华人工程师Shao-Qian Mah所带领的团队。

图片

下一步,比赛主办方希望在一年的时间内破译四组卷轴的90%,后续比赛信息也将在3月份公布。

当然,这样的挑战赛奖金只是一方面,更重要的是展现了如何用AI解决各行各业挑战的可能性和可行性,包括考古这样的学科。

或许你也有所耳闻,更早之前,AI对于甲骨文的研究也开始了。你要还知道其他的项目?也欢迎分享分享~~

参考链接:
[1]https://scrollprize.org/grandprize。
[2]https://twitter.com/natfriedman/status/1754519304471814555。

责任编辑:姜华 来源: 量子位
相关推荐

2023-10-16 09:27:27

2024-02-06 14:10:00

2023-05-26 17:11:25

马斯克Neuralink接口

2023-12-13 08:46:33

人工智能ChatGPT机器人

2022-12-11 14:29:56

AI编剧台词风格

2022-01-23 10:53:47

星链互联网卫星

2023-07-25 10:08:16

2024-08-06 16:03:18

马斯克OpenAI人工智能

2023-10-25 11:05:54

深度伪造AI

2024-07-23 20:37:06

2024-02-26 18:30:17

2009-06-04 15:35:08

博克教育SAP行业实习生

2021-06-11 17:14:26

黑客马斯克加密货币

2022-04-15 10:55:59

Web3反垄断元宇宙

2021-01-12 15:20:39

AI 数据人工智能

2021-07-06 10:39:52

AI 数据人工智能

2023-04-18 15:03:24

模型数据

2024-03-18 14:17:06

大模型开源人工智能

2023-07-22 13:47:57

开源项目

2022-06-01 13:53:43

加密货币Deepfake
点赞
收藏

51CTO技术栈公众号