人工智能经过几十年的技术发展,它已进入一个崭新的时代——人工智能时代。在这一新时代,各种各样的研究成果不断涌现。就像中国科学家、未来学家周海中先生在上世纪90年代所预言的那样:“随着科技进步,人工智能时代即将到来;届时,人工智能技术将广泛应用到各学科领域,会产生意想不到的效果。”科学研究会经常遇到如何处理大数据的问题;下面就简要谈谈人工智能技术在科研大数据中的应用。
大数据(big data)又称巨量资料,指的是无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据的概念,对于不同的人有不同的理解;而目前适用于大数据的技术,包括大规模并行处理数据库、分布式数据库、数据挖掘电网、云计算平台、互联网、物联网、分布式文件系统和可扩展的存储系统。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。近年来,在人工智能技术的助力下,科研中的许多大数据问题得到了有效的解决。
例如,为了探索地外文明(俗称“外星人”),美国宇航局(NASA)前不久与英特尔、谷歌和IBM等科技公司展开合作,以开发先进的人工智能技术,这些技术可用于大数据分析,寻找外星人。当然并不是说,使用人工智能技术去“直接观看”外星人;而是分析太空探测器和天文望远镜所获得的数据,来识别地外行星的图像、研究地质结构和化学性质等,看那里是否具备外星人存在的基本条件,以便探索结果更深入、更有效。有关专家认为,将人工智能技术用于分析海量的数据,确实是一个比较好的有关地外文明的探索方法。
又如,1972年,美国生物化学家、诺贝尔化学奖得主克里斯蒂安·安芬森先生在获奖感言中提出了一个假设来说明酶进行化学合成的可能性。这就是著名的蛋白质折叠结构预测;由于它的计算难度很高,计算量也超级巨大,计算结果的准确度始终无法超过做实验得出的结果。这个假设成了生物化学方面近50年来一个重大难题;该难题最近被谷歌DeepMind推出的AlphaFold破解了。此消息一出,立刻被《自然》(Nature)、《科学》(Science)等多家杂志报道。有专家认为,这可能是首个有望获得诺贝尔奖的人工智能成果。
再如,在新冠肺炎(COVID-19)疫情期间,广大科研人员借助人工智能技术抗击新冠病毒,使这一高新技术在疫情中发挥了前所未有的能力。他们通过新冠患者的数据了解到潜伏期、临床特征,为新冠早期症状鉴别起了很大作用;他们根据大数据做出新冠疫情的预测模型,为政策制定提供了重要依据。比如中国香港理工大学及澳门科技大学根据有关数据,研发出能快速诊断新冠患者的人工智能系统;只需20秒便能断症,并预测患者病情是否会恶化,准确率达90%以上。
从上面列举的实例可见,人工智能技术可以在科研大数据中发挥巨大作用。随着科研工作量的增大,数据的规模也成倍增长;在现有的科研环境中,如何处理长期积累的历史数据,分析日常值守的实时数据和预判将要发生的事件变得尤为重要。完全可以相信,有了人工智能技术助力,今后科研中的大数据问题将会迎刃而解。