早在一年前,美国国防部先进研究项目局(DARPA)曾透漏过一个秘密项目——一款新型搜索引擎,通过深度挖掘暗网(Dark Web),获取Google搜索和其他商业搜索引擎未能涉及到的所有隐秘信息。现在,它已经悄然问世。
科普:什么是暗网
暗网并非十分庞大,甚至没有想象中那样特别的神秘。事实上,所谓“暗网”都是公共可见的网站,但却将真实的服务器IP隐藏了而已。这意为着,任何人都可以访问暗网,但“暗”就暗在这些网站隐藏极深,难以调查的幕后。
神秘的“暗网搜索引擎”
暗网搜索引擎项目被命名为“Memex”,测试显示项目运营效果良好。
上周日晚,Memex首度亮相于公众,我们有幸抢先一睹这款特别的搜索引擎的风采——这是一款以打击犯罪为目的搜索引擎,美国国防部五角大楼的研究机构批准Scientific American新闻网预睹其真容,然后让60分钟节目组独家对这款新技术的结晶进行了视频报道。
Memex这个单词来自于记忆(memory)与索引(index)的组合,它基于开源的数字可视化搜索分析程序,通过与后端服务器软件交互,完成复杂的计算和数据分析。
通过用户搜索的信息,Memex搜索引擎会对相关内容进行抓取。经过爬虫对页面内容的递归获取,有效地识别不同数据块之间的关系。研究人员能够利用搜索到的空间和时间的数据构建数据图,进行可视化分析。
视频介绍
下面附上的视频能给各位FreeBuf读者更直观的感受和理解。
暗网是一个遍布妇女儿童绑架、色情信息、毒品交易、网络犯罪和人口贩卖的邪恶聚集地,但是由于暗网的隐秘性极高,所以它能轻易躲避主流引擎的搜索。
当然,随着暗网搜索引擎的诞生,相信它们的好运也就到此为止了。
设计理念
暗网搜索引擎Memex用于保护网络免受黑客、人贩子或者其他类型罪犯的的侵害。它的设计理念即:扩展搜索引擎的能力,根据特定人物的兴趣迅速进行信息的全面整合。
Memex搜索引擎的研究发起者Chris White等人详谈了整个暗网搜索引擎的工作原理,以及它是如何帮助执法机构进行调查的。
White表示:“互联网比人们想得要复杂得多。据统计分析,Google、微软bing以及雅虎搜索,只收录了网络上大约5%的web内容。”很明显,这给网络犯罪留下了很大的潜在发展空间。
在上述有关Memex搜索引擎的视频片段里,大家还能看到美国国防部先进研究项目局的Dan Kaufman。这位主管在视频里表示:“Memex的理念简化来说就是——如何挖掘不易被发现的东西。”
White严肃地说:“大多数网民都是守法公民,但是也肯定会存在一些网络寄生虫。我们会剥夺其利用网络侵害我们的能力,创造一个更加美好的网络环境。”
项目进度
Memex如今还处于beta阶段,现有一个政府机构和一个非政府组织负责测试。当然,在几周后的下一测试阶段,Memex还会扩大内测范围。
“这一轮的测试,其中一个主要目标就是分析照片。比如对于毒贩面部的匹配,或者是根据图片背景中电视屏幕映出图像,进行模糊搜索匹配。另一个目标,则是尝试用不同用户界面,尝试使用流媒体结构来评估时间敏感的数据。”
这意味着在暗网搜索引擎Memex的帮助下,美国国防部先进研究项目局(DARPA)有可能会根据图片中电视屏幕的上的倒影图像,通过图像模糊匹配技术进行分析定位,在使用一定手段确认后对罪犯实施抓捕。
这听起来似乎如好莱坞电影一般富有奇幻色彩,不过Memex团队强调,这一切“黑科技”本意只是降低犯罪率,而不是侵犯大多数人的隐私。