Web3.0、关联数据和语义网-web 数据库

Web 3.0: Web 2.0之后轮到谁？

Web 3.0无法解决信息超载问题。至少现在还不行，因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据，需要很长的时间才能将这些数据结构化。

去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱，让所有人随时随地地联系在一起，让整个网络更加智能。”

至少我认为，如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络，那么Web 3.0则意味着开放和结构化数据，让网络更加“聪明”。

关联数据（Linked Data）: 结构化数据，但不一定是语义数据

Greg Boutin第二篇文章谈到了关联数据。他认为关联数据提供了关联结构化数据的新媒介，可以让机器更好地读取这些数据。但是，关联数据本身不会给信息增加任何语义含义，而是更好地携带语义数据，供用户访问。所以，关联数据虽然本身并不具备语义特征，但它可以在数据层面建立关联，为真正的语义网铺平道路。

关联数据这个概念来自W3C,该组织有一个关联开放数据（LOD）项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的Open Calais项目 , Freebase, 和DBpedia。这些数据集是在现有本体论（ontologies）基础之上建立的，如WordNet,FOAF, 和SKOS，然后在它们之间建立关联。

Greg Boutin在其第三篇文章中写道，关联数据格式不会创建智能数据，仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。

语义网：Google唱主角

那些以上这些趋势会如何影响语义网呢？Tim Berners-Lee 认为语义网可以用于商业目的，但现实却是，目前使用资源描述框架（RDF）的实际应用寥寥无几。

但是 RDFa（允许发布者把RDF嵌入到HTML）带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa，而雅虎早在去年就大胆地推出了搜索猴子（Search Monkey ），达到了同样的目的。

Google将在语义网主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单，它早就在研发语义技术了。

Google也并非没有竞争对手。除了雅虎，微软去年夏天收购 Powerset也是瞄准了这个市场。

结论

Web 3.0是一个没有统一定义的词语，或者根本不应该这么称呼。但是很显然，结构化数据时代已经到来。我们从当前的关联数据热潮中就可以看到它的影子，并且得到了Google和雅虎瞪大公司的支持。谁知道呢，或许语义网也就在隔壁不远处。

【编辑推荐】