1996年,万维网联盟(W3C)主管Tim Berners-Lee为现代语义Web技术定义了如下远景:如果人们与超文本之间的交互能够变得更为直接,进而机器可理解的信息空间能够准确描述人类思想、交互和工作方式的状态,那么机器分析就会变为非常强大的管理工具。而且,如何通过典型问题来洞悉我们的生活方式和促进我们之间的协作是困扰大型机构的管理问题,而语义web为此提供了很好的解决方案。
15年之后,语义Web开始应用到多个领域,从艺术馆的信息化到乳腺癌的研究,涉及领域极为广泛。尽管语义Web远景要在全球实现尚需多年的发展历程,但是很多著名的IT部门已经越来越多的采用语义标准,并且当语义Web逐渐成为Web之后,希望通过语义技术产品来为企业获取利润。这一技术趋势将持续不断地刺激各个行业,包括金融、医疗器械、通信、生命科学和人工智能领域。事实上,我认为2012年将成为语义Web之年。
2011年有三大例证可以说明语义技术在商业和文化领域的影响力正不断增长,而且更重要的是当今社会已经发展为一个数据驱动的世界。
1、通信领域的例证——Siri
虽然您并不知道谁的圣诞礼物单中有iPhone 4S,但是事实却是苹果公司在截止12月的***个季度就销售了3500万部iPhone手机。而且据测算,2010年苹果还将销售1.25亿部手机。因而,有很多人就可以与自己谈话,我所指的是iPhone手机上的语音助手Siri。它是一个帮助您安排饮食起居和各种活动的虚拟仆从,还能够为您导航(真希望能比我的GPS好用)。您所需要做的就是通过语音、点击或者输入发出指令,这位小助手就会帮助您从一些相关网站搜索信息,帮助您完成决策过程。它甚至还可以为您预订餐馆或飞机票。这就是为什么Siri和其他一些功能在数据使用量上是上一代iPhone模型的两倍多。iPhone 4S甚至使用了比iPad更多的数据。
Siri的共同创始人、***技术官和副设计师Tom Gruber是语义Web领域的一位先驱者。他是使用Web来收集和共享信息的领跑者,他因为从技术和计算机科学的角度给出了“本体”的定义而被世人所铭记,他也是***位将本体称之为知识共享技术的科学家。Gruber建立了DARPA的知识共享库,并且是一位卓越创新的思想家,跻身于语义Web奠基人和开拓者的行列。
2.企业领域的例证——Best Buy
2009年12月,Best Buy的总开发工程师Jay Myers为商业数据和语义给出了一个战略性的公式。这个公式涉及到三个圈子,前两个圈子之和等于第三个圈子:外部接触的开放互联数据+内部互联数据=洞察力。他解释说:外部数据圈表示您希望所有人都能访问到的那些人和机器都能够理解的数据,在Web上与之相关的***的工具是RDFa,这种方式使用经过标注的富语义的HTML来将数据交付给机器,而同时人类用户仍然能够访问那些他们早已习惯的可视化的网页。在语义标记技术中最棒的前端技术是一款需要一点额外知识的小工具,它能够帮助数以万计的HTML开发人员创建出一个语义非常丰富的数据网络,他们所需要做的只是通过加入数据标注的方式来使自己的HTML语义更加丰富。这样就能够使整个网络成为一个开放的、可查询的数据库或者API,我们可以从中方便地抽取自己需要的知识。
这样的战略成功了吗?根据SearchNewsCentral.com 的 Doc Sheldon 对Jay的采访(RDFa: The Inside Story From Best Buy):确实如此。Best Buy的这位总开放工程师说:仅仅在两个月之内,我们就发现组织搜索的结果开始增长。不久以后,就已经比历史水平增长了30%。我们也发现点击率有所提升。Yahoo做了一项调查发现访问过搜索页面的人回访的点击率提升了15%,这已经证实是我们所起到的作用。当然,使我们的站点更加智能、更易于机器理解,最终将使用户受益。
3 博物馆信息学的例证——安娜波利斯历史基金会
***,看看最近马里兰州***安纳波利斯的博物馆和我的技术公司Orbis科技的合作。我们的工作主要放在如何将语义应用交付给国防部和面对互联网数据难题的商业客户。然而,我们也可以利用自己的技术实力来提升艺术界的展览水平。在一场举行了数月之久的展览中,我们和安纳波利斯历史基金会一起协作,将安娜波利斯1700到1810年之间的各种收藏进行了展示,尤其是一些肖像艺术家、银器匠和木工。
Orbis主要为这场展览创建了交互式的知识应用,使得同一艺术家或者图片的信息能够相互参照。例如,当点击名为William Faris的银器匠或者木工John Shaw,人们可以访问与这位艺人相关的各种信息。在数百万的用例中,语义技术被用于创建不同数据之间的关联,而这些用户感兴趣的数据可能是实例、工匠和对象。
语义技术能做什么?
当然,这些主要的语义技术应用都共享着公共的组件。成功的实现通常有很容易理解的过程工作流来支持固定产品的生产。较为特殊的是,领域/工业界词汇通常需要结构化、半结构化和非结构化的数据。这些典型项目和正确的产品相结合后能够创建出更多成功的语义技术驱动的项目,它们显示出巨大的价值并且随后会带来投资。
换言之,***的状态是这样的:***项目典型已经有了,语义技术能够解决和大规模数据集成工作和数据过载问题(也就是数据太多而造成无法获得使用的信息或者真正的知识)相关的公共基础问题。核心语义技术标准(即RDF)以一种能够对人类认知进行建模的格式描述了数据之间的关系,进而产生了促进人类决策过程的信息。
语义Web使我们能够将自己的大脑更多的投入到需要人类认知的工作和任务上——将那些像线路检查和数据抓取这样繁琐无聊的工作交给机器,而且机器并不会脾气暴躁,也不需要喝咖啡。
这就是为什么说2012年是语义Web之年。
原文:http://article.yeeyan.org/view/281562/249578
【编辑推荐】