数据和知识是所有企业的核心资产。现代搜索引擎可以利用这些知识,这样员工就可以找到它的源头和内容。企业可以构建一个强大的搜索引擎,并且专注于企业的应用领域、用户角色和业务目标。
2016年初宣布了谷歌搜索的消亡,这标志着错误的企业统一搜索解决方案的梦想终结。取而代之的是愈加智能化的搜索引擎,这些应用程序可以搜索、分析和评估企业信息。这不仅与传统文档中的搜索有关,还涉及数据库中的数据和语义图中的实体和联系。收集所有来自于企业内部的信息,再加上来自外部环境的其他数据,汇集后在搜索、分析和评估的应用程序上进行分层计算,即形成了企业级搜索应用的新世界。
随着应用系统越来越复杂,信息量越来越大,传统的关键字搜索技术已无法满足企业对海量数据和各种文件类型的定位查找。为解决这一难题,本文详细讲解了启动企业搜索项目需注意的10个要点。
要点一:要有雄心 可以比谷歌做得更好
许多搜索研发团队对谷歌在网络搜索方面的成就感到畏惧。但只要有雄心,同样可以做得更好!谷歌拥有优秀的技术、硬件和一支高精尖人才大军,每天都要提供数以十亿计的搜索服务。但是企业拥有所有信息:各类文档、产品、内部网站和客户数据。且企业对于自身发展领域、用户角色和业务目标都有更为深度的理解,亦或亲自同用户进行交流。虽然谷歌可以在网络上大行其道,但搜索研发团队却可以深化应用到企业中去。
要点二:处理搜索
当用户在文本框中输入几个单词时,这对应用程序来说是一个挑战,它要找出用户真正想要的信息。使用搜索技术,例如词干、同义词、范围不同的关键词,以确保找到所有正确的信息。然后应用语义图关联现实世界的语境,就像要求一位知识渊博的图书管理员寻找一本书一样。帮助企业了解用户想要的拼写检查以及自动完成的检索推荐等。搜索引擎在实际使用上为用户提供一目了然的结果摘要,并在适用范围内指导用户以高效的方法搜索。
要点三:处理数据
注释数据,以便快捷地找到它。添加元数据:发布日期、作者、关键词和出处;查找并注释实体和属性:人员、地点、公司名称、信用卡号码等。随后,将每个文档添加标记并划分不同的权限,使搜索进程快速得到响应。
要点四:获得更优的搜索结果
搜索结果页面不必仅是链接列表。要使每个搜索结果尽可能包含丰富的信息:链接、与搜索关键字匹配该网页的文字摘要和一些元数据(较晚抓取页面的时间、网页文件概况、相关关键词的其他网站链接和其他相关信息)。为了获得更优的搜索结果,需考虑使用包含图片信息的卡片。当这些卡片式信息具有自然属性的分组时,最终搜索结果可通过不同页面跳转相连接。添加关于整个结果集的信息:一个信息面板,描述搜索中的主要术语、方面和一些图表。
要点五:切忌重复同样的搜索
针对每位用户最喜欢的搜索集,在他头一次登录时的搜索框上显示结果摘要。如果用户需要知道一些新的信息,比如:每当有关于止痛药对网球肘影响的新研究,一旦发现与搜索结果相匹配的信息,即刻返回系统一封电子邮件或一条短信。
要点六:跟踪一切相关信息
跟踪所有搜索,并跟踪这些搜索的结果。搜索“成功”意味着对用户快速返回结果,点击最上面的结果,阅读并继续前进。如果搜索失败,调整应用程序、搜索处理和结果数据。通过以上方法调整搜索进程,可以考虑创建一个特殊信息面板或登录界面,并重新引导用户搜索。每日列出明细表,之后仔细排出优先次序。
要点七:不断改进 适应变化
用户的搜索量每天都在变化。数据也是如此,为搜索提供的一些背景环境也发生着变化。每天改进搜索,并不断寻找提高用户体验度的方法:为其提供更加个性化、智能化和数据可视化的建议。
要点八:不要忘记安全
一旦企业级搜索超越了内网各个部分的基础知识范畴,它就必须遵守公司的隐私和安全标准。理想情况下,搜索应用程序将置入到现有的安全基础设施之中。
要点九:听起来很难 但谷歌并不会这么做
谷歌网络搜索不需要处理安全问题,但企业级搜索需要考虑安全。相关其他的提示有:谷歌扩大搜索范围;绘制一个丰富的搜索结果页面,其中包含了每个结果和整体结果集的信息;跟踪每一条搜索和结果数据,以便更好地进行搜索与反馈。谷歌没有做的一件事就是注释数据;相反,它记录了网站开发者应该如何注释数据便于谷歌定位它。
要点十:最终如何完成搜索引擎的架构?
找到支持搜索应用的程序,而不仅仅是搜索引擎。该平台必须支持上文中讨论过的所有技术,并且必须能够汇集各种信息——传统文档、数据以及语义图(实体和联系),这样机构就可以构建一个使用企业中所有信息的搜索应用程序。
【本文是51CTO专栏作者“李少鹏”的原创文章,转载请通过安全牛(微信公众号id:gooann-sectv)获取授权】