【51CTO.com 综合消息】UnisSISS互联网敏感信息检索系统使用了事件驱动的检测技术,提供了网页低俗内容、敏感信息检测功能,采用广度优先、目录还原、准确匹配等技术,协助监管部门进行检查,帮助网站所有者及时发现风险,改进网站服务质量。
对Web信息的合规性进行人工检查和审计是一项复杂且耗时的工作,不仅需要极大的耐心还需要一定的技术经验。对于一般的Web管理人员来说,基于内容的合规性管理将占用大量工作时间。自动化的检测工具能够大幅简化对于不良信息的检测工作,有助于Web管理人员将精力转向如何处理上。
UnisSISS 专为当前复杂的Web环境而设计,作为自动化的Web敏感信息检测工具,适用于网站所有者进行自查、IDC进行检查、监管部门进行检查等。
一、安装部署
1.安装需求
表1 |
2.安装过程
◆获得产品
从产品提供商获得产品及使用手册。
◆安装
运行安装程序,直到安装完成。
◆提供必要的注册信息
在“关于”->“用户注册”对话框中获取系统信息,并提供自己的名称和网站域名授权信息。
◆获得许可证
从产品提供商处获得许可证。
◆注册
在“关于”->“用户注册”输入“用户信息”和“注册信息”。
◆升级插件
在“关于”,点击“升级”,更新不良信息库、规则库到最新版本。
3.卸载
可以在“添加/删除程序”中卸载程序,也可以在开始菜单中通过快捷方式进行卸载。 #p#
二、使用说明
注意事项:根据中华人民共和国相关法律规定,本产品只适用于已获得扫描授权的网站。任何违反法律规定的行为由使用者自行承担,与UnisSISS及开发者无关,特此声明。
1.向导
为了方便用户直接使用本产品的功能,UnisSISS提供了使用向导,只需您填写或选择一些必要的信息,就可以快速开始(按照系统默认配置,适用于大多数的应用环境)进行扫描。
2.网站扫描
低俗信息检测系统部署配置:
确保该系统可以访问所有需要监控的WEB服务器
在系统配置界面选择工具栏按钮“新建任务”,系统弹出如下向导对话框
图1 |
按照向导进行下一步操作,填写任务的基本信息(如下图),最简单的方式直接输入需要检测的URL在起始URL输入框中,即可。
图2 |
也可以通过任务基本信息获取工具来获取任务的相关信息(一般当网站需要认证时使用该工具),该工具是一个内置的网站浏览器,可以随时保存会话信息。
图3 |
接下来继续下一步,输入检测的域名范围,一般为需要监控网站的域名。如果需要全站检测,则选择爬虫级别为0,否则可以选择只检测几层的网页;
图4 |
下一步是要设定检查策略,当要检测页面正确性的时候,一定要输入确认页面正确的关键字,以;隔开
图5 |
接下来选择,任务执行的时间周期及具体时间
图6 |
最后输入该任务的名称
图7 |
如此循环将所有要监控的网站都创建相应的监控任务。
点击工具栏按钮“开始”,开始监控所有网站。
3.设置
通常情况下,软件已经默认定制了通用的扫描方式和属性,适应大部分网站扫描。如果遇到一些特殊情况,可以通过设置来定制扫描方式和属性。
3.1 HTTP选项设置
图8 配置选项 |
◆UserAgent:扫描网站时在HTTP头设置UserAgent的字符串,如果某些网站限制特定UserAgent的访问,则需要修改默认值。
◆页面大小:当遇到过大的网页或者其他文件时,网页爬虫就不需要获取,如,爬虫爬到某一比较大的avi文件时,就不需要获取其详细内容。
◆网络超时:您可以灵活设置。
3.2爬虫设置
图9爬虫设置 |
◆文件后缀过滤:爬虫遇到一些二进制文件,由于其中不可能会包含下一级的链接地址,因此不需要获取其具体内容。
◆表单内容填写:当爬虫爬到一些需要用户输入的表单内容时,爬虫需要自动填写的内容,软件默认值为:1