1、先进的网站检索和抓取技术 利用Windows内核技术,智能化的对网页进行检索分析,快速并发的检索算法能够提高检索效率,自动过滤掉不需要的内容,对于敏感信息下载到本地保存,作为取证。采用多线程并发处理,可以最大限度的兼容各种类型的网站。并可在以后升级版本中支持https和通过代理对网站检索和抓取。 先进的下载调度管理和内存组织,用非常少的内存可以同时并行检索多个网站,自由进行关键字的组合。 2、多任务灵活调度 在系统中可以同时建立多个检索任务,对于每个任务,都可以按照执行时段、次数、日期等进行灵活调度。 3、输入关键字的多重组合 通过用户输入的关键字建立关键字库,库中的关键字能够通过and、or进行自由的组合,以确保网页检索的准确性。 4、强大的信息处理能力 本系统的软件开发充分考虑了与系统硬件的匹配,便于获得一个最大化的检索和抓取能力,在网络接入带宽满足系统要求的时候,峰值处理能力可达100万网页/天以上。 5、完善的报表分析能力 对于用户提交的每一个任务,在执行完毕后,都会提交一个任务执行情况的报表,包括:不良网页的详细地址,文件存放的位置,出现的关键字内容,以及该关键字出现的频率等。 6、便捷的关键词库、地址库管理 系统可将用户常用的关键词、关键字、IP地址、网址存储在系统数据库中,在以后的任务编辑中不需要再次手工输入,只需在关键词库或地址库中直接调用就行。 7、层次化用户管理 系统用户分为管理员用户和一般用户两组,管理员用户拥有系统全部权限,一般用户只具有任务的执行、查看权限。 8、全面的系统数据维护功能 为了防止系统及数据库的意外损坏,便于用户对系统的重新安装使用,数据库备份功能可以对系统中建好的任务、关键词库、网址库及用户信息进行导出备份,系统安装好再导入即可使用。 9、本地文件的二次检索能力 系统将每项完成的任务行结果下载保存在本地,及时地获取到非法信息证据。并可以对本地内容进行再次统计查询,可按任务标题、时间段、关键字、URL、IP等查询条件及上述条件的组合进行二次检索。达到对本地信息再次过滤的目的。 10、远程访问功能 整个系统采用浏览器/Web服务器结构。Web服务器采用IIS 5.0,浏览器为IE6.0以上版本。所有的用户界面均采用Web页面的形式进行体现。在网络上,只要拥有账号/密码,任何一个用户都可以通过IE来访问系统。