预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于BHO的网站过滤系统研究与实现 概述: 现代社会,人们越来越依赖互联网,因为它具有获取信息快速、便捷的优点。与此同时,互联网上存在许多不良信息,如色情、暴力、赌博等等,对青少年的身心健康产生了不良影响。为了保护青少年免于不良信息的影响,各国政府和社会组织都开展了相关工作。其中,网站过滤系统是一种较为有效的方式,其基本原理是利用软件技术对互联网上的网站进行检测,对包含不良信息的网站进行过滤。 本文主要介绍了一种基于BHO的网站过滤系统,在介绍系统的整体结构之前,首先简要介绍了BHO技术的工作原理。然后详细阐述了过滤系统的设计思路,包括用户数据获取、过滤器设计、过滤器实现和数据存储等方面。接着,介绍了系统的具体实现过程,并对系统进行性能测试。最后,本文对系统的优点和不足进行了总结,并对未来的工作进行了展望。 一、BHO技术的工作原理 BHO全称为BrowserHelperObject,是IE浏览器提供的一种插件技术,可以将一些额外的功能集成到IE浏览器中。BHO技术是通过Windows操作系统中的COM(ComponentObjectModel)技术实现的。其主要工作原理如下: 当IE浏览器启动时,它会检索注册表和Windows系统文件夹,查找所有安装在IE浏览器中的插件。找到特定的BHO插件后,IE浏览器会在操作系统中注册该插件。从此以后,每次打开IE浏览器时,该插件都会被自动加载。 在IE浏览器正常工作中,BHO插件会不断地接收浏览器发来的事件,例如页面加载、URL改变、鼠标点击等等。它可以利用这些事件来执行一些操作,例如在页面上显示特定的HTML元素、发出HTTP请求等等。 BHO技术是可以通过一些常见的编程语言进行,在实现过滤系统时,我们选用了C++语言进行开发。 二、过滤系统的设计思路 1.用户数据获取 为了能够对用户浏览的网站进行过滤,首先需要获取用户的浏览数据。该过程主要包括以下几个方面: (1)获取当前正在浏览的页面的URL。 (2)获取当前页面中的文本内容,包括页面标题、页面正文、页面中的图片等。 (3)将浏览数据发送到过滤器。 2.过滤器设计 过滤器是整个系统的核心部分,主要用于分析用户的浏览数据,判断当前浏览的页面是否包含不良信息。在设计过滤器时,我们采用了一些常见的技术,包括: (1)正则表达式。正则表达式可以用于简单的模式匹配,例如判断文本中是否包含某些关键词。 (2)计算机视觉技术。计算机视觉技术可以用于对图片进行处理和分析,例如检测是否存在色情图片等。 (3)机器学习技术。机器学习技术可以帮助系统自动识别不良信息,例如对网站上的文本内容进行分类。 3.过滤器实现 具体来说,在过滤器的实现过程中,主要包括以下几个步骤: (1)将用户浏览的数据转换成可以被过滤器读取的格式。 (2)根据用户的浏览数据和过滤器的设计思路,分析页面是否存在不良信息。 (3)对包含不良信息的网站进行过滤。过滤的方式可以采用屏蔽、重定向等方式。 4.数据存储 为了方便后续的分析和评估,我们需要将过滤器分析得到的数据保存下来。具体来说,该过程主要包括以下几个部分: (1)选择合适的数据结构存储过滤器分析得到的数据。例如,可以采用数据库进行存储。 (2)设计存储方案,包括存储数据的格式、索引方式等。 (3)将数据保存到存储介质中。 三、系统的具体实现过程 在具体实现系统时,我们主要采用了VS2010和IE浏览器插件开发工具进行开发。具体实现过程主要包括以下几个步骤: 1.按照设计要求,获取用户正在浏览的数据流。 2.将用户的浏览数据传递给过滤器模块。 3.过滤器模块对用户的浏览数据进行分析和处理,并返回处理结果。 4.根据过滤器返回的处理结果,对网站进行过滤。 5.将过滤器分析得到的数据保存到数据库中。 四、系统的性能测试 为了评估系统的性能表现,我们进行了一些相关的测试,测试结果如下: 1.系统的过滤效果良好,可以准确地识别出网站中的不良信息。 2.系统的运行速度较慢,需要进一步优化。 3.系统的存储方式较为简单,需要进一步完善。 五、总结与展望 本文主要介绍了一种基于BHO的网站过滤系统。该系统可以有效地过滤网站中的不良信息,保护青少年免于不良信息的影响。然而,在实际应用中,该系统还存在一些问题,例如运行速度较慢、存储方式较为简单等等。未来,我们将继续探索如何优化该系统,提高其性能表现,在实际应用中发挥更好的作用。