预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

2021年3月 文章编号:1006-9348(2021)03-0346-05 基于Python爬虫技术的虚假数据溯源与过滤 陈丛,周力臻 (福建师范大学协和学院,福建福州350117) 摘要:针对现有网络虚假数据追踪与过滤方法中存在的追踪定位精度低、过滤覆盖范围小的问题,提出基于Python爬虫技 术的虚假数据溯源与途中过滤。将虚假数据覆盖的网络划分为相同大小的网格,根据一定概率标记数据包;分析Python爬 虫抓取过程,以适用多场景、界面可视化、负载均衡为系统设计目标,设计爬虫管理器、采集器与内嵌浏览器硬件设备;结合 系统爬取数据流程描述各软件模块的协作方式;在系统中部署节点,建立协作关系区域,利用布隆过滤器生成数据包,通过 共享密钥证明MAC是否合法,启动溯源过程;在溯源途中若节点不存在任何一个密钥,则将其过滤,完成虚假数据溯源与途 中过滤。仿真结果证明,上述方对虚假数据的过滤效果较高,且对虚假数据溯源定位精度较高。 关键词:爬虫技术;虚假数据;途中过滤;共享密钥;负载均衡 中图分类号:TP318.2文献标识码:B TracingandFilteringofFakeData BasedOnPythonCrawlerTechnology CHENCong,ZHOULi-zhen (ConcordUniversityCollegeFujianNormalUniversity,FuzhouFujian350117,China) ABSTRACT:Inthenetworkfalsedatatrackingandfiltering,traditionalmethcxlshavedefects,suchaslowtracking andpositioningaccuracy,andsmallfilteringcoverage.Forthisreason,thispaperproposesaPythoncrawlerbased falsedatatracingandfiltering.Thenetworkcoveredbyfalsedatawasdividedintogridsofthesamesize.Basedona certainprobability,packetsweremarked.Pythoncrawlercaptureprocesswasanalyzedindetail.Inordertomake thesystemsuitableformultiscene,interfacevisualizationandloadbalancing,crawlermanager,collectorandem­ beddedbrowserhardwaredevicesweredesigned.Basedonthesystemcrawlingdataflow,thecooperationmodeof eachsoftwaremodulewasdescribed.Thenodesweredeployedinthesystem,andthecooperationrelationshiparea wasconstructed.Accordingtothebloomfilter,thepacketwasgenerated.ThevalidityofMACwasprovedbysharing thekey,thusthetraceabilityprocesswasstarted.Intheprocessoftracing,nodeswithoutkeywereexcluded,and thefalsedatatracingandfilteringwascompleted.Simulationresultsshowthatthemethodhasexcellentfiltering effectandhighpositioningaccuracy. KEYWORDS:Crawlertechnology;Falsedata;Enroutefiltering;Sharedkey;Loadbalancing 集、处理、定位与连接等功能。但无线传感网络属于开放式 i引言 网络,其计算性能、储存空间较为有限,抗捕获能力较弱,攻 随着嵌入式计算与传感器技术的不断发展,推动了无线击者可通过捕获节点获得其中敏感信息,并对其注人虚假数 传感网络的迅速崛起,并广泛应用于军事、医疗、建筑等领据,如果不能及时过滤掉这些虚假数据,则会导致网络瘫痪, 域:1]。与传感网络不同,无线传感网络将海量廉价小型传感引发错误报警,影响用户决策[2]。为此,该领域研究者对该 器节点随机布置在不同区域,利用自组织形式生成网络,同问题进行了很多研究,并取得了一定成果。 时采用多