一种基于人工智能的NLP分析识别与数据清洗方法.pdf
山梅****ai
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于人工智能的NLP分析识别与数据清洗方法.pdf
本发明适用于数据清洗技术领域,提供了一种基于人工智能的NLP分析识别与数据清洗方法,通过NPL模块第一步唯一性检查,这样既可以去掉多余重复的数据,减轻数据处理的负担,方便后续的数据处理,又可以对重复的部分保留其权重的特点;第二步权威性检查,从而根据其权威性直接进行权重排序,方便直观的了解到重要的可信度高的数据;第三步合理性检查,这样可以对有问题的数据进行剔除,进行进一步的精选;第四步一致性检查,从而可以对数据进行分类,实现对数据的进一步精选,第五步完整性检查,从上述庞大数据中提取与缺损数据相关的内容进行补
一种基于人工智能数据分析的电网数据治理方法.pdf
本发明涉及电网数据治理的技术领域,特别是涉及一种基于人工智能数据分析的电网数据治理方法,其能够有效的减轻电网数据分析工作的压力,梳理各信息系统数据字典信息,理清数据中心数据资源信息,避免业务数据重复接入,实现数据字典和数据资源统一管理;包括以下步骤:数据分析:采用ETL数据分析技术,先开展电网数据采集工作,然后对采集的数据进行转化处理,最后对转化处理好的数据进行数据装载;数据划分:创建数据监管主系统和子系统,数据架构中每个类别的数据对应着子系统,每个子系统均与主系统联系;数据加密:建立主系统和子系统加密机
基于NLP的大数据分析管理系统及方法.pdf
本发明公开了一种基于NLP的大数据分析管理系统,包括分析管理系统、云端服务器和显示单元,分析管理系统与显示单元连接,所述分析管理系统包括专属数据库、数据采集模块、数据查询模块、数据处理模块、图形处理模块、交互式处理模块和搜索引擎模拟训练模块。本发明属于大数据分析管理技术领域,具体是提供了一种可同时满足实时数据展示、实时可变维度的数据展示,基于关键字、关键词、指令的全文检索以及选择数据呈现指标的信息的数据查询,通过海量的数据检索,大量的数据渲染,达到良好的体验效果,同时可以更新专属语料库,不断提高数据采集的
一种基于大数据的人工智能数据采集分析方法及其设备.pdf
本发明涉及大数据技术领域,且公开了一种基于大数据的人工智能数据采集分析方法,包括以下步骤:人员确地人工智能数据采集的关键词,然后从每个互联网访问设备中获取该关键词的目标图像、音频、基本信息、日志信息和用户相关信息。该基于大数据的人工智能数据采集分析方法及其设备,人员确地人工智能数据采集的关键词,然后从设备中获取该关键词数据,并按照预设的大数据收集分类对分类标签进行排序分类,再筛分数据进行过滤或修改不完整的数据、错误的数据或重复的数据,过滤整合的数据与外部信息进行关联分析进行影响分析,再进行二次数据采集,然
一种基于数据仓库的数据清洗方法.pdf
本发明公开了一种基于数据仓库的数据清洗方法,该数据清洗方法包括预处理、给属性分配权值、重复记录检测、数据库级的重复记录聚类以及冲突处理;预处理:选择用于记录匹配的属性,该属性能代表记录特征;给属性分配权值:根据属性在决定两条记录相似性中重要程度的不同,为每个属性分配不同的权重;数据库级的重复记录聚类:在数据库应用检测重复记录的算法中减少比较记录的范围,对整个数据集中的重复记录进行聚类;冲突处理:合并或者删除检测出的同一重复记录聚类的重复记录,保留其中正确的记录。本发明能检测大批量的数据源的错误并改正,有效