预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本发明公开了一种基于关键词提取的地址树构建方法,首先对地址信息文本进行预处理,得到预处理文本,再计算预处理文本中每个词语的综合权重,然后根据每个词语的综合权重提取关键词,最后根据提取到的关键词构建地址树。本发明结合词语的TF?IDF权重和平均信息熵作为综合权重对关键词进行提取,并充分考虑了词语相邻权值的转移概率,提高了关键词提取的准确度,再基于提取到的关键词构建精确的地址树,操作简单,无须人工干预,具有较强的通用性,能够满足对文本地址关键词的准确提取,为地址补全、地址纠错、地址转换等应用提供基础技术支撑。