预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

python中⽂版免费下载-PYTHON⾃然语⾔处理(中⽂最新完整版)pdf下载内容简介⾃然语⾔处理(naturallanguageprocessing,nlp)是计算机科学领域与⼈⼯智能领域中的⼀个重要⽅向。它研究能够实现⼈与计算机之间⽤⾃然语⾔进⾏有效通信的各种理论和⽅法,涉及所有⽤计算机对⾃然语⾔进⾏的操作。《python⾃然语⾔处理》是⾃然语⾔处理领域的⼀本实⽤⼊门指南,旨在帮助读者学习如何编写程序来分析书⾯语⾔。本书基于python编程语⾔以及⼀个名为nltk的⾃然语⾔⼯具包的开源库;但并不要求读者有python编程的经验。全书共11章,按照难易程度顺序编排。第1章到3章介绍了语⾔处理的基础,讲述如何使⽤⼩的python程序分析感兴趣的⽂本信息。第4章讨论结构化程序设计,以巩固前⾯⼏章中介绍的编程要点。第5章到第7章介绍语⾔处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句⼦解析、句法结构识别和句意表达⽅法。第11章介绍了如何有效管理语⾔数据。后记部分简要讨论了nlp领域的过去和未来。《python⾃然语⾔处理》的实践性很强,包括上百个实际可⽤的例⼦和分级练习。本书可供读者⽤于⾃学,也可以作为⾃然语⾔处理或计算语⾔学课程的教科书,或是⼈⼯智能、⽂本挖掘、语料库语⾔学等课程的补充读物。作者简介StevenBird是墨尔本⼤学计算机科学和软件⼯程系副教授,宾⼣法尼亚⼤学语⾔学数据联盟⾼级研究助理。EwanKlein是爱丁堡⼤学信息学院语⾔技术教授。EdwardLoper是毕业于宾⼣法尼亚⼤学专注于机器学习的⾃然语⾔处理⽅向的博⼠,现在在波⼠顿的BBNTechnologies担任研究员。⽬录《python⾃然语⾔处理》第1章语⾔处理与python11.1语⾔计算:⽂本和词汇11.2近观python:将⽂本当做词链表101.3计算语⾔:简单的统计171.4回到python:决策与控制241.5⾃动理解⾃然语⾔291.6⼩结351.7深⼊阅读361.8练习37第2章获得⽂本语料和词汇资源412.1获取⽂本语料库412.2条件频率分布552.3更多关于python:代码重⽤602.4词典资源632.5wordnet722.6⼩结782.7深⼊阅读792.8练习80第3章处理原始⽂本843.1从⽹络和硬盘访问⽂本843.2字符串:最底层的⽂本处理933.3使⽤unicode进⾏⽂字处理1003.4使⽤正则表达式检测词组搭配1053.5正则表达式的有益应⽤1093.6规范化⽂本1153.7⽤正则表达式为⽂本分词1183.8分割1213.9格式化:从链表到字符串1263.10⼩结1323.11深⼊阅读1333.12练习134第4章编写结构化程序1424.1回到基础1424.2序列1474.3风格的问题1524.4函数:结构化编程的基础1564.5更多关于函数1644.6程序开发1694.7算法设计1754.8python库的样例1834.9⼩结1884.10深⼊阅读1894.11练习189第5章分类和标注词汇1955.1使⽤词性标注器1955.2标注语料库1975.3使⽤python字典映射词及其属性2065.4⾃动标注2165.5n-gram标注2215.6基于转换的标注2285.7如何确定⼀个词的分类2305.8⼩结2335.9深⼊阅读2345.10练习235第6章学习分类⽂本2416.1监督式分类2416.2监督式分类的举例2546.3评估2586.4决策树2636.5朴素贝叶斯分类器2666.6最⼤熵分类器2716.7为语⾔模式建模2756.8⼩结2766.9深⼊阅读2776.10练习278第7章从⽂本提取信息2817.1信息提取2817.2分块2847.3开发和评估分块器2917.4语⾔结构中的递归2997.5命名实体识别3027.6关系抽取3067.7⼩结3077.8深⼊阅读3087.9练习308第8章分析句⼦结构3128.1⼀些语法困境3128.2⽂法的⽤途3168.3上下⽂⽆关⽂法3198.4上下⽂⽆关⽂法分析3238.5依存关系和依存⽂法3328.6⽂法开发3368.7⼩结3438.8深⼊阅读3448.9练习344第9章建⽴基于特征的⽂法3499.1⽂法特征3499.2处理特征结构3599.3扩展基于特征的⽂法3679.4⼩结3799.5深⼊阅读3809.6练习381第10章分析语句的含义38410.1⾃然语⾔理解38410.2命题逻辑39110.3⼀阶逻辑39510.4英语语句的语义40910.5段落语义层42210.6⼩结42810.7深⼊阅读42910.8练习430第11章语⾔数据管理43411.1语料库结构:案例研究43411.2语料库⽣命周期43911.3数据采集44311.4使⽤xml4