预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

想要理解和研究机器学习,首先你应该要掌握Python或者R,都是和C,Java,PHP差不多的语言(译:差太多了好吧).不过呢,Python和R都是比较年轻(译:不懂,Python可并不年轻吧),而且呢更高级,完全不用理解底层(译:?),所以他俩都很容易学.Python更牛逼的地方在于她能够处理更多的问题,比如,机器学习,算法,图像等,而不像R只能是进行数据处理和分析.Python有着更广泛的应用领域,比如后端框架Django(译:原文是,'Hostingwebsites:Jango'),自然语言处理(译:原文是,'naturallanguageproecssing',作者太不认真,NLP),网站接入等,而且Python更像C语言(译:扯淡),所以她现在很流行. 毛子的原文里面有不少错误,我以自己的理解加以修正,仅供参考.语法文法错误我就直接修改,原文作者的表达内容错误会依据原文不变,在()内说明. 新手用Python进行机器学习的四个步骤 Python基础知识学习,有书,Mooc,视频. 处理数据,你得了解一些模块,如:Pandas,Numpy,Matplotlib和NaturalLanguageProcessing. 接着你就得爬取数据,可以通过API,也可以直接到网站上去爬取.网站爬虫模块:BeautifulSoup(译:应该是Scrapy,BS是HTML/XML解析器).我们用拿到的数据来训练算法. 最后一步,就是要学习ML的相关算法,以及工具Scikit-learn. 1.学习Python 学习Python最简单粗暴的法子就是到HYPERLINK"http://www.codecademy.com"\t"_blank"Codecademy上去注册个账号来学习基础知识.一个被好多码农推荐的很经典的网站HYPERLINK"http://learnpythonthehardway.org/book/"\t"_blank"LearnPythonTheHardWay.HYPERLINK"http://www.ibiblio.org/swaroopch/byteofpython/files/120/byteofpython_120.pdf"\t"_blank"ByteofPython这篇文章是非常值得去学习的.Python社区还为新手给出了一个HYPERLINK"https://wiki.python.org/moin/BeginnersGuide/Programmers"\t"_blank"Python学习资源列表.O’Reilley出版的一本书ThinkPython,HYPERLINK"http://www.greenteapress.com/thinkpython/"\t"_blank"这里可以免费下载.最后还有一个HYPERLINK"https://www.kevinsheppard.com/images/0/09/Python_introduction.pdf"\t"_blank"IntroductiontoPythonforEconometrics,StatisticsandDataAnalysis也讲了好多Python的基础知识. 2.导入模块 做机器学习很重要的几个模块和工具是NumPy,Pandas,Matplotlib和IPython.HYPERLINK"http://shop.oreilly.com/product/9780596802363.do"\t"_blank"DataAnalysiswithOpenSourceTools这本书里面都有涉及这些内容.上面提到的HYPERLINK"https://www.kevinsheppard.com/images/0/09/Python_introduction.pdf"\t"_blank"IntroductiontoPythonforEconometrics,StatisticsandDataAnalysis也涵盖了这些东西.还有一本书HYPERLINK"http://www.amazon.com/dp/1449319793?tag=inspiredalgor-20"\t"_blank"PythonforDataAnalysis:DataWranglingwithPandas,NumPy,andIPython.下面还有一些免费的资源: HYPERLINK"http://pandas.pydata.org/pandas-docs/stable/10min.html"\t"_blank"10minutestoPandas HYPERLINK"http://machinelearningmastery.c