实验3-MapReduce编程初级实践-豆柴文库

实验3-MapReduce编程初级实践.doc

2024-11-04

10金币

120KB

7页

zh****db

实名认证

内容提供者

1/7

2/7

3/7

4/7

5/7

6/7

7/7

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

实验3MapReduce编程初级实践实验目得 1、通过实验掌握基本得MapReduce编程方法; 2、掌握用MapReduce解决一些常见得数据处理问题,包括数据去重、数据排序与数据挖掘等。实验平台已经配置完成得Haｄoｏｐ伪分布式环境。实验内容与要求１、编程实现文件合并与去重操作对于两个输入文件,即文件Ａ与文件Ｂ，请编写ＭａpRedｕcｅ程序，对两个文件进行合并,并剔除其中重复得内容,得到一个新得输出文件C.下面就是输入文件与输出文件得一个样例供参考。实验最终结果(合并得文件)：代码如下: ｐackage、Mｅrge； imｐoｒtjaｖa、ｉo、IOExｃeption； impｏrtorｇ、apａche、hadｏop、ｃｏnf、Confiｇuration； imporｔoｒg、apache、haｄｏop、ｆs、Pａth; imporｔｏrg、ａpache、hadoｏｐ、ｉo、Texｔ; importoｒg、ａpacｈe、hadoｏp、maｐreduce、Joｂ； impｏrtｏrg、apache、hadoop、mapreduce、Mapper; impoｒtoｒｇ、apaｃhe、hａdoｏp、mａpreduｃe、Ｒeｄucｅr； iｍｐoｒｔｏrg、aｐache、hadoop、ｍapｒｅduce、liｂ、inpｕｔ、； importoｒg、apａche、haｄoop、ｍapreｄｕｃe、liｂ、outpuｔ、; publicclａｓｓＭerge{ ｐｕｂｌiｃｓｔaticclａsｓMａpeｘtenｄsMapｐｅr<Oｂject，Tｅxt，Ｔｅxｔ,Texｔ>{ priｖａtｅstaticTexｔtext=ｎewＴｅxt（); publicvｏidmaｐ(Oｂjeｃｔｋｅｙ,Textvaｌuｅ，Conteｘｔcoｎtｅxｔ) thｒowsIOＥxｃeptioｎ,ＩnteｒrｕptedＥxceptiｏｎ{ ｔext=value; cｏnｔeｘt、writｅ(text,newTｅxt(””)）; ｝ } pｕbliｃｓtaticclassRｅdｕｃeeｘteｎdsReducer<Teｘt，Text，Text，Text＞{ pｕblicvｏidrｅducｅ（Textkｅｙ,Iterabｌe〈Ｔeｘt＞valuｅs，Contextcontext) thrｏwsIOExcｅptioｎ，IntｅrrｕpｔedEｘｃeｐtion{ ｃontext、ｗｒiｔｅ(key,ｎewTeｘt（"”）); } } ｐublicstatiｃvoidｍain（String[]arｇs)ｔhrowsExcｅptiｏn{ Ｃonｆigurａtｉonｃonf=newConfigurａｔion(）； conf、sｅt（”ｆs、defaultFS”,”ｈdfs：//localhost：900０＂); Ｓtrｉng［]othｅｒＡrgs=newString［］｛"input"，”oｕtput"}； iｆ（otherArgs、lenｇth！=２){ Ｓyｓteｍ、ｅrr、printｌｎ(”Usagｅ:Meｒgｅaｎddupｌicａｔerｅmovａl〈ｉｎ><out＞"）; Sysｔem、ｅxｉｔ（２)； } Jobjｏb=Job、ｇetInｓtanｃe(coｎf,”Meｒgeａnｄduｐlicatｅremoval＂); job、setＪａｒByCｌａsｓ(Mｅrge、cｌaｓs)； job、seｔMapｐerClass(Mａp、cｌass)； job、setReducerClass（Ｒeducｅ、class）； job、setOｕtｐutKeyClass（Ｔｅxt、cｌass); job、setＯutputValｕｅClass(Tｅxt、clａsｓ); （job，ｎeｗPath(othｅrArｇs[0］)); (ｊｏb，ｎｅｗPath(oｔｈerＡrgs[1]))； Sysｔeｍ、exit(jｏb、waｉtFｏrｐleｔｉon(true)?0:1）；｝ } 2、编写程序实现对输入文件得排序现在有多个输入文件,每个文件中得每行内容均为一个整数。要求读取所有文件中得整数，进行升序排序后，输出到一个新得文件中,输出得数据格式为每行两个整数,第一个数字为第二个整数得排序位次，第二个整数为原待排列得整数。下面就是输入文件与输出文件得一个样例供参考。实验结果截图: 代码如下：ｐａckage、ＭerｇeSｏｒt; importjａｖａ、iｏ、IＯEｘceｐtｉon; importorg、apache、hａdoop、conｆ、Coｎfigｕrａｔion； iｍpｏｒtｏrg、apａｃhe、ｈadoop、fs、Paｔh; ｉｍporｔorg、aｐache、ｈ

相关资料

实验MapReduce编程初级实践.docx

实验3MapReduce编程初级实践实验目的1.通过实验掌握基本的MapReduce编程方法；2.掌握用MapReduce解决一些常见的数据处理问题，包括数据去重、数据排序和数据挖掘等。实验平台已经配置完成的Hadoop伪分布式环境。实验内容和要求1.编程实现文件合并和去重操作对于两个输入文件，即文件A和文件B，请编写MapReduce程序，对两个文件进行合并，并剔除其中重复的内容，得到一个新的输出文件C。下面是输入文件和输出文件的一个样例供参考。实验最终结果（合并的文件）：代码如下：packagecom

2024-11-04

91KB

实验3-MapReduce编程初级实践.doc

2024-11-04

120KB

实验五VisualFoxpro编程实践.docx

实验五VisualFoxpro编程实践一.实验目的与要求掌握利用VisualFoxpro编制开发自己的应用程序的实践知识，并学会在程序调试中自行发现问题和修改程序代码，最终完成应用程序的无错运行。二.相关知识利用VisualFoxpro自行开发编制应用程序的步骤：,设置好系统的工作环境(尤其注意工作目录的默认设置)。.如果是初次进行，应领先建立一个工程，为该工程命名，激活工程管理器。如果是接着上次的工作进行，那么翻开上次工作的本工程，同样也激活工程管理器。.在工程管理器的“数据”9“数据库”下面创立一个数

2024-01-17

928KB

实验三-用户摘、挂机识别初级编程.pdf

实验报告项目名称：用户摘、挂机识别初级编程教学班级：学生姓名:同组成员：指导教师：实验地点：实验日期:实验三用户摘、挂机识别初级编程一、实验的目的及要求：实验目的：1.深入了解实验系统提供的模拟用户接口电路硬件环境；2.通过本次实验，掌握模拟用户线接口电路芯片88622的控制使用方法；3.熟练掌握使用BorlandC集成开发环境IDE编写和调试程序的方法；4.能综合运用所学知识，独立编写和调试用户摘、挂机识别程序，提高使用C语言编写“存储程序控制设备”软件的能力，感受成功的快乐。预习要求：1.实验之前，请

2024-08-13

1.2MB

信息安全编程与实践实验项目指导书 PU.docx

《信息安全编程与实践》实验指导书一、实验（项目）基本信息实验（项目）名称PU3:简单计算器课程名称信息安全技术基础学生层次本科学生专业计算机学生年级16级实验学时2实验类型验证二、实验教学目标目标内容具体目标理论知识了解面向对象编程技术原理，掌握类的定义与应用初步了解MFC图形界面编程专业技能掌握如何定义和使用类初步掌握VS资源编辑器的使用职业素养专业学习中的求知欲细心、耐心的工作作风三、实验（项目）目的与要求目的：通过实验掌握如何在定义简单的类，并初步了解图形界面编程。要求：1.掌握VS2008解决方案

2024-11-04

11KB