预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

苏州大学本科生毕业设计(论文)28本科毕业设计(论文)学院(部)计算机科学与技术学院题目跨平台跨浏览器数据标注界面设计与实现年级2014专业计科班级计科学号1427405116姓名陆凯华指导老师李正华职称副教授论文提交日期2018.5.18目录前言1第一章绪论21.1研究背景及意义21.2数据标注系统概述21.3本文的主要工作51.4本文的组织结构5第二章基于标注系统实现和兼容性问题分析62.1开发工具62.2开发技术72.2.1Ajax技术72.2.2ThinkPHP框架92.2.3MySQL数据库102.3系统兼容性问题112.3.1主流浏览器概述112.3.2浏览器的兼容性问题122.4本章总结14第三章基于jQuery的多浏览器支持的标注系统实现153.1jQuery框架概述153.2jQuery的兼容性优势153.2.1jQuery对象操作153.2.2jQuery使用对象属性163.2.4jQuery封装Ajax163.3本章总结17第四章基于动态依存弧画图的标注界面优化184.1cavans概述184.2依存弧绘制流程184.3画布设计204.3.1画布宽高调整204.3.2画布细节处理224.4canvas兼容IE8244.5本章总结25第五章总结与展望265.1本文总结265.2后续工作展望26参考文献27致谢28摘要众所周知,自然语言处理是机器学习中的重要环节,而自然语言处理需要大量数据作为分析基础。一方面,机器学习算法需要高质量的标注数据,句法分析、图像识别等算法的深入研究对各类标注数据的需求加大;另一方面,不同的研究方向对数据的标注要求各不相同,因此数据标注就具有了非常广泛的应用价值。数据标注就是对原始的数据,包括语音、文本、图片、视频等进行加工处理,转换为机器可识别信息的过程。数据标注系统是指一个针对某一个特定任务,人工标注其正确答案。以中文分词为例,首先数据标注系统中会显示一个汉语句子,如“我是一个中国人”;然后标注者通过鼠标点击动作,将句子切分为一个词语序列“我/是/一个/中国/人”。这样的人工标注数据对于统计机器模型和算法很重要。本课题基于一个现有的数据标注系统进行改进,利用jQuery框架改写网页前端,使它在不同浏览器、不同平台正常工作,并基于动态依存弧画图对原有的界面进行优化,使其有更好的视觉效果。关键词:数据标注;句法标注;jQuery;前端优化AbstractAsweallknow,naturallanguageprocessingisanimportantpartofmachinelearning,andnaturallanguageprocessingrequiresalargeamountofdataasthebasisforanalysis.Ontheonehand,machinelearningalgorithmsrequirehigh-qualityannotationdata.In-depthresearchonalgorithmssuchassyntaxanalysisandimagerecognitionincreasesthedemandforvarioustypesofannotationdata.Ontheotherhand,differentresearchdirectionshavedifferentrequirementsforannotationdata.Therefore,annotationhasaverywiderangeofapplications.Dataannotatingistheprocessofprocessingunprocesseddata,includingspeech,text,pictures,video,etc.,intomachine-readableinformation.Thedataannotationsystemreferstomanuallymarkingthecorrectanswerforaspecifictask.TaketheChinesewordsegmentationasanexample.First,aChinesesentenceisdisplayedinthedataannotationsystem,suchas“我是一个中国人”;thentheannotatorcutsthesentenceintoawordsequence“我/是/一个/中国/人".Suchmanuallyannotationdataisimportantforstatisticalmachinemodelsandalgorithms.Thistopicisbasedonanexistingdataannotationsyst