预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

22秋学期(高起本1709-1803、全层次1809-2103)《数据科学导论》在线作业1.数据质量检验的主要任务就是检查原始数据中是否存在“脏数据”,概括性来说,脏数据不包括以下()A.普通值B.异常值C.不一致的值D.重复值【参考答案】:A2.变量之间的关系一般可以分为确定性关系与()。A.非确定性关系B.线性关系C.函数关系D.相关关系【参考答案】:A3.以下哪个不是处理缺失值的方法()A.删除记录B.按照一定原则补充C.不处理D.随意填写【参考答案】:D4.单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型【参考答案】:A5.K-means聚类适用的数据类型是()。A.数值型数据B.字符型数据C.语音数据D.所有数据【参考答案】:A6.在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线【参考答案】:A7.单层感知机拥有()层功能神经元。A.一B.二C.三D.四【参考答案】:A8.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化【参考答案】:B9.Apriori算法的加速过程依赖于以下哪个策略()A.抽样B.剪枝C.缓冲D.并行【参考答案】:B10.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A.4B.5C.6D.7【参考答案】:C11.聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习【参考答案】:B12.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A.异常值B.缺失值C.不一致的值D.重复值【参考答案】:C13.层次聚类对给定的数据进行()的分解。A.聚合B.层次C.分拆D.复制【参考答案】:B14.多层感知机是由()层神经元组成。A.二B.三C.大于等于二层D.大于等于三层【参考答案】:D15.手肘法的核心指标是()。A.SESB.SSEC.RMSED.MSE【参考答案】:B16.比如一张表,从业务上讲,一个用户应该只会有一条记录,那么如果某个用户出现了超过一条的记录,这就产生了()A.异常值B.不一致的值C.重复值D.缺失值【参考答案】:C17.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理【参考答案】:A18.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元【参考答案】:C19.下列两个变量之间的关系中,哪个是函数关系()。A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度【参考答案】:C20.通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程【参考答案】:A21.对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层【参考答案】:BC22.一元回归参数估计的参数求解方法有()。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法【参考答案】:ABC23.关联规则的评价度量主要有:()。A.支持度B.置信度C.准确率D.错误率【参考答案】:AB24.系统日志收集的基本特征有()A.高可用性B.高可靠性C.可扩展性D.高效率【参考答案】:ABC25.多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播【参考答案】:AD26.什么情况下结点不用划分()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类【参考答案】:ABC27.数据科学具有哪些性质()A.有效性B.可用性C.未预料D.可理解【参考答案】:ABCD28.k近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则【参考答案】:ABD29.层次聚类的方法是()A.聚合方法B.分拆方法C.组合方法D.比较方法【参考答案】:AB30.距离度量中的距离可以是()A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离【参考答案】:ABCD31.探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。T