欢迎光临
奥鹏作业辅导

南开18秋学期(1803)《数据科学导论》在线作业[答案]

来源:奥鹏远程教育   日期: 作者:奥鹏作业辅导

南开18秋学期(1803)《数据科学导论》在线作业[答案]满分答案

18秋学期(1803)《数据科学导论》在线作业-0002

试卷总分:100    得分:0

一、 单选题 (共 20 道试题,共 40 分)

1.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。

A.1,线性

B.2,线性

C.1,非线性

D.2,非线性

 

 

2.在回归分析中,自变量为(),因变量为()。

A.离散型变量,离散型变量

B.连续型变量,离散型变量

C.离散型变量,连续型变量

D.连续型变量,连续型变量

 

 

3.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。

A.越小

B.越大

C.无关

D.不确定

 

 

4.我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。

A.自上而下

B.自下而上

C.自左而右

D.自右而左

 

 

5.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

A.4

B.5

C.6

D.7

 

 

6.以下哪些不是缺失值的影响()

A.数据建模将丢失大量有用信息

B.数据建模的不确定性更加显著

C.对整体总是不产生什么作用

D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出

 

 

7.数据质量检验的主要任务就是检查原始数据中是否存在“脏数据”,概括性来说,脏数据不包括以下()

A.普通值

B.异常值

C.不一致的值

D.重复值

 

 

8.K-means聚类适用的数据类型是()。

A.数值型数据

B.字符型数据

C.语音数据

D.所有数据

 

 

9.以下哪个不是处理缺失值的方法()

A.删除记录

B.按照一定原则补充

C.不处理

D.随意填写

 

 

10.变量之间的关系一般可以分为确定性关系与()。

A.非确定性关系

B.线性关系

C.函数关系

D.相关关系

 

 

11.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()

A.关联规则发现

B.聚类

C.分类

D.自然语言处理

 

 

12.通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()

A.简单函数变换

B.规范化

C.属性构造

D.连续属性离散化

 

 

13.实体识别属于以下哪个过程()

A.数据清洗

B.数据集成

C.数据规约

D.数据变换

 

 

14.单层感知机是由()层神经元组成。

A.一

B.二

C.三

D.四

 

 

15.多层感知机是由()层神经元组成。

A.二

B.三

C.大于等于二层

D.大于等于三层

 

 

16.为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。

A.1

B.2

C.3

D.4

 

 

17.特征选择的四个步骤中不包括()

A.子集产生

B.子集评估

C.子集搜索

D.子集验证

 

 

18.维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )

A.K-means

B.Bayes Network

C.C4.5

D.Apriori

 

 

19.根据映射关系的不同可以分为线性回归和()。

A.对数回归

B.非线性回归

C.逻辑回归

D.多元回归

 

 

20.层次聚类对给定的数据进行()的分解。

A.聚合

B.层次

C.分拆

D.复制

 

 

南开18秋学期(1803)《数据科学导论》在线作业[答案]多选题答案

二、 多选题 (共 10 道试题,共 20 分)

1.下列选项是BFR的对象是()

A.废弃集

B.临时集

C.压缩集

D.留存集

 

 

2.层次聚类的方法是()

A.聚合方法

B.分拆方法

C.组合方法

D.比较方法

 

 

3.下面例子属于分类的是()

A.检测图像中是否有人脸出现

B.对客户按照贷款风险大小进行分类

C.识别手写的数字

D.估计商场客流量

 

 

4.一元回归参数估计的参数求解方法有()。

A.最大似然法

B.距估计法

C.最小二乘法

D.欧式距离法

 

 

5.聚类的主要方法有()。

A.划分聚类

B.层次聚类

C.密度聚类

D.距离聚类

 

 

6.相关性的分类,按照相关的方向可以分为()。

A.正相关

B.负相关

C.左相关

D.右相关

 

 

7.什么情况下结点不用划分()

A.当前结点所包含的样本全属于同一类别

B.当前属性集为空,或是所有样本在所有属性上取值相同

C.当前结点包含的样本集为空

D.还有子集不能被基本正确分类

 

 

8.k近邻法的基本要素包括()。

A.距离度量

B.k值的选择

C.样本大小

D.分类决策规则

 

 

9.距离度量中的距离可以是()

A.欧式距离

B.曼哈顿距离

C.Lp距离

D.Minkowski距离

 

 

10.K-means聚类中K值选取的方法是()。

A.密度分类法

B.手肘法

C.大腿法

D.随机选取

 

 

三、 判断题 (共 20 道试题,共 40 分)

1.信息熵越大,数据信息的不确定性越小。

A.对

B.错

 

 

2.增加神经元的个数,无法提高神经网络的训练精度。

A.对

B.错

 

 

3.啤酒与尿布的故事是聚类分析的典型实例。

A.对

B.错

 

 

4.当特征为离散型时,可以使用信息增益作为评价统计量。

A.对

B.错

 

 

扫描二维码获取答案

热门文章

猜你喜欢

  • 19春华师《西方经济学》在线作业[答案]

  • 华师《西方经济学》在线作业-0003 试卷总分:100 得分:0 一、 单选题 (共 10 道试题,共 30 分) 1.对通货膨胀现象最恰当的描述是( ) A.流通中的货币量过多而引起
  • 南开18春学期《市政学》在线作业答案

  • 18春学期《市政学》在线作业-0002 试卷总分:100 得分:0 一、 单选题 (共 20 道试题,共 40 分) 1.一下特征中,()不属于我国城市化的主要特征 A.政府主导的城市化
  • 北语21春《审计学》作业1[答案]奥鹏作业

  • 21春《审计学》作业1 试卷总分:100 得分:100 一、单选题 (共 18 道试题,共 90 分) 1.注册会计师获取的下列以文件记录形式的证据中,证明力最强的是_____。 A
  • 股票股利是指()。

  • 股票股利是指()。 A.用资本公积发放的股利 B.用增发股票分配的利润 C.用债券发放的股利 D.以上都不是 答案:B