欢迎光临
奥鹏作业辅导

南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业[答案]

来源:奥鹏远程教育   日期: 作者:奥鹏作业辅导

南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业[答案]满分答案

20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业

试卷总分:100  得分:100

一、单选题 (共 15 道试题,共 30 分)

1.PaaS是()的简称

A.软件即服务

B.硬件即服务

C.平台即服务

D.基础设施即服务

 

2.基础设施即服务的英文简称是

A.SaaS

B.PaaS

C.IaaS

 

3.数据清洗的方法不包括

A.重复数据记录处理

B.缺失值处理

C.噪声数据清除

D.一致性检查

 

4.下列哪个R语言扩展包可以创建带有点和边的网络图()

A.network

B.ggplot2

C.ggmaps

D.animation

 

5.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()

A.network

B.ggplot2

C.ggmaps

D.animation

 

6.GFS中的文件切分成()的块进行存储

A.64MB

B.32MB

C.1G

D.128MB

 

7.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。

A.运营式系统阶段

B.用户原创内容阶段

C.感知式系统阶段

 

8.下列不属于商业大数据类型的是

A.社交数据

B.电子商务数据

C.机器和传感器数据

D.传统企业数据

 

9.用于描述相等时间间隔下连续数据随时间变化趋势的是()

A.饼图

B.条形图

C.散点图

D.折线图

 

10.数据仓库是随着时间变化的,下列不正确的是()

A.数据仓库随时间变化不断增加新内容

B.数据仓库随事件变化不断删去旧的数据内容

C.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

D.捕捉到的新数据会覆盖原来的快照

 

11.以下不是数据仓库基本特征的是()

A.数据仓库的数据是相对稳定的

B.数据仓库的数据是反映历史变化的

C.数据仓库是面向事务的

D.数据仓库是面向主题的

 

12.哪个选项不属于大数据4V特点?

A.Volume

B.Variety

C.Value

D.Valid

 

13.以下哪项不是数据可视化工具的特性()

A.简单操作

B.更丰富的展现

C.实时性

D.仅需一种数据支持方式即可

 

14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。

A.运营式系统阶段

B.用户原创内容阶段

C.感知式系统阶段

 

15.大数据的特点不包含

A.数据体量大

B.数据不统一

C.处理速度快

D.价值密度高

 

南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业[答案]多选题答案

二、多选题 (共 15 道试题,共 30 分)

16.大数据在社交网络中的应用

A.预测外部趋势

B.舆情监控、突发事件预警

C.用户画像、精准推荐

D.用户偏好、情感、社交网络结构

 

17.离群点检测的应用包括()等。

A.疾病的不寻常模式

B.欺诈检测

C.故障检测

D.入侵检测

 

18.百度大数据引擎主要包含三大组件()

A.百度大脑。

B.数据工厂

C.开放云

 

19.KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。

A.数据集成

B.数据挖掘

C.数据处理

D.数据分析

 

20.可视化工具包括()

A.ppt

B.Google Chart

C.Gephi

D.Excel

 

21.云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。

A.网络计算

B.流计算

C.并行计算

D.分布式计算

 

22.医疗领域如何利用大数据

A.社保资金安全

B.用户行为分析

C.临床决策支持

D.个性化医疗

 

23.可使用##,##,##进行光滑。

A.箱边界

B.箱均值

C.箱中位数

D.最大值

 

24.大数据智能感知层:主要包括()及软硬件资源接入系统

A.网络通信体系

B.智能识别体系

C.数据传感体系

D.传感适配体系

 

25.下列属于传统统计学展示方法的是()

A.饼状图

B.网络图

C.柱状图

D.曲线图

 

26.层次方法可以分为()

A.分裂法

B.凝聚法

C.K均值算法

D.K中心点算法

 

27.一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

A.若干个数据节点

B.若干个名字节点

C.一个数据节点

D.一个名字节点

 

28.交通数据分析可用于:

A.实时路况查询播报

B.合理进行道路规划

C.信号灯智能调度

D.交通流量实时分析

 

29.数据变换(Data Transformation)的方法有()

A.规范化

B.聚集

C.数据泛化

D.光滑

 

30.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()

A.时效性

B.多态性

C.冗余性

D.不完整性

 

三、判断题 (共 20 道试题,共 40 分)

31.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据

 

32.Flume的数据流由RDD贯穿始终。

 

33.ID3算法的核心思想就是以信息增益度量属性选择

 

34.大数据数据量一定是PB,TB级的

 

本文标签: 南开 学期 
扫描二维码获取答案

热门文章

猜你喜欢

  • 北语21春《审计学》作业1[答案]奥鹏作业

  • 21春《审计学》作业1 试卷总分:100 得分:100 一、单选题 (共 18 道试题,共 90 分) 1.注册会计师获取的下列以文件记录形式的证据中,证明力最强的是_____。 A
  • 南开18春学期《市政学》在线作业答案

  • 18春学期《市政学》在线作业-0002 试卷总分:100 得分:0 一、 单选题 (共 20 道试题,共 40 分) 1.一下特征中,()不属于我国城市化的主要特征 A.政府主导的城市化
  • 股票股利是指()。

  • 股票股利是指()。 A.用资本公积发放的股利 B.用增发股票分配的利润 C.用债券发放的股利 D.以上都不是 答案:B
  • 19春华师《西方经济学》在线作业[答案]

  • 华师《西方经济学》在线作业-0003 试卷总分:100 得分:0 一、 单选题 (共 10 道试题,共 30 分) 1.对通货膨胀现象最恰当的描述是( ) A.流通中的货币量过多而引起