南开《大数据导论》19秋期末考核[答案]满分答案
《大数据导论》19秋期末考核-0001
一、单选题 (共 10 道试题,共 20 分)
1.以下不是数据仓库基本特征的是()
A.数据仓库的数据是相对稳定的
B.数据仓库的数据是反映历史变化的
C.数据仓库是面向事务的
D.数据仓库是面向主题的
2.()是Microsoft Office的核心组件
A.WORD
B.SQL
C.PPT
D.EXCEL
3.数据清洗的方法不包括
A.重复数据记录处理
B.缺失值处理
C.噪声数据清除
D.一致性检查
4.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
5.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.network
B.ggplot2
C.ggmaps
D.animation
6.下列不属于Google云计算平台技术架构的是()
A.结构化数据表BigTable
B.弹性云计算EC2
C.并行数据处理MapReduce
D.分布式锁Chubby
7.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
8.IaaS是()的简称
A.软件即服务
B.硬件即服务
C.平台即服务
D.基础设施即服务
9.基础设施即服务的英文简称是
A.SaaS
B.PaaS
C.IaaS
10.下列哪个工具常用来开发移动友好地交互地图()
A.Visual.ly
B.Leaflet
C.Gephi
D.BPizza Pie Charts
南开《大数据导论》19秋期末考核[答案]多选题答案
二、多选题 (共 10 道试题,共 20 分)
11.数据归约(Data Reduction)主要有()
A.维度规约
B.离散化概念分层
C.样本规约
D.数据聚集
12.以下可以用于数据可视化的是()。
A.Weka
B.R语言
C.RapidMiner
D.Excel
13.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A.时效性
B.多态性
C.冗余性
D.不完整性
14.大数据存储的特点与挑战有()
A.成本问题
B.延迟问题
C.容量问题
D.安全问题
15.大数据智能感知层:主要包括()及软硬件资源接入系统
A.网络通信体系
B.智能识别体系
C.数据传感体系
D.传感适配体系
16.数据预处理的过程主要是
A.数据集成
B.数据规约
C.数据清洗
D.数据变换
17.交通数据处理包括以下几个步骤()
A.数据聚类
B.数据组织
C.数据清洗
D.数据映射
18.数据工厂包括
A.超强云安全
B.超大规模讲分布式架构
C.新一代智能自动化运维
D.低能耗数据中心
19.可视化工具包括()
A.ppt
B.Google Chart
C.Gephi
D.Excel
20.去除噪声使得数据光滑的技术主要有:
A.离群点分析
B.回归
C.分箱
三、判断题 (共 15 道试题,共 30 分)
21.在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
22.每个簇的质心(centroid)是该簇中所有数据对象的均值。
23.数据存储要表现出静态数据的特征,反映的是系统中静止的数据。
24.不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
25.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。
26.未来考验零售企业的是如何挖掘消费者需求
27.减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。
28.数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
29.Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
30.FP算法比Apriori算法慢
31.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
32.Apriori算法扫描数据库的次数等于最大频繁项集的项数。