南开21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业[答案]答案
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 30 分)
1.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
正确答案:----
2.第一个提出大数据概念的公司是( )。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
正确答案:----
3.基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
4.()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
正确答案:----
D.EXCEL
专业答案:----
5.MapReduce中的Map和Reduce函数使用()进行输入输出
正确选项:----
A.key/value对
B.随机数值
C.其他计算结果
6.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
专业答案:----
正确答案:----
7.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
专业答案:----
8.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确选项:----
9.下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
10.大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
正确选项:----
11.下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源
B.大数据技术创新取得明显突破
C.大数据应用推动势头良好
D.大数据产业支撑薄弱
专业答案:----
12.数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:----
13.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
14.购物篮问题是##的典型案例
A.数据变换
B.关联规则挖掘
C.数据分类
15.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
正确选项:----
南开21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业[答案]标准满分答案
二、多选题 (共 15 道试题,共 30 分)16.统计图表的可视化方法主要包括()
A.散点图
B.折线图
C.条形图
D.饼图
正确答案:----
17.##和##,它们把原数据变换或投影到较小的空间。
A.小波变换
B.中心化变换
C.主成分分析
D.对数变换
正确选项:----
18.常见的分类方法有
A.决策树
B.贝叶斯网络
C.遗传算法
D.FP算法
专业答案:----
19.传感器工作模式类别包括()
A.基于位置
B.基于活动
C.基于设备
20.大数据智能感知层:主要包括()及软硬件资源接入系统
A.数据传感体系
B.网络通信体系
C.传感适配体系
D.智能识别体系
正确选项:----
21.数据归约(Data Reduction)主要有有()
正确选项:----
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
正确答案:----
22.可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
专业答案:----
23.可使用##,##,##进行光滑。
A.最大值
B.箱中位数
C.箱边界
D.箱均值
正确选项:----
24.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A.消费能力
B.趋势报告
C.购物结果
25.离群点检测的应用包括()等。
A.欺诈检测
B.入侵检测
C.故障检测
D.疾病的不寻常模式
正确选项:----
26.下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
正确答案:----
27.大数据存储的特点与挑战有()
A.容量问题
B.延迟问题
C.安全问题
D.成本问题
正确答案:----
28.大数据时代预测人类移动行为的数据来源有
A.志愿者定位数据
B.装有导航设备的出租车轨迹数据
C.手机终端定位于通讯记录
D.社会网络签到数据
正确答案:----
29.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
正确答案:----
A.多态性
B.时效性
C.不完整性
D.冗余性
正确答案:----
30.基于大数据的临床决策支持系统的架构包括
A.支撑层
B.大数据分析层
C.网络层
D.应用层
专业答案:----
三、判断题 (共 20 道试题,共 40 分)
31.NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。