东大《大数据开发技术(一)》19秋期末考核[答案]满分答案
《大数据开发技术(一)》19秋期末考核-0001
一、单选题 (共 15 道试题,共 30 分)
1.UMP系通过()来实现实现数据路由的基本功能
A.愚公系统
B.Procy服务器
C.Controller服务器
D.Agent服务器
2.Amazon Redshift属于()
A.键值数据库
B.数据仓库
C.关系数据库
D.NoSQL数据库
3.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A.键值数据库
B.文档数据库
C.图数据库
D.列族数据库
4.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Zookeeper
B.Region
C.Master
D.Chubby
5.UMP系统中面对中等规模用户如何进行资源调度()
A.随机分配MySQL实例
B.每个用户独占一个MySQL实例
C.可以共享同一个MySQL实例
D.会占用多个独立的MySQL实例
6.以下亚马逊的产品中哪个是数据仓库
A.Redshift
B.RDS
C.ElastiCache
D.DynamoDB
7.UMP系统中面对多个小规模用户如何进行资源调度()
A.随机分配MySQL实例
B.每个用户独占一个MySQL实例
C.可以共享同一个MySQL实例
D.会占用多个独立的MySQL实例
8.关于Strom中Bolt说法错误的是()。
A.Bolt是一个被动的角色,Spout是一个主动的角色
B.Bolt是Streams的状态转换过程的抽象含义
C.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
D.Bolt不仅可以处理Tuple还可以创建新的Tuple
9.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A.键值数据库
B.文档数据库
C.图数据库
D.列族数据库
10.应用于分布式数据存储与管理 数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A.键值数据库
B.文档数据库
C.图数据库
D.列族数据库
11.Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A.客户端
B.Slaver
C.Region
D.Master
12.以下亚马逊的产品中哪个是分布式内存缓存
A.Redshift
B.RDS
C.ElastiCache
D.DynamoDB
13.Hbase采用()作为底层数据存储
A.传统文件系统
B.Hbase
C.HDFS
D.GFS
14.关于Hadoop集群,以下说法错误的是()。
A.SecondaryNameNode可以和NameNode共用一台机器
B.SecondaryNameNode可以和DataNode共用一台机器
C.NameNode可以和JobTracker共用一台机器
D.JobTracker指派的任务由TaskTracker执行
15.Map Task和Reduce Task均由()启动。
A.Task Tracker
B.Task
C.Job Tracker
D.Client
东大《大数据开发技术(一)》19秋期末考核[答案]多选题答案
二、多选题 (共 10 道试题,共 20 分)
16.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A.FsImage
B.EditLog
C.DataNode
D.Block
17.以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A.Pregel
B.Hama
C.Giraph
D.DEX
18.以下哪种数据库属于NoSQL数据库()
A.MySQL
B.MongoDB
C.InfiniteGraph
D.DynamoDB
19.关系数据库与NoSQL数据库相比适用于哪些领域()
A.银行
B.电信
C.传统企业的数据分析
D.互联网企业大数据处理
20.以下哪种数据库是针对在线业务的,并且抛弃了关系模型()
A.Redis
B.Oracle
C.MySQL
D.MongoDB
21.分布式文件系统的设计目的包括()。
A.速度
B.并发控制
C.容错
D.可伸缩性
22.MapReduce的main函数中设置输出类型的方法有()。
A.setOutputValueClass
B.setOutputKeyClass
C.setOutputClass
D.setKeyValueClass
23.以下哪些是云计算关键技术()。
A.虚拟化
B.物联网
C.单租户
D.分布式计算
E.分布式存储
24.Pregel作为分布式图计算的计算框架,主要用于()
A.最短路径
B.图遍历
C.PageRank计算
D.MapReduce
25.以下哪个应用适合用Pregel来解决()
A.求极值
B.数据库的笛卡尔积
C.单元最短路径
D.二分匹配
三、判断题 (共 10 道试题,共 20 分)
26.分布式离线分析可以实现秒级别的实时分析响应。
27.Hadoop平台在大数据发展的成熟期时开始大行其道
28.Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
29.在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
30.HBase中包含一个Region服务器和许多个Master服务器
31.HDFS读数据过程中读取请求获得的输入流是FSInputStream
32.Linux系统中只有Ubuntu可以安装Hadoop。