南开23春学期《大数据开发技术（二）》在线作业[正确答案]

来源：奥鹏远程教育日期：2023-10-07 作者：奥鹏作业辅导

南开23春学期《大数据开发技术（二）》在线作业[正确答案]单选题答案

23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《大数据开发技术（二）》在线作业-00002

试卷总分:100 得分:100

一、单选题 (共 25 道试题,共 50 分)

1.以下哪个函数可以求两个RDD的笛卡尔积（）

正确答案：D

A.union

B.substract

C.intersection

D.cartesian

正确答案：D

随机答案：ABCD

2.（）是AMPLab发布的一个R开发包，使得R摆脱单机运行的命运，可以作为Spark的Job运行在集群上

A.SparkR

B.BlinkDB

正确答案：C

正确答案：A

C.GraphX

D.Mllib

正确答案：A

正确答案：C

3.RDD的（）操作通常用来划分单词

随机答案：ABCD

A.filter

B.union

C.flatmap

D.mapPartitions

正确答案：D

4.以下哪个不是Scala的数据类型（）

A.AnyRef

B.Anything

C.NULL

D.Nothing

正确答案：D

5.Spark GraphX中类Graph的reverse方法可以（）

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D.合并边相同的属性

正确答案：B

6.图结构中如果任意两个顶点之间都存在边，那么称之为（）

A.完全图

B.有向完全图

C.无向图

D.简单图

正确答案：B

7.Spark中DataFrame的（）方法是进行条件查询

正确答案：A

A.where

B.join

C.limit

D.apply

正确答案：C

8.Scala中（）方法返回一个列表，包含除了最后一个元素之外的其他元素

A.head

B.init

随机答案：ABCD

C.tail

D.last

正确选项:--------

9.var a=10; for(a<-1 until 20){ println(a); } 共循环了（）次

A.10

B.11

C.20

D.19

正确选项:--------

10.以下哪个函数可以求两个RDD差集（）

正确答案：C

A.union

B.substract

C.intersection

D.cartesian

11.以下哪个函数可以对两个RDD进行合并（）

正确答案：D

A.union

B.substract

C.intersection

D.cartesian

12.Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（）方法

A.Graph(vertices,edges, defaultVertexAttr)

正确答案：A

正确答案：C

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

正确答案：A

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

正确选项:--------

随机答案：ABCD

D.GraphLoader.edgeListFile(sc,filename)

正确答案：A

正确答案：C

13.Scala中（）方法返回Map所有的value

A.key

B.keys

C.value

D.values

正确答案：C

14.GraphX中graph.vertices可以得到（）

A.顶点视图

B.边视图

C.顶点与边的三元组整体视图

D.有向图

正确选项:--------

15.GraphX中（）是完整提供边的各种操作类

A.RDD[Edge]

正确选项:--------

正确答案：D

B.EdgeRDD

正确答案：A

正确选项:--------

C.RDD[(VertexId,VD)]

正确选项:--------

正确答案：D

D.VertexRDD

正确答案：A

随机答案：ABCD

16.GraphX中（）是存放着存放顶点的RDD

A.RDD[Edge]

B.EdgeRDD

C.RDD[(VertexId,VD)]

D.VertexRDD

17.Spark GraphX中类Graph的collectNeighbors(edgeDirection: EdgeDirection)方法可以（）

正确答案：D

A.收集邻居顶点的顶点Id和顶点属性

正确选项:--------

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

正确答案：D

D.将顶点信息更新到图中

随机答案：ABCD

18.在MLlib中，逻辑回归算法的输入值为（）类型

A.Double

随机答案：ABCD

B.LabledPoint

随机答案：ABCD

C.Point

D.SGB

随机答案：ABCD

19.Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（）方法

随机答案：ABCD

A.Graph(vertices,edges, defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

D.GraphLoader.edgeListFile(sc,filename)

20.（）是Spark的数据挖掘算法库

A.Spark Core

B.BlinkDB

C.GraphX

D.Mllib

21.Spark Streming中（）函数可以使用func将源DStream中的每个元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新DStream

随机答案：ABCD

A.union

B.reduce

正确答案：A

C.join

D.cogroup

正确答案：B

22.Scala函数组合器可以通过一个函数重新计算列表中所有元素，并且返回一个相同数目元素的新列表的方法是（）

A.map

B.foreach

C.flatten

D.flatmap

正确选项:--------

23.Mllib中线性会馆算法中的参数numIterations表示（）

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso 和ridge 的正规化参数

正确答案：A

24.Scala列表方法中获取列表的第一个元素的方法是（）

A.drop

正确答案：A

B.head

C.filter

正确选项:--------

D.init

正确选项:--------

25.Spark Streming中（）函数可以对源DStream的每个元素通过函数func返回一个新的DStream

正确答案：D

A.map

B.flatMap

C.filter

D.union

正确答案：A

南开23春学期《大数据开发技术（二）》在线作业[正确答案]多选题答案

二、多选题 (共 10 道试题,共 20 分)

26.以下是机器学习的常用算法的是（）

A.回归算法

B.聚类算法

C.降维算法

D.分类算法

正确选项:--------

27.TF-IDF中IDF指的是（）

随机答案：ABCD

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

正确答案：C

E.词在文档集中出现的概率

28.Spark Streaming能够和（）无缝集成

A.Hadoop

正确答案：A

B.Spark SQL

C.Mllib

D.GraphX

正确答案：A

29.RDD是一个（）的数据结构

正确答案：C

A.可读写

B.只读的

C.容错的

D.可进行并行操作的

随机答案：ABCD

30.Spark DataFrame中（）方法可以返回一个Array对象

正确答案：C

A.collect

B.take

C.takeAsList

D.collectAsList

正确答案：A

31.以下算法中属于监督学习算法的是（）

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

正确答案：B

32.Scala函数支持（）

A.递归函数

B.高阶函数

C.柯里化

D.匿名函数

正确答案：C

33.MLlib中进行数据标准化的方式有（）

A.Normalizer

B.Standard

正确选项:--------

C.StandardScaleer

正确答案：C

D.MinMaxScaler

正确答案：D

34.Spark Core包含的功能有（）

A.任务调度

B.内存管理

C.SQL查询

D.容错机制

正确答案：B

35.Scala中使用（）方法来查看两个集合的交集元素

A.Set.concat

B.Set.&

C.Set.&&

D.Set.intersect

随机答案：ABCD

三、判断题 (共 15 道试题,共 30 分)

36.Scala是不可扩展的

37.Spark持久化RDD 后，在再一次需要计算该RDD 时将需要重新计算

随机答案：ABCD

38.聚类是一种无监督学习的方法，用于将高度相似的数据分到一类中

39.Scala可以通过“var” 来定义变量，通过“val” 关键字来定义常量

正确答案：B

40.RDD中join操作最后只返回两个RDD 都存在的键的连接结果。

正确选项:--------

41.Scala中Map的isEmpty函数在Map为空时返回true

42.Scala中Map的isEmpty函数在Map为空时返回false

43.如果其中有一个节点因为某种原因出现故障时， Spark 需要用到缓存数据时不会重算丢失的分区，因此不需要计算所有的分区。

44.Scala 语言中提供的数组是用来存储动态大小的同类型元素

45.RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD ，但是转换操作是懒操作，不会立刻执行计算。

正确答案：C

46.键值对RDD由一组组的键值对组成，这些RDD被称为PairRDD。

随机答案：ABCD

47.Spark可以通过反射机制推断RDD模式

随机答案：ABCD

48.Scala在子类中重写超类的抽象方法时，需要使用override关键字

正确答案：B

49.Spark GraphX课通过mapEdges[ED2](map: Edge[ED] => ED2)实现对边属性经过变换生成新的图

随机答案：ABCD

50.Scala中默认情况下使用的是可变的Map

南开23春学期《大数据开发技术（二）》在线作业[正确答案]奥鹏资讯分享：

南开23春学期《大数据开发技术（二）》在线作业[正确答案]相关练习题：
关于江西诗派有所谓一祖三宗的说法，那么这里的“一祖”是指哪位诗人？

当系统间需要高质量的大量数据传输的情况下常采用的交换方式为（）。

自觉梳理自己的头发应注意的情况有（）。

中职生职业生涯规划的特点（）

某城市生产总值由去年的2800万元增长到今年的3000万元，则增长1%的绝对量为（）万元。

（2）．保存和打印波形

潜水埋藏越浅，对降水入渗补给地下水越有利。

目前，我国人民币实施的汇率制度是（）

美国幼儿园教师的培训主要是分职前教育和（）。

公关传播的一般性目的，根据传播效果四层次理论，可以分为（）。

远期外汇的交割期限一般为1~6个月，最长不超过（）。

现场勘验笔录制作时候说明的顺序一般采用（）方式

在光色搭配中，参与搭配的颜色越多，其（）。

（）可以被简单界定为直接或间接地参与政策制定过程的个人、团体或组织。

下列描述中，错误的是（）。

直线的坡度与水平距离互为倒数。

对无机结合料稳定粒料类，三类半刚性材料的干缩特性的大小次序为：石灰稳定类＞水泥稳定类＞石灰粉煤灰稳定类。（）

Spark GraphX中类Graph的aggregateMessages方法可以（）

以下腐蚀形式不属于局部腐蚀的是（）

“它的价值是多少”是价值工程中（）活动程序中涉及的内容。

下列关于压缩软件WinRAR的叙述中，正确的是（）。

在一个氧化还原反应中，若两电对的电极电势值差很大，则可判断

李奥·贝纳的创意哲学中，产品“与生俱来的戏剧性”来自于（）

荷马史诗是西方长篇小说的胚胎。

孙叔敖是哪个国家的

本文标签：南开学期大数据开发技术（二）在线作业资料答案

南开23春学期《大数据开发技术（二）》在线作业[正确答案]

热门文章

国家开放大学2023年春学期《心理健康教育》形考作业一[正确答

国家开放大学2023年春学期《药学信息检索》形考任务[正确答案

国家开放大学2023年春学期《心理健康教育》形考作业二[正确答

国家开放大学2023年春学期《心理健康教育》期末考试[正确答案

中国医科大学2023年4月《肿瘤护理学》作业考核试题[正确答案

国家开放大学2023年春《幼儿园课程基础》形成性考核作业（四）

猜你喜欢

[奥鹏]大工21秋《软件工程》在线作业3[正确答案:答案100分]

东师小学生心理咨询20秋在线作业1[答案]

18秋东财《工程项目管理》在线作业二[答案]

18春北理工《国际经济学》在线作业答案

华东《毛泽东思想和中国特色社会主义理论体系概论》2020年春季

20年春福师《高级英语（二）》在线作业二[答案]