欢迎光临
奥鹏作业辅导

南开23春学期《大数据开发技术(二)》在线作业[正确答案]

来源:奥鹏远程教育   日期: 作者:奥鹏作业辅导

南开23春学期《大数据开发技术(二)》在线作业[正确答案]

南开23春学期《大数据开发技术(二)》在线作业[正确答案]单选题答案

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(二)》在线作业-00002

试卷总分:100  得分:100

一、单选题 (共 25 道试题,共 50 分)

1.以下哪个函数可以求两个RDD的笛卡尔积()

正确答案:D

A.union

B.substract

C.intersection

D.cartesian

正确答案:D

正确答案:D

随机答案:ABCD

 

2.()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上

A.SparkR

B.BlinkDB

正确答案:C

正确答案:A

C.GraphX

D.Mllib

正确答案:A

正确答案:C

 

3.RDD的()操作通常用来划分单词

随机答案:ABCD

A.filter

B.union

C.flatmap

D.mapPartitions

正确答案:D

 

4.以下哪个不是Scala的数据类型()

A.AnyRef

B.Anything

C.NULL

D.Nothing

正确答案:D

 

5.Spark GraphX中类Graph的reverse方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D.合并边相同的属性

正确答案:B

 

6.图结构中如果任意两个顶点之间都存在边,那么称之为()

A.完全图

B.有向完全图

C.无向图

D.简单图

正确答案:B

 

7.Spark中DataFrame的()方法是进行条件查询

正确答案:A

A.where

B.join

C.limit

D.apply

正确答案:C

 

8.Scala中()方法返回一个列表,包含除了最后一个元素之外的其他元素

A.head

B.init

随机答案:ABCD

C.tail

D.last

正确选项:--------

 

9.var a=10; for(a<-1 until 20){ println(a); } 共循环了()次

A.10

B.11

C.20

D.19

正确选项:--------

 

10.以下哪个函数可以求两个RDD差集 ()

正确答案:C

A.union

B.substract

C.intersection

D.cartesian

 

11.以下哪个函数可以对两个RDD进行合并()

正确答案:D

A.union

B.substract

C.intersection

D.cartesian

 

12.Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法

A.Graph(vertices,edges, defaultVertexAttr)

正确答案:A

正确答案:C

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

正确答案:A

正确答案:A

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

正确选项:--------

随机答案:ABCD

D.GraphLoader.edgeListFile(sc,filename)

正确答案:A

正确答案:C

 

13.Scala中()方法返回Map所有的value

A.key

B.keys

C.value

D.values

正确答案:C

 

14.GraphX中graph.vertices可以得到()

A.顶点视图

B.边视图

C.顶点与边的三元组整体视图

D.有向图

正确选项:--------

 

15.GraphX中()是完整提供边的各种操作类

A.RDD[Edge]

正确选项:--------

正确答案:D

B.EdgeRDD

正确答案:A

正确选项:--------

正确选项:--------

C.RDD[(VertexId,VD)]

正确选项:--------

正确答案:D

D.VertexRDD

正确答案:A

随机答案:ABCD

 

16.GraphX中()是存放着存放顶点的RDD

A.RDD[Edge]

B.EdgeRDD

C.RDD[(VertexId,VD)]

D.VertexRDD

 

17.Spark GraphX中类Graph的collectNeighbors(edgeDirection: EdgeDirection)方法可以()

正确答案:D

A.收集邻居顶点的顶点Id和顶点属性

正确选项:--------

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

正确答案:D

D.将顶点信息更新到图中

随机答案:ABCD

 

18.在MLlib中,逻辑回归算法的输入值为()类型

A.Double

随机答案:ABCD

B.LabledPoint

随机答案:ABCD

C.Point

D.SGB

随机答案:ABCD

 

19.Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法

随机答案:ABCD

A.Graph(vertices,edges, defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

D.GraphLoader.edgeListFile(sc,filename)

 

20.()是Spark的数据挖掘算法库

A.Spark Core

B.BlinkDB

C.GraphX

D.Mllib

 

21.Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream

随机答案:ABCD

A.union

B.reduce

正确答案:A

C.join

D.cogroup

正确答案:B

 

22.Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是()

A.map

B.foreach

C.flatten

D.flatmap

正确选项:--------

 

23.Mllib中线性会馆算法中的参数numIterations表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso 和ridge 的正规化参数

正确答案:A

 

24.Scala列表方法中获取列表的第一个元素的方法是()

A.drop

正确答案:A

B.head

C.filter

正确选项:--------

D.init

正确选项:--------

 

25.Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream

正确答案:D

A.map

B.flatMap

C.filter

D.union

正确答案:A

 

南开23春学期《大数据开发技术(二)》在线作业[正确答案]多选题答案

二、多选题 (共 10 道试题,共 20 分)

26.以下是机器学习的常用算法的是()

A.回归算法

B.聚类算法

C.降维算法

D.分类算法

正确选项:--------

 

27.TF-IDF中IDF指的是()

随机答案:ABCD

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

正确答案:C

E.词在文档集中出现的概率

 

28.Spark Streaming能够和()无缝集成

A.Hadoop

正确答案:A

B.Spark SQL

C.Mllib

D.GraphX

正确答案:A

 

29.RDD是一个()的数据结构

正确答案:C

A.可读写

B.只读的

C.容错的

D.可进行并行操作的

随机答案:ABCD

 

30.Spark DataFrame中()方法可以返回一个Array对象

正确答案:C

A.collect

B.take

C.takeAsList

D.collectAsList

正确答案:A

 

31.以下算法中属于监督学习算法的是()

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

正确答案:B

 

32.Scala函数支持()

A.递归函数

B.高阶函数

C.柯里化

D.匿名函数

正确答案:C

 

33.MLlib中进行数据标准化的方式有()

A.Normalizer

B.Standard

正确选项:--------

C.StandardScaleer

正确答案:C

D.MinMaxScaler

正确答案:D

 

34.Spark Core包含的功能有()

A.任务调度

B.内存管理

C.SQL查询

D.容错机制

正确答案:B

 

35.Scala中使用()方法来查看两个集合的交集元素

A.Set.concat

B.Set.&

C.Set.&&

D.Set.intersect

随机答案:ABCD

 

三、判断题 (共 15 道试题,共 30 分)

36.Scala是不可扩展的

 

37.Spark持久化RDD 后,在再一次需要计算该RDD 时将需要重新计算

随机答案:ABCD

 

38.聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中

 

39.Scala可以通过“var” 来定义变量,通过“val” 关键字来定义常量

正确答案:B

 

40.RDD中join操作最后只返回两个RDD 都存在的键的连接结果。

正确选项:--------

 

41.Scala中Map的isEmpty函数在Map为空时返回true

 

42.Scala中Map的isEmpty函数在Map为空时返回false

 

43.如果其中有一个节点因为某种原因出现故障时, Spark 需要用到缓存数据时不会重算丢失的分区,因此不需要计算所有的分区。

 

44.Scala 语言中提供的数组是用来存储动态大小的同类型元素

 

45.RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。

正确答案:C

 

46.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。

随机答案:ABCD

 

47.Spark可以通过反射机制推断RDD模式

随机答案:ABCD

 

48.Scala在子类中重写超类的抽象方法时,需要使用override关键字

正确答案:B

 

49.Spark GraphX课通过mapEdges[ED2](map: Edge[ED] => ED2)实现对边属性经过变换生成新的图

随机答案:ABCD

 

50.Scala中默认情况下使用的是可变的Map

 

南开23春学期《大数据开发技术(二)》在线作业[正确答案]奥鹏资讯分享:




南开23春学期《大数据开发技术(二)》在线作业[正确答案]相关练习题:
关于江西诗派有所谓一祖三宗的说法,那么这里的“一祖”是指哪位诗人?

当系统间需要高质量的大量数据传输的情况下常采用的交换方式为( )。

自觉梳理自己的头发应注意的情况有( )。

中职生职业生涯规划的特点( )

某城市生产总值由去年的2800万元增长到今年的3000万元,则增长1%的绝对量为()万元。

  (2).保存和打印波形

潜水埋藏越浅,对降水入渗补给地下水越有利。

目前,我国人民币实施的汇率制度是( )

美国幼儿园教师的培训主要是分职前教育和()。

公关传播的一般性目的,根据传播效果四层次理论,可以分为()。

 远期外汇的交割期限一般为1~6个月,最长不超过( )。  

现场勘验笔录制作时候说明的顺序一般采用()方式

在光色搭配中,参与搭配的颜色越多,其()。

()可以被简单界定为直接或间接地参与政策制定过程的个人、团体或组织。

下列描述中,错误的是()。

直线的坡度与水平距离互为倒数。

对无机结合料稳定粒料类,三类半刚性材料的干缩特性的大小次序为:石灰稳定类>水泥稳定类>石灰粉煤灰稳定类。(    )

Spark GraphX中类Graph的aggregateMessages方法可以()

以下腐蚀形式不属于局部腐蚀的是 ( )

“它的价值是多少”是价值工程中()活动程序中涉及的内容。

下列关于压缩软件WinRAR的叙述中,正确的是( )。

在一个氧化还原反应中,若两电对的电极电势值差很大,则可判断

 李奥·贝纳的创意哲学中,产品“与生俱来的戏剧性”来自于()  

荷马史诗是西方长篇小说的胚胎。

孙叔敖是哪个国家的

扫描二维码获取答案

热门文章

猜你喜欢

  • 东师小学生心理咨询20秋在线作业1[答案]

  • 小学生心理咨询20秋在线作业1题目 试卷总分:100 得分:100 一、单选题 (共 10 道试题,共 30 分) 1.厌恶疗法属于 A.精神分析疗法 B.行为主义疗法 C.人本主义疗法
  • 18春北理工《国际经济学》在线作业答案

  • 北理工《国际经济学》在线作业-0004 试卷总分:100 得分:0 一、 单选题 (共 10 道试题,共 30 分) 1.强调贸易保护对促进就业积极作用的是( )。 A.重商主义 B