南开22秋学期《大数据开发技术（二）》在线作业[正确答案]

来源：奥鹏远程教育日期：2022-12-01 作者：奥鹏作业辅导

可做全部院校网课作业、课程代看、网考、论文辅导！答案请加微信：xx99ttt 或QQ:1514133056

南开22秋学期《大数据开发技术（二）》在线作业[正确答案]单选题答案

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（二）》在线作业-00003

试卷总分:100 得分:100

一、单选题 (共 25 道试题,共 50 分)

1.以下算法中属于聚类算法的是（）

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

正确答案：A

正确答案：C

2.Spark GraphX中类Graph的reverse方法可以（）

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D.合并边相同的属性

随机答案：ABCD

3.GraphX中（）是提供顶点的各种操作方法的对象

A.RDD[Edge]

正确选项:--------

B.EdgeRDD

随机答案：ABCD

正确答案：A

C.RDD[(VertexId,VD)]

正确答案：A

D.VertexRDD

正确答案：C

4.Spark Streming中DStream的每个RDD都是由（）分割开来的数据集

正确答案：D

A.分区

B.一小段时间

C.数据量

D.随机

正确答案：C

5.请问RDD的（）操作作用于K-V类型的RDD上，返回指定K的所有V值

正确答案：B

A.search

B.find

C.findByKey

正确选项:--------

D.lookup

正确答案：A

6.GraphX中（）方法可以查询边信息

A.numVertices

B.numEdges

正确答案：D

C.vertices

D.edges

正确答案：D

7.Scala源代码被编译成（）字节码，所以它可以运行于JVM之上

A.Spark

B.Scala

C.Java

D.JDK

正确答案：B

8.Scala中重写一个非抽象方法必须使用（）修饰符。

A.extends

正确答案：B

B.override

正确答案：C

C.extend

D.overrides

正确答案：D

9.Graph类中如果要直接通过边数据文件创建图，要求数据按空格分隔，应该用（）方法

A.Graph(vertices,edges, defaultVertexAttr)

正确答案：D

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

正确答案：C

正确答案：B

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

正确答案：B

D.GraphLoader.edgeListFile(sc,filename)

正确答案：D

10.Scala列表方法中通过给定的方法将所有元素重新计算的方法是（）

A.filter

B.foreach

C.map

D.mkString

正确答案：D

11.Mllib中线性会馆算法中的参数stepSize表示（）

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso 和ridge 的正规化参数

正确答案：A

12.Scala列表方法中丢弃前n个元素，并返回新列表的方法是（）

A.drop

正确选项:--------

B.head

C.filter

正确答案：D

D.init

随机答案：ABCD

13.以下算法中属于无监督学习算法的是（）

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

14.var a=10; do{ a+=1; }while(a<20) 共循环了（）次

正确选项:--------

A.9

B.10

C.11

D.12

正确答案：C

随机答案：ABCD

15.Scala中如果函数无返回值，则函数返回类型为（）

A.NULL

B.Void

C.Nothing

正确答案：A

D.Unit

随机答案：ABCD

16.var a=10; while(a<20){ a+=1; } 共循环了（）次

A.9

B.10

C.11

D.12

17.递归函数意味着函数可以调用它（）

A.其他函数

B.主函数

C.子函数

D.自身

正确答案：D

18.Scala函数组合器可以接收一个可以处理嵌套列表的函数，然后把返回结果连接起来的方法是（）

A.map

B.foreach

C.flatten

D.flatmap

正确答案：A

随机答案：ABCD

19.Spark中DataFrame的（）方法是进行排序查询

正确答案：D

A.order by

正确选项:--------

B.group by

C.select by

D.sort by

正确答案：C

20.Spark Streming中（）函数可以对统计DStream中每个RDD包含的元素的个数，得到一个新的DStream

随机答案：ABCD

A.count

B.union

C.length

D.reduce

正确答案：A

21.Spark Streming中（）函数可以对源DStream中的每一个元素应用func方法进行计算，如果func函数返回结果为true，则保留该元素，否则丢弃该元素，返回一个新的Dstream

正确答案：C

A.map

B.flatMap

C.filter

D.union

正确答案：A

22.（）是AMPLab发布的一个R开发包，使得R摆脱单机运行的命运，可以作为Spark的Job运行在集群上

A.SparkR

B.BlinkDB

正确答案：C

C.GraphX

D.Mllib

正确答案：C

23.Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（）方法

正确答案：A

A.Graph(vertices,edges, defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)

D.GraphLoader.edgeListFile(sc,filename)

24.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是（）

A.filter

B.flatten

C.grouby

D.flatmap

25.以下哪个函数可以求两个RDD交集（）

正确答案：B

A.union

B.substract

C.intersection

D.cartesian

正确答案：C

南开22秋学期《大数据开发技术（二）》在线作业[正确答案]多选题答案

二、多选题 (共 10 道试题,共 20 分)

26.Spark Streaming能够处理来自（）的数据

A.Kafka

B.Flume

C.Twitter

D.ZeroMQ

随机答案：ABCD

27.Scala系统支持（）作为对象成员

A.通用类

B.内部类

C.抽象类

D.复合类

正确答案：A

28.Scala中可以用（）方法来连接两个或多个列表

A.::

B.#:::

C.List.:::()

D.List.concat()

正确答案：C

29.Scala中构造列表的两个基本单位是（）

A.Nil

B.Nill

C.::

D.List

正确答案：C

30.Spark创建DataFrame对象方式有（）

随机答案：ABCD

A.结构化数据文件

B.外部数据库

C.RDD

D.Hive中的表

正确答案：B

31.Spark的RDD持久化操作有()方式

正确答案：A

A.cache

B.presist

C.storage

D.long

正确选项:--------

32.TF-IDF中TF指的是（）

随机答案：ABCD

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

正确答案：C

E.词在文档集中出现的概率

33.MapReudce不适合（）任务

随机答案：ABCD

A.大数据计算

B.迭代

C.交互式

D.离线分析

正确答案：B

34.Spark支持的文件格式包括（）

A.文本文件

B.JSON

C.CSV

D.SequenceFile

正确答案：C

35.Spark Streaming的特点有（）

A.单极性

B.可伸缩

C.高吞吐量

D.容错能力强

正确答案：C

三、判断题 (共 15 道试题,共 30 分)

36.RDD的sortBy排序默认是升序

正确答案：B

37.RDD的flatMap操作是将函数应用于RDD 之中的每一个元素，将返回的迭代器(数组、列表等)中的所有元素构成新的RDD 。

正确答案：C

38.Scala中Map的isEmpty函数在Map为空时返回false

39.Spark中DataFrame 的查询操作也是一个懒操作，仅仅生成一个查询计划，只有触发Action 操作才会进行计算并返回查询结果。

正确答案：C

40.RDD中的collect 函数是一个行动操作，把RDD 所有元素转换成数组并返回到Driver 端，适用于大数据处理后的返回。

随机答案：ABCD

41.RDD是一个可读写的数据结构

正确选项:--------

42.RDD中zip操作要求两个RDD的partition数量以及元素数量都相同

正确答案：B

43.RDD中join操作最后只返回两个RDD 都存在的键的连接结果。

正确答案：D

44.Spark取代Hadoop仅仅是取代MapReduce这种计算框架，Spark可以取代HDFS吗

正确选项:--------

45.SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD

正确答案：D

46.Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。

47.PairRDD中groupBy（func）func返回key，传入的RDD的各个元素根据这个key进行分组。

随机答案：ABCD

48.PairRDD中mapValues是针对键值对（Key，Value）类型的数据中的key和Value进行Map操作

随机答案：ABCD

49.MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。

50.RDD的转换操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。

正确答案：D

南开22秋学期《大数据开发技术（二）》在线作业[正确答案]奥鹏资讯分享：

南开22秋学期《大数据开发技术（二）》在线作业[正确答案]相关练习题：
在英国有“深湛博士”之称的大主教布兰德瓦丁的数学著作（）和被称为“亚数学分析”。

某公司以"OCR"作为计算机文字识别系统软件商标获得注册。"OCR"为计算机文字识别系统的国际通用名称。对此事的以下说法中，哪些是正确的？

北京是以下哪个朝代的首都？

在简单凯恩斯模型中，投资增加使储蓄（）

近代会计的显著标志是什么（）。

CIS对外传播的对象有（）

供应链的结构有（）

下列各项中，属于消费税应税消费品的是（）。

某些物质，当沿着一定方向对其加力而使其变形时，在一定表面上将产生电荷，当外力去掉后，又重新回到不带电状态，这种现象称为压电效应。（）

唐朝前期制定的法律有（）

保险合同生效后,保险标的危险程度增加时,被保险人未履行危险程度增加通知义务,保险人对因危险程度增加而导致的保险标的的损失,可采取的正确的方式是。

南京大学可以专升本，学历教育主要包括成人高等教育（业余）和自学考试两种类型。成人高等教育有高起本和专升本两个层次，开设专业29个；自学考试有7个本科段专业，在籍考生50万余人；同时面向普通高校在籍专科学生开设自学考试“专接本”2个本科段专业，对接21所高职院校。

教育的个体能力是现代社会的产物。

教学的一般过程可以分为（）。

下列不属于电子商务基础平台的是（　　　　）

人们更喜欢十全十美的人

Netstat命令可以观察所有本地主机正在进行通信的进程和相关状态（）

专升本层次最短学习期限为2.5年，高起本层次最短学习期限为5年，即从教育部学籍正式注册时间开始算起（通常春季为3月1日；秋季为9月1日），专升本层次2.5年，高起本层次5年修完学业可申请毕业（不含发证时间）。专升本层次最长学习期限为4.5年，高起本层次最长学习期限为7年，达到最长学习期限仍未满足毕业条件的学生，学籍将被注销。

若将一个正弦波电压信号转换成同频率的矩形波，应采用（）。

东财《MySQL数据库系统及应用》在线作业三（随机）-0015

本文标签：南开学期大数据开发技术（二）在线作业正确正确答案

南开22秋学期《大数据开发技术（二）》在线作业[正确答案]

热门文章

[奥鹏]国家开放大学22年春《监督学》形成性考核[正确正确答案

[奥鹏]22年春福师《小学班队管理与班主任工作》在线作业二[正

[奥鹏]东师世界文明史2022年春学期在线作业1[正确正确答案]

[奥鹏]中国医科大学2021年12月《药物分析》作业考核试题[正确答

[奥鹏]东师积极心理学2022年春学期在线作业2[正确正确答案]

[奥鹏]东师中国近现代史纲要（专升本）2022年春学期在线作业

猜你喜欢

保险人核保后，向投保人签发保险单，这一过程属于保险合同订

西安交通大学18年3月课程考试《法理学》作业考核试题(答案)

20年秋福师《发展心理学》在线作业二[答案]

18春中国医科大学《卫生事业管理学》在线作业答案

兰大《民事诉讼法学》19秋平时作业2[答案]

电科20春《电工技术基础》在线作业3[答案]