南开22秋学期《大数据开发技术(二)》在线作业[正确答案]单选题答案
22秋学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(二)》在线作业-00003
试卷总分:100 得分:100
一、单选题 (共 25 道试题,共 50 分)
1.以下算法中属于聚类算法的是()
A.KNN算法
B.逻辑回归
C.随机森林
D.Kmeans
正确答案:A
正确答案:C
2.Spark GraphX中类Graph的reverse方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
随机答案:ABCD
3.GraphX中()是提供顶点的各种操作方法的对象
A.RDD[Edge]
正确选项:--------
B.EdgeRDD
随机答案:ABCD
正确答案:A
C.RDD[(VertexId,VD)]
正确答案:A
D.VertexRDD
正确答案:C
4.Spark Streming中DStream的每个RDD都是由()分割开来的数据集
正确答案:D
A.分区
B.一小段时间
C.数据量
D.随机
正确答案:C
5.请问RDD的()操作作用于K-V类型的RDD上,返回指定K的所有V值
正确答案:B
A.search
B.find
C.findByKey
正确选项:--------
D.lookup
正确答案:A
6.GraphX中()方法可以查询边信息
A.numVertices
B.numEdges
正确答案:D
C.vertices
D.edges
正确答案:D
7.Scala源代码被编译成()字节码,所以它可以运行于JVM之上
A.Spark
B.Scala
C.Java
D.JDK
正确答案:B
8.Scala中重写一个非抽象方法必须使用()修饰符。
A.extends
正确答案:B
B.override
正确答案:C
C.extend
D.overrides
正确答案:D
9.Graph类中如果要直接通过边数据文件创建图,要求数据按空格分隔,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
正确答案:D
正确答案:D
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
正确答案:C
正确答案:B
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
正确答案:B
正确答案:B
D.GraphLoader.edgeListFile(sc,filename)
正确答案:D
正确答案:D
10.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
A.filter
B.foreach
C.map
D.mkString
正确答案:D
11.Mllib中线性会馆算法中的参数stepSize表示()
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso 和ridge 的正规化参数
正确答案:A
12.Scala列表方法中丢弃前n个元素,并返回新列表的方法是()
A.drop
正确选项:--------
B.head
C.filter
正确答案:D
D.init
随机答案:ABCD
13.以下算法中属于无监督学习算法的是()
A.KNN算法
B.逻辑回归
C.随机森林
D.Kmeans
14.var a=10; do{ a+=1; }while(a<20) 共循环了()次
正确选项:--------
A.9
B.10
C.11
D.12
正确答案:C
随机答案:ABCD
15.Scala中如果函数无返回值,则函数返回类型为()
A.NULL
B.Void
C.Nothing
正确答案:A
D.Unit
随机答案:ABCD
16.var a=10; while(a<20){ a+=1; } 共循环了()次
A.9
B.10
C.11
D.12
17.递归函数意味着函数可以调用它()
A.其他函数
B.主函数
C.子函数
D.自身
正确答案:D
18.Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是()
A.map
B.foreach
C.flatten
D.flatmap
正确答案:A
随机答案:ABCD
19.Spark中DataFrame的()方法是进行排序查询
正确答案:D
A.order by
正确选项:--------
B.group by
C.select by
D.sort by
正确答案:C
20.Spark Streming中()函数可以对统计DStream中每个RDD包含的元素的个数,得到一个新的DStream
随机答案:ABCD
A.count
B.union
C.length
D.reduce
正确答案:A
21.Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的Dstream
正确答案:C
A.map
B.flatMap
C.filter
D.union
正确答案:A
22.()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上
A.SparkR
B.BlinkDB
正确答案:C
C.GraphX
D.Mllib
正确答案:C
23.Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法
正确答案:A
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
24.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()
A.filter
B.flatten
C.grouby
D.flatmap
25.以下哪个函数可以求两个RDD交集 ()
正确答案:B
A.union
B.substract
C.intersection
D.cartesian
正确答案:C
南开22秋学期《大数据开发技术(二)》在线作业[正确答案]多选题答案
二、多选题 (共 10 道试题,共 20 分)
26.Spark Streaming能够处理来自()的数据
A.Kafka
B.Flume
C.Twitter
D.ZeroMQ
随机答案:ABCD
27.Scala系统支持()作为对象成员
A.通用类
B.内部类
C.抽象类
D.复合类
正确答案:A
28.Scala中可以用()方法来连接两个或多个列表
A.::
B.#:::
C.List.:::()
D.List.concat()
正确答案:C
29.Scala中构造列表的两个基本单位是 ()
A.Nil
B.Nill
C.::
D.List
正确答案:C
30.Spark创建DataFrame对象方式有()
随机答案:ABCD
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
正确答案:B
31.Spark的RDD持久化操作有()方式
正确答案:A
A.cache
B.presist
C.storage
D.long
正确选项:--------
32.TF-IDF中TF指的是()
随机答案:ABCD
A.词频
B.词在文档中出现的次数
C.逆文档概率
D.词在文档集中出现的概率
正确答案:C
E.词在文档集中出现的概率
33.MapReudce不适合()任务
随机答案:ABCD
A.大数据计算
B.迭代
C.交互式
D.离线分析
正确答案:B
34.Spark支持的文件格式包括()
A.文本文件
B.JSON
C.CSV
D.SequenceFile
正确答案:C
35.Spark Streaming的特点有()
A.单极性
B.可伸缩
C.高吞吐量
D.容错能力强
正确答案:C
三、判断题 (共 15 道试题,共 30 分)
36.RDD的sortBy排序默认是升序
正确答案:B
37.RDD的flatMap操作是将函数应用于RDD 之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD 。
正确答案:C
38.Scala中Map的isEmpty函数在Map为空时返回false
39.Spark中DataFrame 的查询操作也是一个懒操作, 仅仅生成一个查询计划, 只有触发Action 操作才会进行计算并返回查询结果。
正确答案:C
40.RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。
随机答案:ABCD
41.RDD是一个可读写的数据结构
正确选项:--------
42.RDD中zip操作要求两个RDD的partition数量以及元素数量都相同
正确答案:B
43.RDD中join操作最后只返回两个RDD 都存在的键的连接结果。
正确答案:D
44.Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗
正确选项:--------
45.SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD
正确答案:D
46.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
47.PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
随机答案:ABCD
48.PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作
随机答案:ABCD
49.MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
50.RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
正确答案:D
南开22秋学期《大数据开发技术(二)》在线作业[正确答案]奥鹏资讯分享:
南开22秋学期《大数据开发技术(二)》在线作业[正确答案]相关练习题:
在英国有“深湛博士”之称的大主教布兰德瓦丁的数学著作( )和被称为“亚数学分析”。
某公司以"OCR"作为计算机文字识别系统软件商标获得注册。"OCR"为计算机文字识别系统的国际通用名称。对此事的以下说法中,哪些是正确的?
北京是以下哪个朝代的首都?
在简单凯恩斯模型中,投资增加使储蓄( )
近代会计的显著标志是什么( )。
CIS对外传播的对象有( )
供应链的结构有()
下列各项中,属于消费税应税消费品的是()。
某些物质,当沿着一定方向对其加力而使其变形时,在一定表面上将产生电荷,当外力去掉后,又重新回到不带电状态,这种现象称为压电效应。 ( )
唐朝前期制定的法律有( )
保险合同生效后,保险标的危险程度增加时,被保险人未履行危险程度增加通知义务,保险人对因危险程度增加而导致的保险标的的损失,可采取的正确的方式是 。
南京大学可以专升本,学历教育主要包括成人高等教育(业余)和自学考试两种类型。成人高等教育有高起本和专升本两个层次,开设专业29个;自学考试有7个本科段专业,在籍考生50万余人;同时面向普通高校在籍专科学生开设自学考试“专接本”2个本科段专业,对接21所高职院校。
教育的个体能力是现代社会的产物。
教学的一般过程 可 以 分 为( )。
下列不属于电子商务基础平台的是( )
人们更喜欢十全十美的人
Netstat命令可以观察所有本地主机正在进行通信的进程和相关状态( )
专升本层次最短学习期限为2.5年,高起本层次最短学习期限为5年,即从教育部学籍正式注册时间开始算起(通常春季为3月1日;秋季为9月1日),专升本层次2.5年,高起本层次5年修完学业可申请毕业(不含发证时间)。专升本层次最长学习期限为4.5年,高起本层次最长学习期限为7年,达到最长学习期限仍未满足毕业条件的学生,学籍将被注销。
若将一个正弦波电压信号转换成同频率的矩形波,应采用( )。
东财《MySQL数据库系统及应用》在线作业三(随机)-0015