北语22春《大数据技术与应用》作业1[正确正确答案]单选题答案
22春《大数据技术与应用》作业1题目
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 60 分)
1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A.2
B.4
C.6
D.8
正确选项:--------
2.在pandas中脏数据的典型表示有()
A.np.nan
B.*
C.?
D.no
正确选项:--------
3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为
A.isnull
B.head
C.tail
正确选项:--------
D.dropna
正确选项:--------
4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为
A.2
B.4
C.6
D.8
5.数据集{1,2,3,5,7,8,9}的中位数是
A.3
B.5
C.7
D.4
6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
正确选项:--------
D.X_scores = clf.negative_outlier_factor_
正确选项:--------
7.利用pandas处理数据缺失值时,用于发现重复值的函数为
A.isnull
B.duplicated
正确选项:--------
C.fillna
D.dropna
8.分类的目标是
A.将一组对象分组以发现它们之间是否存在某种关系
B.从一组预定义的类中查找新对象所属的类
C.提高数据标签利用效率
D.以上都不对
正确选项:--------
正确选项:--------
9.项集 S ={ },则项集S称为
A.1项集
B.2项集
C.3项集
D.空集
正确选项:--------
10.训练随机森林模型实例的语句是
A.from sklearn.tree import DecisionTreetClassifier
正确选项:--------
B.clf=DecisionTreetClassifier()
正确选项:--------
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
正确选项:--------
11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示
A.训练数据集
B.测试数据集
C.训练数据的类别标签数组
D.测试数据的类别标签数组
12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为
A.20
B.22
C.20.5
D.28
13.关联规则 X→Y 表示中Y称为
A.前件
B.后件
C.中间件
D.以上都不对
14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为
A.20
B.22
C.20.5
D.18.5
正确选项:--------
15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
北语22春《大数据技术与应用》作业1[正确正确答案]多选题答案
二、多选题 (共 5 道试题,共 20 分)
16.常用的描述统计分析方法包括
A.对比分析法
B.平均分析法
C.交叉分析法
D.以上都不对
17.关联规则反映的是
A.可分类性
B.可分割性
C.事物之间相互依存性
D.事物之间相互关联性
18.数据集中趋势分析的常用指标包括
A.平均值
B.中位数
C.众数
D.四分位数
19.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括
A.统计学
B.机器学习
C.数据库
D.模式识别
20.常用的分类方法包括
A.朴素贝叶斯分类器
B.决策树
C.KNN
D.以上都不对
三、判断题 (共 5 道试题,共 20 分)
21.分箱法是针对连续的数值型数据中噪声进行处理
22.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础
23.数据类型等级最高的是定类数据
24.分类算法的目的是找到数据的最优拟合
25.数据类型等级最低的是定比数据
北语22春《大数据技术与应用》作业1[正确正确答案]奥鹏资讯分享:
信阳职业技术学院位于河南省信阳市,是经河南省人民政府批准、教育部备案的全日制普通高等职业院校,是河南省示范性高等职业院校、河南省职业教育品牌示范院校、首批河南省健康养老护理教育培训基地。
信阳职业技术学院高职单招规定:
一、考试时间
我省2020年高职单招安排在统一高考录取结束后进行。具体时间另行通知。
二、招生对象
已通过2020年河南省普通高校招生考试报名和对口招收中等职业学校毕业生考试报名,未被统一高考等其他类型的普通高校招生考试录取的考生。
三、考录方式
1、高中毕业生可按照高中学业水平考试成绩和职业适应性测试成绩进行录取。
2、中职毕业生和社会考生原则上不再组织文化知识考试,可依据职业技能测试成绩进行录取。
3、参加统一高考的考生高考成绩可作为单招录取依据。
四、招生专业:
目前信阳职业技术学院2020年单招尚未公布,可参考2019年单招开设专业:
医疗器械维护与管理、护理、护理(英语护理)、护理(日语护理)、护理(老年护理)、护理(康复护理)、助产、药学、中药学、医学检验技术、医学检验技术(输血检验技术)、卫生检验与检疫技术、新闻采编与制作、播音与主持、计算机应用技术、计算机应用技术(UI设计师)、计算机应用技术(web开发与应用)、计算机应用技术(web前端设计与应用)、软件技术(Java安卓软件开发)、计算机网络技术、通信技术、通信技术(5G应用)、大数据技术与应用、国际邮轮乘务管理、水路运输与海事管理(国际海员)、商务英语、音乐表演、建筑装饰工程技术、建筑工程技术、城乡规划(乡村规划设计)、建设工程管理、工程造价、电气自动化技术、工业机器人技术、汽车检测与维修技术、汽车检测与维修技术(机电维修工程师)、新能源汽车技术、汽车营销与服务、汽车营销与服务(定损与评估师)、高速铁路客运乘务、旅游管理(旅游电子商务)、旅游管理(涉外旅游)、酒店管理、酒店管理(星级酒店管理与经营)、烹调工艺与营养(信阳菜烹调)、会计、会计(注册会计师)、投资与理财、互联网金融、电子商务、市场营销、人力资源管理等。