北语22春《大数据技术与应用》作业2[正确正确答案]单选题答案
22春《大数据技术与应用》作业2题目
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 60 分)
1.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
正确选项:--------
D.X_scores = clf.negative_outlier_factor_
2.利用pandas处理数据缺失值时,用于填充缺失值的函数为
A.isnull
B.head
C.fillna
D.dropna
3.决策树生成过程中,以信息增益作为特征选择准则生成决策树的算法是
A.ID3
B.C4.5
C.CART
D.以上都不对
正确选项:--------
正确选项:--------
正确选项:--------
正确选项:--------
4.决策树的生成是一个递归过程,在决策树基本算法中,满足哪种情形,会导致递归过程返回停止
A.特征选择次数超过一定限制
B.当前属性集为空,或所有样本在所有属性上取值相同
C.决策树深度超过2
D.以上都不对
5.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示
正确选项:--------
A.训练数据集
B.测试数据集
C.训练数据的类别标签数组
D.测试数据的类别标签数组
正确选项:--------
6.以下不属于大数据分析方法的是()
A.统计分析
B.数学模型
C.机器学习
D.人工智能
7.用训练好的孤立森林isolation forest实例对数据进行异常值检测的语句是
A.from sklean.ensemble import IsolationForest
B.LocalOutlierFactor
C.clf= IsolationForest(max_samples=100,random_state=0)
D.clf.fit(X_train)
E.y_pred=clf.fit_predict(X)
F.y_pred_test = clf.predict(X_test)
8.用训练好的模糊C均值聚类实例对数据进行聚类操作的语句是
A.from fcmeans import FCM
B.fcm=FCM(n_clusters=3)
C.fcm.fit(X)
D.fcm_labels=fcm.u.argmax(axis=1)
正确选项:--------
9.数据集{1,2,2,2,3,4}的众数是
A.1
B.2
C.3
D.4
10.不包含任何项的项集是指
A.项
B.空集
C.超项集
D.子项集
11.利用Sklearn构建KNN分类器,用于KNN分类器训练的程序为
A.knn.fit(X_train,y_train)
B.y_pred=knn.predict(X_test)
C.knn=KNeighborsClassifier(n_neighbors=k)
D.以上都不对
12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A.2
B.4
C.6
D.8
13.关联规则 X→Y 表示中X称为
A.前件
B.后件
C.中间件
D.以上都不对
14.从软件库中导入模糊C均值聚类算法类的语句是
A.from fcmeans import FCM
B.fcm=FCM(n_clusters=3)
C.fcm.fit(X)
D.fcm_labels=fcm.u.argmax(axis=1)
15.如果一个项集包含K个项,则该项集称为
A.项
B.空集
C.超项集
D.K项集
正确选项:--------
北语22春《大数据技术与应用》作业2[正确正确答案]多选题答案
二、多选题 (共 5 道试题,共 20 分)
16.数据集中趋势分析的常用指标包括
A.平均值
B.中位数
C.众数
D.四分位数
17.以下哪些是数据可视化图表
A.柱状图
B.折线图
C.饼图
D.散点图
正确选项:--------
18.分箱法包括
A.等深分箱
B.众数分箱
C.等宽分箱
D.以上都不对
19.在数据清洗过程中,用于处理噪声值的方法包括
A.盖帽法
B.分箱法
C.聚类法
D.以上都不对
20.定性数据包括
A.有序数据
B.无序数据
C.定类等级数据
D.定性等级数据
三、判断题 (共 5 道试题,共 20 分)
21.回归算法的目的是寻找决策边界
22.描述性数据分析属于比较高级复杂的数据分析手段
23.盖帽法是将某连续变量均值上下三倍标准差范围外的数值全部删除
24.定性数据包括离散数据和连续数据
25.等宽分箱方法是指每个分箱中样本数量一致
北语22春《大数据技术与应用》作业2[正确正确答案]奥鹏资讯分享:
云南交通职业学院有道路桥梁工程技术、工程测量技术、工程造价、建筑材料工程技术、底下与隧道工程技术、市政工程技术、安全技术与管理、建筑材料工程技术、道路养护与管理、土木工程检测技术、测绘工程技术、建筑工程技术、建设项目信息化管理、汽车运用与维修技术、汽车营销与服务、新能源汽车技术、汽车检测与维修技术、汽车智能技术、会计、审计、经济信息管理、连锁经营管理、市场营销、网络营销、人力资源管理、公路机械化施工技术、工程机械运用技术、飞行器维修技术、飞机机电设备维修、城市轨道交通车辆技术、空中乘务、民航安全技术管理、物流管理、物流工程技术、道路运输与路政管理、报关与国际货运、交通运营管理、数字媒体艺术设计、建筑智能化工程技术、智能交通技术运用、城市轨道交通机电技术、铁道信号自动控制、计算机网络技术、云计算技术与应用、通信技术、计算机网络技术、物联网应用技术、大数据技术与应用、文秘、行政管理、商务英语、供用电技术、电气自动化技术、应用泰语、休闲服务与管理、人物形象设计、首饰设计与工艺、动漫设计、广告设计与制作、环境艺术设计、视觉传播设计与制作、影视多媒体技术、食品加工技术、电子竞技运动与管理、摄影摄像技术等专科专业,毕业学生可报考专升本。
云南交通职业学院大专应届毕业学生可在大三毕业时通过省内普通专升本进行报考,也可以在毕业获得大专文凭后通过成人高等教育方式报考专升本。
不管是哪种专升本,云南交通职业学院大专毕业学生报考专升本,所获毕业证书均是国家承认的、学信网注册可查的。
而且成人高等教育专升本不仅可报考对口或相近专业,还能跨专业报考,还可以跨地域报考国内知名院校。
比如远程教育方式可选择北京大学(医学)、北京师范大学、北京外国语大学、大连理工大学、南开大学、天津大学、江南大学、西北工业大学、西安交通大学、东北大学、吉林大学、东北财经大学、东北农业大学、东北师范大学、北京语言大学、电子科技大学、兰州大学、四川大学、中国地质大学(北京)、中国传媒大学、对外经济贸易大学、北京邮电大学、北京交通大学、中国医科大学、北京中医药大学、中国石油大学(华东)、四川农业大学、西南大学等经教育部批准远程教育试点的985/211在内的示范高校。立即联系学业顾问>>