欢迎光临
奥鹏作业辅导

国开25春《大数据技术概论》形考任务 2[咨询答案]

来源:奥鹏在离线平时作业辅导   日期: 作者:admin

国开25春《大数据技术概论》形考任务 2[咨询答案]

国开25春《大数据技术概论》形考任务 2[咨询答案]
题目类型:
  判断题
题目:
  大数据预处理阶段不包括数据插补步骤.
选项:
  √
  ×


题目类型:
  判断题
题目:
  在大数据分析过程中,无论数据采集还是预处理都是不可或缺的环节,它们决定了分析结果的质量.
选项:
  √
  ×


题目类型:
  判断题
题目:
  缺失值的处理方法只有直接删除,没有其他的处理方法.
选项:
  √
  ×


题目类型:
  判断题
题目:
  特征选择是指选择对预测结果影响力较大的特征,以改善学习算法的性能和解释性.
选项:
  √
  ×


题目类型:
  判断题
题目:
  数据的收集过程中,数据采集的工具和方法对数据质量、全面性和后续处理没有影响.
选项:
  √
  ×


题目类型:
  判断题
题目:
  数据降维是一种能有效减少数据复杂度,简化模型计算的技术.
选项:
  √
  ×


题目类型:
  判断题
题目:
  在hdfs中,namenode为主节点,负责元数据管理和块位置的索引.
选项:
  √
  ×


题目类型:
  判断题
题目:
  sql数据库在定义关系时不需要定义属性的大小,从而避免了存储空间的浪费.
选项:
  √
  ×


题目类型:
  判断题
题目:
  在分布式文件系统hdfs中,数据丢失的问题可以通过在多个数据节点上复制相同的数据块来解决.
选项:
  √
  ×


题目类型:
  判断题
题目:
  当数据的结构发生变化时,使用sql数据库进行相应调整的成本相对较低.
选项:
  √
  ×


题目类型:
  单选题
题目:
  按照预先设定的搜索规则,编写程序自动浏览并下载目标网页信息的数据采集方法称作
选项:
  系统日志信息数据采集方法
  etl工具数据采集方法
  网络爬虫数据采集方法
  传感器数据采集方法


题目类型:
  单选题
题目:
  下列关于数据预处理的描述中,错误的是
选项:
  数据预处理是数据挖掘过程中很重要的一步
  数据预处理可以提高后续数据分析的准确率
  数据预处理中,无论何时数据都需要降维处理
  数据预处理包括数据清洗、数据集成等步骤


题目类型:
  单选题
题目:
  数据的整理是根据分析目的对数据格式、形态和结构进行处理,其中( )能够在不损失或损失较少数据本身价值的情况下压缩数据.
选项:
  数据的聚合
  数据的提取
  数据的连接
  数据的变换


题目类型:
  单选题
题目:
  下列关于异常值的描述中,错误的是
选项:
  可以使用箱线图检测异常值
  当异常值的数量不是很多时,可以直接将含有异常值的观测记录删除
  可以将异常值视为缺失值,按处理缺失值的方法处理异常值
  异常值的存在不属于数据质量问题,不会影响模型的预测能力


题目类型:
  单选题
题目:
  大数据预处理中,下列哪一项是用来处理噪声数据的?
选项:
  数据清洗
  数据转化
  数据归约
  数据抽样


题目类型:
  单选题
题目:
  数据预处理的主要目的是
选项:
  确定数据的来源
  改变数据的存储位置
  提高数据的质量和挖掘效率
  增加原始数据的数量


题目类型:
  单选题
题目:
  分位数分组的基本思想是将样本( ),各组所包含的样本个数相同.
选项:
  等分成若干份
  按属性值大小排序
  随机分组
  按序分组


题目类型:
  单选题
题目:
  下列哪一项不是常用的数据预处理步骤
选项:
  数据清洗
  数据集成
  数据归约
  数据可视化


题目类型:
  单选题
题目:
  以下哪种方法不适宜处理大数据中的异常值
选项:
  直接删除异常值
  将异常值替换为平均值
  将异常值视为缺失值,用插值法处理
  直接将异常值赋值为极大值


题目类型:
  单选题
题目:
  下列哪一项不属于数据预处理的目标
选项:
  提高数据质量
  提高数据安全性
  提高数据的可利用性
  减少数据处理的复杂性


题目类型:
  单选题
题目:
  下列关于缺失值的描述中,错误的是
选项:
  缺失值是指数据集中有些变量的一个或多个取值无法获得
  数据缺失的现象大量存在
  回归插补的方法不会改变数据分布
  当缺失数据的记录所占比例在数据集中少于10%时,可以将缺失值直接删除


题目类型:
  单选题
题目:
  下列有关sql数据库的局限性,描述错误的是
选项:
  结构化数据建模
  已有数据结构的变化成本高
  空间利用率低
  无法保证事务处理的可靠性


题目类型:
  单选题
题目:
  数据仓库为什么可以帮助企业保持竞争力( )?
选项:
  提供数据分析功能以及数据可视化和演示功能
  数据仓库可以自动清理垃圾数据
  使用数据仓库可以节省存储空间
  数据仓库提供了大量质量低下的数据供企业使用


题目类型:
  单选题
题目:
  下列数据库中,属于文档数据库的是
选项:
  redis
  neo4j
  hbase
  mongodb


题目类型:
  单选题
题目:
  下列各项属于数据仓库的特点的是
选项:
  数据以主题为导向,提供决策支持
  数据源单一
  数据质量低
  不支持历史数据分析





国开25春《大数据技术概论》形考任务 2[咨询答案]相关练习题:
以人为本的内涵不是固定的,可以多角度进行思考。()

卢浮宫的镇馆之宝是《蒙娜丽莎》《维纳斯》以及()。

左旋多巴治疗帕金森病的机制是(  )

以下程序的输出结果是( )。main(){ intx=2,y=-1,z=2;   if(x
As_____writer,hewas_____completefailure.

稳定性是指构件在原有的几何形状下保持平衡状态的能力。

单个施救者给予成人、儿童或婴儿心肺复苏,按压-通气比例均为30:2。

自然演绎方法是一种强调推理规则的重要性,既可以从真前提推出真语句,也可从假设得出推断的形式化方法。

社会美即是人物美。()

Reader’sDigest(《读者文摘》)isoneofthemostpopularandbest-sellingmagazinesintheUSA.(3.0分)

Theinventorofthefourmethodsofdiagnosis--observation,auscultationandolfaction,interrogation,andpalpationis ________.

微商是企业或者个人基于社会化媒体开店的新型电商,从模式上来说主要分为( )

恩格斯领导了世界上第一个国际工人组织--国际工人协会。

建筑限界是在设备限界的基础上,考虑了设备和管线安装尺寸后的(  )

106.浙江发展的文化自信既来自优秀的历史文化传统,又来自浙江改革开放以来所形成的勇立潮头、创业创新的浙江精神,以及浙江文化建设领域改革创新的实践经验。()

喉上神经内侧分支损伤可引起

若A1=”verygood”,则=LEN(A1)的值是

一般纳税人销售应税消费品时,如果开具的是普通发票,在计算消费税时,销售额应按下列(       )公式换算。

9.习近平总书记指出,当今世界正经历百年未有之大变局,但()的时代潮流没有变。①和平②发展③合作④共赢

到建国100年,我国物质文明、政治文明、精神文明、()、生态文明将全面提升,实现国家治理体系和治理能力现代化,成为综合国力和国际影响力领先的国家。

世界经济发展的大势所趋是单边主义和逆全球化。

权益法下,“长期股权投资”科目下设哪些明细科目(  )

.心理健康的判别方法主要有(        )

借条是向单位或个人借款、借物时留给对方作(   )的字据,通常在归还了钱物后,由立据者收回或当场销毁。

人生观的作用主要通过人生目的、人生态度、人生价值三个方面体现出来。人生目的回答人为什么活着,人生态度表明人应当怎样对待生活,人生价值判断什么样的人生才有意义。这三个方面互相联系、互相制约,其中居于核心地位的是()。

本文标签: 大数据技术概论 
扫描二维码获取答案

热门文章

猜你喜欢