第一章 单元测试
1、单选题:什么是KDD?()
A:动态知识发现
B:数据挖掘与知识发现
C:文档知识发现
D:领域知识发现
正确答案:【数据挖掘与知识发现】
2、判断题:数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。()
A:对
B:错
正确答案:【对】
3、多选题:数据挖掘分析的步骤包括()
A:算法分析
B:创建数据集
C:模型评估
D:数据预处理
正确答案:【算法分析;
创建数据集 ;
模型评估;
数据预处理】
4、判断题:当今社会,数据挖掘分析被广泛应用。()
A:对
B:错
正确答案:【对】
5、多选题:()是未来大数据分析的发展趋势。
A:可视化
B:简单
C:非结构化数据
D:实时性
正确答案:【可视化;
非结构化数据;
实时性】
第二章 单元测试
1、多选题:关于描述统计,包括()。
A:离中趋势分析
B:相关分析
C:集中趋势分析
D:其余选项都不是
正确答案:【离中趋势分析;
相关分析;
集中趋势分析】
2、单选题:以下属于推断统计的是()。
A:集中趋势分析
B:参数估计
C:离中趋势分析
D:其余选项都不是
正确答案:【离中趋势分析】
3、多选题:在数据特征的测度中,描述分布的形状的值为()
A:中位数
B:偏态
C:峰态
D:众数
正确答案:【偏态;
峰态】
4、判断题:测度集中趋势就是寻找数据水平的代表值或中心值()
A:对
B:错
正确答案:【对】
5、判断题:四分位数可以用于顺序数据、数值数据和分类数据()
A:错
B:对
正确答案:【错】
第三章 单元测试
1、单选题:下面哪个属于映射数据到新的空间的方法? ( )
A:傅立叶变换
B:渐进抽样
C:维归约
D:特征加权
正确答案:【傅立叶变换】
2、单选题:将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
A:分类和预测
B:数据预处理
C:数据流挖掘
D:频繁模式挖掘
正确答案:【数据预处理】
3、单选题:影响数据质量问题的因素有哪些()
A:其余选项都对
B:相关性、时效性
C:准确性、完整性、一致性
D:可信性、可解释性
正确答案:【其余选项都对】
4、多选题:数据预处理的常见方法有()
A:数据清洗
B:其余选项都不对
C:数据变换
D:数据集成
正确答案:【数据清洗;
数据变换;
数据集成】
5、判断题:数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()
A:错
B:对
正确答案:【对】
第四章 单元测试
1、单选题:考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()
A:1,2,3,5
B:1,2,3,4
C:1,3,4,5
D:1,2,4,5
正确答案:【1,2,4,5】
2、单选题:频繁项集、频繁闭项集、最大频繁项集之间的关系是: ( )
A:频繁项集 频繁闭项集 最大频繁项集
B:频繁项集 = 频繁闭项集 = 最大频繁项集
C:频繁项集 = 频繁闭项集 最大频繁项集
D:频繁项集 频繁闭项集 =最大频繁项集
正确答案:【频繁项集 频繁闭项集 最大频繁项集】
3、单选题:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A:分类
B:自然语言处理
C:聚类
D:关联规则发现
正确答案:【关联规则发现】
如有任何疑问请及时联系QQ 50895809反馈