第一章单元测试
1、大数据泛指巨量的()。
A:数组集
B:数据集
C:字符集
D:数字集
正确答案:【数据集】
2、数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。
A:概率分析方法
B:统计分析方法
C:定性与定量方法
D:系统分析方法
正确答案:【统计分析方法】
3、浏览数据这一步骤可以通过对大数据进行()来实现。
A:简易化
B:流程化
C:分析化
D:可视化
正确答案:【可视化】
4、Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。
A:决策力
B:洞察发现力
C:数据处理能力
D:流程优化能力
正确答案:【决策力
洞察发现力
流程优化能力】
5、我们通常用“4V”来反映大数据的特点,4V是指()。
A:Valid
B:Velocity
C:Variety
D:Various
正确答案:【Velocity
Variety】
6、大数据分析可以应用在那些领域()。
A:农业领域
B:商业领域
C:医疗卫生领域
D:交通运输领域
正确答案:【农业领域
商业领域
医疗卫生领域
交通运输领域】
7、大数据分析的过程包括()。
A:数据理解
B:数据准备
C:数据处理
D:数据优化
正确答案:【数据理解
数据准备】
8、数据只要有足够的规模就可以称为大数据。()
A:对
B:错
正确答案:【对】
9、大数据分析是大数据到知识,再到信息的关键步骤。()
A:对
B:错
正确答案:【错】
10、大数据分析模型用于描述数据之间的关系。如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。()
A:对
B:错
正确答案:【对】
第二章单元测试
1、数据仓库的定义于哪一年提出()。
A:1991
B:2002
C:2015
D:1902
正确答案:【1991】
2、符合选择建立数据仓库平台的公认标准的是()。
A:是否支持对数据库的管理
B:是否支持串联操作
C:数据库对大数据量的支持能力
D:是否提供支持少量数据的数据加载
正确答案:【数据库对大数据量的支持能力】
3、建立数据仓库的首要步骤是()。
A:数据预处理
B:确认主题
C:构建模型
D:数据仓库管理
正确答案:【确认主题】
4、数据仓库的数据模型进行逻辑建模的分析角度是()。
A:业务分析
B:政治分析
C:经济分析
D:逻辑分析
正确答案:【业务分析】
5、建立数据仓库的选择平台是()。
A:数据库
B:维度表
C:建模工具
D:分析工具
正确答案:【数据库
建模工具
分析工具】
6、建立数据仓库的步骤是()。
A:确认主题
B:选择平台
C:数据清洗
D:数据传输
正确答案:【确认主题
选择平台
数据清洗
数据传输】
7、符合多维度数据模型构成的是()。
A:事实表
B:维度表
C:测量表
D:电子表
正确答案:【事实表
维度表】
8、属于衡量业务性能指标的是()。
A:销售量
B:时间
C:销售额
D:地点编号
正确答案:【销售量
销售额】
9、数据仓库的逻辑数据模型是一维结构的数据视图。()
A:对
B:错
正确答案:【错】
10、元数据是对数据仓库中数据的描述信息。()
A:对
B:错
正确答案:【对】
第三章单元测试
1、下列哪项属于随机抽样的缺点?()
A:样本不具有代表性
B:样本中个体数量过多,效率低下
C:需要将样本分为不同类别
D:抽样方法不具有科学性
正确答案:【样本中个体数量过多,效率低下】
2、整群抽样中将总体各单位归并成若干个()的集合,成为群,然后以群为单位抽取样本。
A:互不交叉,可以重复
B:可以交叉,可以重复
C:互不交叉,互不重复
D:可以交叉,互不重复
正确答案:【互不交叉,互不重复】
3、数据抽样和过滤的相似之处是它们的目的都是为了减少要处理的数据量。()
A:对
B:错
正确答案:【对】
4、以下哪种方法适用于原始数据的取值范围已经确定的情况?()
A:0-1标准化
B:Z-score标准化
C:log函数转换
D:反正切函数
正确答案:【0-1标准化】
5、数据有那些性质?()
A:一致性
B:精确性
C:完整性
D:时效性
正确答案:【一致性
精确性
完整性
时效性】
6、数据缺陷有哪些类型?()
A:缺失数据
B:噪声数据
C:非规范化数据
D:错误数据
正确答案:【缺失数据
噪声数据
非规范化数据】
7、先将总体的观察按某一顺序号分为n个部分,再从每一部分各抽取一定数量的观察组成样本,属于哪种抽样方式?()
A:随机抽样
B:系统抽样
C:按比例抽样
D:整群抽样
正确答案:【系统抽样】
8、数据清洗浪费时间,是没有意义的。()
A:对
B:错
正确答案:【错】
9、数据标准化就是为了方便数据的下一步处理,而对数据进行的等比例缩放。()
A:对
B:错
正确答案:【对】
10、下列属于逻辑错误清洗的是()
A:去重
B:去除不合理值
C:改正格式错误
D:修正矛盾内容
正确答案:【去重
去除不合理值
修正矛盾内容】
第四章单元测试
1、关于经济计量模型进行预测出现误差的原因,正确的说法是()。
A:只有随机因素
B:只有系统因素
C:既有随机因素,又有系统因素
D:其他三个选项都不正确
正确答案:【既有随机因素,又有系统因素】
2、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在()。
A:异方差性
B:序列相关
C:多重共线性
D:高拟合优度
正确答案:【多重共线性】
3、Logistic回归系数与优势比OR的关系为()。
A:β>0等价于OR>1
B:β=0等价于OR=1,β>0等价于OR>1
C:β<0等价于OR<1
D:其他三个选项均正确
正确答案:【其他三个选项均正确】
4、Logistic回归可用于()。
A:影响因素分析
B:校正混杂因素
C:预测
D:其他三个选项均正确
正确答案:【其他三个选项均正确】
5、Logistic回归中自变量如为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用()。
A:软件自动筛选的前进法
B:软件自动筛选的后退法
C:软件自动筛选的逐步法
D:应将几个哑变量作为一个因素,整体进出回归方程
正确答案:【应将几个哑变量作为一个因素,整体进出回归方程】
6、在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为()。
A:0.8603
B:0.8389
C:0.8655
D:0.8327
正确答案:【0.8327】
7、半对数模型中,参数1的含义是()。
A:X的绝对量变化,引起Y的绝对量变化
B:Y关于X的边际变化
C:X的相对变化,引起Y的期望值绝对量变化
D:Y关于X的弹性
正确答案:【X的相对变化,引起Y的期望值绝对量变化】
8、回归变差,或回归平方和是指()。
A:被解释变量的实际值与平均值的离差平方和
B:被解释变量的回归值与平均值的离差平方和
C:被解释变量的总变差与剩余变差之差
D:解释变量变动所引起的被解释变量的变差
正确答案:【被解释变量的回归值与平均值的离差平方和
被解释变量的总变差与剩余变差之差
解释变量变动所引起的被解释变量的变差】
9、剩余变差是指()。
A:随机因素影响所引起的被解释变量的变差解释变量的实际值与平均值的离差平方和
B:被解释变量的变差中,回归方程不能做出解释的部分
C:被解释变量的总变差与回归平方和之差
D:被解释变量的实际值与回归值的离差平方和
正确答案:【随机因素影响所引起的被解释变量的变差解释变量的实际值与平均值的离差平方和
被解释变量的变差中,回归方程不能做出解释的部分
被解释变量的总变差与回归平方和之差
被解释变量的实际值与回归值的离差平方和】
10、参数的估计量具备有效性是指()。
A:Var()=0
B:Var()为最小
C:
D:为最小
正确答案:【Var()为最小】
第五章单元测试
1、以下不属于数据挖掘软件的是()
A:SPSSModeler;
B:Weka;
C:ApacheSpark;
D:Knime;
正确答案:【ApacheSpark;】
2、购物篮分析中,数据是以()的形式呈现
A:不对称二元变量;
B:对称二元变量;
C:布尔变量;
D:自变量;
正确答案:【不对称二元变量;】
3、一个关联规则同时满足最小支持度和最小置信度,我们称之为()
A:简洁规则;
B:弱规则;
C:关联规则;
D:强规则;
正确答案:【强规则;】
4、在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大)的现象叫做()
A:直接相关;
B:正相关;
C:负相关;
D:间接相关;
正确答案:【负相关;】
5、给定关联规则A-B,意味着:若A发生,B也会发生。()
A:对
B:错
正确答案:【错】
6、不满足给定评价度量的关联规则是无趣的()
A:对
B:错
正确答案:【错】
7、频繁闭项集可用来无损压缩频繁项集。()
A:对
B:错
正确答案:【对】
8、下面购物篮能够提取的最大项集和最小项集的数量是多少()。ID购买项:1.牛奶,啤酒、2.面包,黄油,牛奶、3.牛奶,尿布,饼干、4.面包,黄油,饼干、5.啤酒,饼干,尿布、6.牛奶,尿布,面包,黄油、7.面包,黄油,尿布、8.啤酒,尿布、9.牛奶,尿布,面包,黄油、10.啤酒,饼干
A:1;
B:2;
C:3;
D:4;
如有任何疑问请及时联系QQ 50895809反馈