第一章 单元测试

1、多选题:下列属于多元统计方法的为()
A:决策树

B:主元分析

C:回归分析

D:神经网络

正确答案:【主元分析
;回归分析

2、多选题:多元统计分析的图表示法有()
A:轮廓图

B:雷达图

C:调和曲线图

D:散布图矩阵

正确答案:【轮廓图
;雷达图
;调和曲线图
;散布图矩阵

3、判断题:完整的数据分析过程,包括数据采集、数据清洗和数据分析。()
A:对
B:错
正确答案:【对】

4、单选题:下列场景适用于回归分析的是 ( )
A:天气预报

B:水果分拣

C:信息浓缩

D:人脸识别

正确答案:【天气预报

5、单选题:下面哪一句体现了主元分析的思想()
A:物以类聚,人以群分

B:笨鸟先飞

C:牵牛要牵牛鼻子

D:人不是一座孤岛

正确答案:【牵牛要牵牛鼻子

第二章 单元测试

1、多选题:一般常见的缺失值处理的方法有()
A:替换填充法

B:插值填充

C:回归填充法

D:最近邻插补填充法

正确答案:【替换填充法
;插值填充
;回归填充法
;最近邻插补填充法

2、多选题:一般常见的数据归一化的方法有()
A:最小最大规范化

B:回归填充法

C:替换填充法

D:零均值规范化

正确答案:【最小最大规范化
;零均值规范化

3、判断题:少量的异常值完全不会影响数据分析。()
A:对
B:错
正确答案:【错】

4、单选题:下列哪种方法不是数据填补的手段 ( )
A:均值标准化

B:插值填充法

C:替换填充法

D:回归填充法

正确答案:【均值标准化

5、单选题:主成分分析的英文名是()。
A:Principal Component Analysis

B:Ordinary Least Squares

C:Partial Least Squares

D:Canonical Component Analysis

正确答案:【Principal Component Analysis

第三章 单元测试

1、多选题:下面哪个是SVM在实际生活中的应用()
A:图片分类

B:邮件分类

C:文本翻译

D:房价预测

正确答案:【图片分类
;邮件分类

2、多选题:以下说法正确的有哪些()
A:核方法不能解决非线性问题

B:软间隔的引入可以解决轻度线性不可分问题

C:SVM只能够解决回归问题

D:SVM是一种线性方法

正确答案:【软间隔的引入可以解决轻度线性不可分问题
;SVM是一种线性方法

3、判断题:拉格朗日乘子法可用于线性可分SVM的模型求解。()
A:错
B:对
正确答案:【对】

4、单选题:SVM的中文全称叫什么?()
A:支持向量机

B:最小向量分类器

C:支持向量回归器

D:最大向量分类器

正确答案:【支持向量机

5、单选题:SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()
A:不受数据集的大小影响

B:小数据集

C:中等数据集

D:大数据集

正确答案:【大数据集

第四章 单元测试

1、多选题:一元线性回归有哪些基本假定?()
A:随机误差项和解释变量X不相关;

B:随机误差项具有零均值、同方差和序列不相关的性质;

C:随机误差项服从零均值、同方差的正态分布。

D:解释变量X是确定性变量,Y是随机变量;

正确答案:【随机误差项和解释变量X不相关;
;随机误差项具有零均值、同方差和序列不相关的性质;
;随机误差项服从零均值、同方差的正态分布。
;解释变量X是确定性变量,Y是随机变量;

2、多选题:最典型的两种拟合不佳的情况是()。
A:强拟合

B:欠拟合

C:弱拟合

D:过拟合

正确答案:【欠拟合
;过拟合

3、判断题:岭回归适用于样本很少,但变量很多的回归问题。()
A:错
B:对
正确答案:【对】

4、单选题:最小二乘方法的拟合程度衡量指标是()。
A:残差和

B:均值差

C:残差平方和

D:拟合残差

正确答案:【残差平方和

5、单选题:关于最小二乘法,下列说法正确的是。()
A:最小二乘法要求样本点到拟合直线的竖直距离的平方和最小

B:最小二乘法要求样本点到拟合直线的垂直距离的和最小

C:最小二乘法要求样本点到拟合直线的垂直距离的平方和最小

D:最小二乘法要求样本点到拟合直线的竖直距离的和最小

正确答案:【最小二乘法要求样本点到拟合直线的竖直距离的平方和最小

第五章 单元测试

1、判断题:在区分某个算法是否是聚类算法时,往往可以通过该算法是否需要预先设定明确的类中心来判断()。
A:对
B:错
正确答案:【对】

2、多选题:闵可夫斯基距离是一组距离的定义,下列距离中属于闵可夫斯基距离的有()
A:欧式距离

B:曼哈顿距离

C:马氏距离

D:切比雪夫距离

正确答案:【欧式距离
;曼哈顿距离
;切比雪夫距离

3、多选题:在利用EM算法估计高斯混合模型参数的时候,需要预先设定的参数有()。
A:高斯元的方差

B:类别个数

C:高斯元的均值

D:高斯元的权重系数

正确答案:【高斯元的方差
;类别个数
;高斯元的均值
;高斯元的权重系数

4、单选题:聚类算法是一种()的学习方式。
A:无监督

B:有监督

C:自上而下

D:Q型

正确答案:【无监督

5、单选题:理想情况下,K均值算法中确定类别个数的最佳方式为()。
A:无需提前确定,可以在训练中得到

B:随机确定

C:结合先验知识确定

D:根据比较不同类别个数时的聚类效果来确定

剩余章节答案支付后查看
如有疑问请及时联系QQ 50895809反馈
如遇卡顿看不了剩余内容请换个浏览器即可打开

没找到的科目也可以提醒我们更新

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注