第一章 单元测试
1、多选题:下列属于多元统计方法的为()
A:决策树
B:主元分析
C:回归分析
D:神经网络
正确答案:【主元分析
;回归分析
】
2、多选题:多元统计分析的图表示法有()
A:轮廓图
B:雷达图
C:调和曲线图
D:散布图矩阵
正确答案:【轮廓图
;雷达图
;调和曲线图
;散布图矩阵
】
3、判断题:完整的数据分析过程,包括数据采集、数据清洗和数据分析。()
A:对
B:错
正确答案:【对】
4、单选题:下列场景适用于回归分析的是 ( )
A:天气预报
B:水果分拣
C:信息浓缩
D:人脸识别
正确答案:【天气预报
】
5、单选题:下面哪一句体现了主元分析的思想()
A:物以类聚,人以群分
B:笨鸟先飞
C:牵牛要牵牛鼻子
D:人不是一座孤岛
正确答案:【牵牛要牵牛鼻子
】
第二章 单元测试
1、多选题:一般常见的缺失值处理的方法有()
A:替换填充法
B:插值填充
C:回归填充法
D:最近邻插补填充法
正确答案:【替换填充法
;插值填充
;回归填充法
;最近邻插补填充法
】
2、多选题:一般常见的数据归一化的方法有()
A:最小最大规范化
B:回归填充法
C:替换填充法
D:零均值规范化
正确答案:【最小最大规范化
;零均值规范化
】
3、判断题:少量的异常值完全不会影响数据分析。()
A:对
B:错
正确答案:【错】
4、单选题:下列哪种方法不是数据填补的手段 ( )
A:均值标准化
B:插值填充法
C:替换填充法
D:回归填充法
正确答案:【均值标准化
】
5、单选题:主成分分析的英文名是()。
A:Principal Component Analysis
B:Ordinary Least Squares
C:Partial Least Squares
D:Canonical Component Analysis
正确答案:【Principal Component Analysis
】
第三章 单元测试
1、多选题:下面哪个是SVM在实际生活中的应用()
A:图片分类
B:邮件分类
C:文本翻译
D:房价预测
正确答案:【图片分类
;邮件分类
】
2、多选题:以下说法正确的有哪些()
A:核方法不能解决非线性问题
B:软间隔的引入可以解决轻度线性不可分问题
C:SVM只能够解决回归问题
D:SVM是一种线性方法
正确答案:【软间隔的引入可以解决轻度线性不可分问题
;SVM是一种线性方法
】
3、判断题:拉格朗日乘子法可用于线性可分SVM的模型求解。()
A:错
B:对
正确答案:【对】
4、单选题:SVM的中文全称叫什么?()
A:支持向量机
B:最小向量分类器
C:支持向量回归器
D:最大向量分类器
正确答案:【支持向量机
】
5、单选题:SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()
A:不受数据集的大小影响
B:小数据集
C:中等数据集
D:大数据集
正确答案:【大数据集
】
第四章 单元测试
1、多选题:一元线性回归有哪些基本假定?()
A:随机误差项和解释变量X不相关;
B:随机误差项具有零均值、同方差和序列不相关的性质;
C:随机误差项服从零均值、同方差的正态分布。
D:解释变量X是确定性变量,Y是随机变量;
正确答案:【随机误差项和解释变量X不相关;
;随机误差项具有零均值、同方差和序列不相关的性质;
;随机误差项服从零均值、同方差的正态分布。
;解释变量X是确定性变量,Y是随机变量;
】
2、多选题:最典型的两种拟合不佳的情况是()。
A:强拟合
B:欠拟合
C:弱拟合
D:过拟合
正确答案:【欠拟合
;过拟合
】
3、判断题:岭回归适用于样本很少,但变量很多的回归问题。()
A:错
B:对
正确答案:【对】
4、单选题:最小二乘方法的拟合程度衡量指标是()。
A:残差和
B:均值差
C:残差平方和
D:拟合残差
正确答案:【残差平方和
】
5、单选题:关于最小二乘法,下列说法正确的是。()
A:最小二乘法要求样本点到拟合直线的竖直距离的平方和最小
B:最小二乘法要求样本点到拟合直线的垂直距离的和最小
C:最小二乘法要求样本点到拟合直线的垂直距离的平方和最小
D:最小二乘法要求样本点到拟合直线的竖直距离的和最小
正确答案:【最小二乘法要求样本点到拟合直线的竖直距离的平方和最小
】
第五章 单元测试
1、判断题:在区分某个算法是否是聚类算法时,往往可以通过该算法是否需要预先设定明确的类中心来判断()。
A:对
B:错
正确答案:【对】
2、多选题:闵可夫斯基距离是一组距离的定义,下列距离中属于闵可夫斯基距离的有()
A:欧式距离
B:曼哈顿距离
C:马氏距离
D:切比雪夫距离
正确答案:【欧式距离
;曼哈顿距离
;切比雪夫距离
】
3、多选题:在利用EM算法估计高斯混合模型参数的时候,需要预先设定的参数有()。
A:高斯元的方差
B:类别个数
C:高斯元的均值
D:高斯元的权重系数
正确答案:【高斯元的方差
;类别个数
;高斯元的均值
;高斯元的权重系数
】
4、单选题:聚类算法是一种()的学习方式。
A:无监督
B:有监督
C:自上而下
D:Q型
正确答案:【无监督
】
5、单选题:理想情况下,K均值算法中确定类别个数的最佳方式为()。
A:无需提前确定,可以在训练中得到
B:随机确定
C:结合先验知识确定
D:根据比较不同类别个数时的聚类效果来确定
如有任何疑问请及时联系QQ 50895809反馈