2020 智能信息处理R(太原理工大学) 最新满分章节测试答案
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-17到2020-04-04
本篇答案更新状态:已完结
第一讲 机器学习简介 第一讲测验
1、 问题:现在手头上有大量的猫与狗的图片,需训练出一个模型,能够区别出这张图片是猫还是狗,这是一个什么问题?
选项:
A:回归
B:分类
C:聚类
D:以上都不是
答案: 【分类】
2、 问题:在无人驾驶时,希望程序能够根据路况决策汽车的方向盘的旋转角度,那么该任务是?
选项:
A:分类
B:回归
C:聚类
D:降维
答案: 【回归】
3、 问题:下面哪种方法属于机器学习?( )
选项:
A:在猫狗分类问题中,先将猫与狗的特点总结出来,再告诉机器,如果符合猫的特点,则判定为猫,如果符合狗的特点,则判定为狗。
B:将大量名画的真品与赝品输入计算机,让计算机自己从数据中学习出一个模型用来判断是真品还是赝品。
C:让计算机通过对以往的房价数据进行分析,预测未来房价走势。
D:通过人为编写好代码,符合条件则判定为人脸,否则不是人脸,从而制作出人脸识别系统。
答案: 【将大量名画的真品与赝品输入计算机,让计算机自己从数据中学习出一个模型用来判断是真品还是赝品。;
让计算机通过对以往的房价数据进行分析,预测未来房价走势。】
4、 问题:现在手头上有大量的动物的图片,为了方便处理,我们想让同一种动物的图片放到同一个文件夹,这是一个什么问题?
选项:
A:聚类
B:回归
C:分类
D:无监督学习
答案: 【聚类;
无监督学习】
5、 问题:举个例子,假设西瓜的好坏由“色泽”,“根蒂”以及“敲声”决定,且”色泽”、”根蒂”和”敲声”分别有3、2、2 种可能取值,那么假设空间的规模大小为( )。
答案: 【37】
第二讲 机器学习的评估方法 第二讲测验
1、 问题:下面正确的是( )
选项:
A:将手头上所有的数据拿来训练模型,预测结果正确率最高的模型就是我们所要选的模型。
B:将所有数据中的前百分之70拿来训练模型,剩下的百分之30作为测试集,预测结果正确率最高的模型就是我们所要选的模型。
C:将所有数据先随机打乱顺序,一半用来训练模型,一半作为测试集,预测结果正确率最高的模型就是我们所要选的模型。
D:将所有数据先随机打乱顺序,百分之80用来训练模型,剩下的百分之20作为测试集,预测结果正确率最高的模型就是我们所要选的模型。
答案: 【将所有数据先随机打乱顺序,百分之80用来训练模型,剩下的百分之20作为测试集,预测结果正确率最高的模型就是我们所要选的模型。】
2、 问题:如果一个模型,它在训练集上正确率为85%,测试集上正确率为80%,则模型是过拟合还是欠拟合( ),其中,来自于偏差的误差为( ),来自方差的误差为( )。
选项:
A:欠拟合,5%,5%
B:欠拟合,15%,5%
C:过拟合,15%,15%
D:过拟合,5%,5%
答案: 【欠拟合,15%,5%】
3、 问题:假设,我们现在利用5折交叉验证的方法来确定模型的超参数,一共有4组超参数,我们可以知道,5折交叉验证,每一组超参数将会得到5个子模型的性能评分,假设评分如下,我们应该选择哪组超参数( )。
选项:
A:子模型1:0.8 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5
B:子模型1:0.9 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5
C:子模型1:0.5 子模型2:0.6 子模型3:0.7 子模型4:0.6 子模型5:0.5
D:子模型1:0.8 子模型2:0.8 子模型3:0.8 子模型4:0.8 子模型5:0.6
答案: 【子模型1:0.8 子模型2:0.8 子模型3:0.8 子模型4:0.8 子模型5:0.6】
4、 问题:不平衡问题的领域有?
选项:
A:医学诊断
B:预测罕见事件
C:检测欺诈
D:预测故障/失效
答案: 【医学诊断;
预测罕见事件;
检测欺诈;
预测故障/失效】
5、 问题:如果一个模型在训练集上正确率为99%,测试集上正确率为60%。我们应该怎么做( )。
选项:
A:加入正则化项
B:增加训练样本数量
C:增加模型复杂度
D:减少模型复杂度
答案: 【加入正则化项;
增加训练样本数量;
减少模型复杂度】
6、 问题:识别任务中,召回率是被预测为“正面”的测试数据中结果是正确的比例。
选项:
A:正确
B:错误
答案: 【错误】
分析:【识别任务中,精确度是被预测为“正面”的测试数据中结果是正确的比例,召回率是标签为“正面”的测试数据中预测正确的比例。】
【作业】第二讲 机器学习的评估方法 算法实战
1、 问题:编写 python 代码,完成 confusion_matrix 函数实现二分类混淆矩阵的构建。confusion_matrix 函数中的参数:y_true:数据的真实类别,类型为 ndarray;y_predict:模型预测的类别,类型为 ndarray。测试输入:{‘y_true’:[1, 0, 0, 1, 0, 1, 0], ‘y_predict’:[0, 1, 0, 1, 0, 1, 0]}预期输出: [[3 1] [1 2]]
评分规则: 【 import numpy as np
def confusion_matrix(y_true, y_predict):
def TN(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 0))
def FP(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 1))
def FN(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 0))
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
return np.array([
[TN(y_true, y_predict), FP(y_true, y_predict)],
[FN(y_true, y_predict), TP(y_true, y_predict)]
])
】
2、 问题:编写 python 代码,完成 precision_score 函数和 recall_score 函数分别实现计算精准率和召回率。precision_score函数中的参数:y_true :数据的真实类别,类型为 ndarray;y_predict :模型预测的类别,类型为 ndarray。recall_score 函数中的参数:y_true:数据的真实类别,类型为 ndarray;y_predict:模型预测的类别,类型为 ndarray。代码根据输入来输出正确的精准率和召回率,以下为其中一个测试用例( y_true 表示真实类别,y_predict 表示预测类别): 测试输入:{‘y_true’:[1, 0, 0, 1, 0, 1, 0], ‘y_predict’:[0, 1, 0, 1, 0, 1, 0]}预期输出:0.666667, 0.666667
评分规则: 【 import numpy as np
def precision_score(y_true, y_predict):
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
def FP(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 1))
tp = TP(y_true, y_predict)
fp = FP(y_true, y_predict)
try:
return tp / (tp + fp)
except:
return 0.0
def recall_score(y_true, y_predict):
def FN(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 0))
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
tp = TP(y_true, y_predict)
fn = FN(y_true, y_predict)
try:
return tp / (tp + fn)
except:
return 0.0
】
第三讲 线性模型 第三讲测验
1、 问题:下列两个变量之间的关系,哪个是函数关系
选项:
A:学生的性别与数学成绩
B:人的工作环境与健康状况
C:正方形的边长与面积
D:儿子的身高与父亲的身高
答案: 【正方形的边长与面积】
2、 问题:下面属于多元线性回归的是( )。
选项:
A:求得正方形面积与对角线之间的关系。
B:建立股票价格与成交量、换手率等因素之间的线性关系。
C:建立西瓜价格与西瓜大小、西瓜产地、甜度等因素之间的线性关系。
D:建立西瓜书销量与时间之间的线性关系。
答案: 【建立股票价格与成交量、换手率等因素之间的线性关系。;
建立西瓜价格与西瓜大小、西瓜产地、甜度等因素之间的线性关系。】
【作业】第三讲 线性模型 第三讲作业
1、 问题:调用 sklearn 中的线性回归模型,并通过波斯顿房价数据集中房价的13种属性与目标房价对线性回归模型进行训练,并对模型的性能和预测能力进行测试。数据集介绍波斯顿房价数据集共有506条波斯顿房价的数据,每条数据包括对指定房屋的13项数值型特征和目标房价组成。用数据集的80%作为训练集,数据集的20%作为测试集,训练集和测试集中都包括特征和目标房价。
评分规则: 【 获取训练数据train_data = pd.read_csv(‘./step3/train_data.csv’)#获取训练标签train_label = pd.read_csv(‘./step3/train_label.csv’)train_label = train_label[‘target’]#获取测试数据test_data = pd.read_csv(‘./step3/test_data.csv’)lr = LinearRegression()#训练模型lr.fit(train_data,train_label)#获取预测标签predict = lr.predict(test_data)#将预测标签写入csvdf = pd.DataFrame({‘result’:predict}) df.to_csv(‘./step3/result.csv’, index=False)
】
【作业】第三讲 线性模型 算法实战
1、 问题:调用 sklearn 中的线性回归模型,并通过波斯顿房价数据集中房价的13种属性与目标房价对线性回归模型进行训练,并对模型的性能和预测能力进行测试。数据集介绍波斯顿房价数据集共有506条波斯顿房价的数据,每条数据包括对指定房屋的13项数值型特征和目标房价组成。用数据集的80%作为训练集,数据集的20%作为测试集,训练集和测试集中都包括特征和目标房价。
评分规则: 【 获取训练数据
train_data = pd.read_csv(‘./step3/train_data.csv’)
获取训练标签
train_label = pd.read_csv(‘./step3/train_label.csv’)
train_label = train_label[‘target’]
获取测试数据
test_data = pd.read_csv(‘./step3/test_data.csv’)
lr = LinearRegression()
训练模型
lr.fit(train_data,train_label)
获取预测标签
predict = lr.predict(test_data)
将预测标签写入csv
df = pd.DataFrame({‘result’:predict})
df.to_csv(‘./step3/result.csv’, index=False)
】
第四讲 支持向量机 第四讲测验
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦