2020 智能信息处理R(太原理工大学) 最新满分章节测试答案

文章目录[隐藏]

第一讲机器学习简介第一讲测验
第二讲机器学习的评估方法第二讲测验
【作业】第二讲机器学习的评估方法算法实战
第三讲线性模型第三讲测验
【作业】第三讲线性模型第三讲作业
【作业】第三讲线性模型算法实战
获取训练标签
获取测试数据
训练模型
获取预测标签
将预测标签写入csv

本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-17到2020-04-04
本篇答案更新状态:已完结

第一讲机器学习简介第一讲测验

1、问题:现在手头上有大量的猫与狗的图片，需训练出一个模型，能够区别出这张图片是猫还是狗，这是一个什么问题？
选项：
A:回归
B:分类
C:聚类
D:以上都不是
答案: 【分类】

2、问题:在无人驾驶时，希望程序能够根据路况决策汽车的方向盘的旋转角度，那么该任务是？
选项：
A:分类
B:回归
C:聚类
D:降维
答案: 【回归】

3、问题:下面哪种方法属于机器学习？（）
选项：
A:在猫狗分类问题中，先将猫与狗的特点总结出来，再告诉机器，如果符合猫的特点，则判定为猫，如果符合狗的特点，则判定为狗。
B:将大量名画的真品与赝品输入计算机，让计算机自己从数据中学习出一个模型用来判断是真品还是赝品。
C:让计算机通过对以往的房价数据进行分析，预测未来房价走势。
D:通过人为编写好代码，符合条件则判定为人脸，否则不是人脸，从而制作出人脸识别系统。
答案: 【将大量名画的真品与赝品输入计算机，让计算机自己从数据中学习出一个模型用来判断是真品还是赝品。;
让计算机通过对以往的房价数据进行分析，预测未来房价走势。】

4、问题:现在手头上有大量的动物的图片，为了方便处理，我们想让同一种动物的图片放到同一个文件夹，这是一个什么问题？
选项：
A:聚类
B:回归
C:分类
D:无监督学习
答案: 【聚类;
无监督学习】

5、问题:举个例子，假设西瓜的好坏由“色泽”，“根蒂”以及“敲声”决定，且”色泽”、”根蒂”和”敲声”分别有3、2、2 种可能取值，那么假设空间的规模大小为（）。
答案: 【37】

第二讲机器学习的评估方法第二讲测验

1、问题:下面正确的是（）
选项：
A:将手头上所有的数据拿来训练模型，预测结果正确率最高的模型就是我们所要选的模型。
B:将所有数据中的前百分之70拿来训练模型，剩下的百分之30作为测试集，预测结果正确率最高的模型就是我们所要选的模型。
C:将所有数据先随机打乱顺序，一半用来训练模型，一半作为测试集，预测结果正确率最高的模型就是我们所要选的模型。
D:将所有数据先随机打乱顺序，百分之80用来训练模型，剩下的百分之20作为测试集，预测结果正确率最高的模型就是我们所要选的模型。
答案: 【将所有数据先随机打乱顺序，百分之80用来训练模型，剩下的百分之20作为测试集，预测结果正确率最高的模型就是我们所要选的模型。】

2、问题:如果一个模型，它在训练集上正确率为85%，测试集上正确率为80%，则模型是过拟合还是欠拟合（），其中，来自于偏差的误差为（），来自方差的误差为（）。
选项：
A:欠拟合，5%，5%
B:欠拟合，15%，5%
C:过拟合，15%，15%
D:过拟合，5%，5%
答案: 【欠拟合，15%，5%】

3、问题:假设，我们现在利用5折交叉验证的方法来确定模型的超参数，一共有4组超参数，我们可以知道，5折交叉验证，每一组超参数将会得到5个子模型的性能评分，假设评分如下，我们应该选择哪组超参数（）。
选项：
A:子模型1:0.8 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5
B:子模型1:0.9 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5
C:子模型1:0.5 子模型2:0.6 子模型3:0.7 子模型4:0.6 子模型5:0.5
D:子模型1:0.8 子模型2:0.8 子模型3:0.8 子模型4:0.8 子模型5:0.6
答案: 【子模型1:0.8 子模型2:0.8 子模型3:0.8 子模型4:0.8 子模型5:0.6】

4、问题:不平衡问题的领域有？
选项：
A:医学诊断
B:预测罕见事件
C:检测欺诈
D:预测故障/失效
答案: 【医学诊断;
预测罕见事件;
检测欺诈;
预测故障/失效】

5、问题:如果一个模型在训练集上正确率为99%，测试集上正确率为60%。我们应该怎么做（）。
选项：
A:加入正则化项
B:增加训练样本数量
C:增加模型复杂度
D:减少模型复杂度
答案: 【加入正则化项;
增加训练样本数量;
减少模型复杂度】

6、问题:识别任务中，召回率是被预测为“正面”的测试数据中结果是正确的比例。
选项：
A:正确
B:错误
答案: 【错误】
分析：【识别任务中，精确度是被预测为“正面”的测试数据中结果是正确的比例，召回率是标签为“正面”的测试数据中预测正确的比例。】

【作业】第二讲机器学习的评估方法算法实战

1、问题:编写 python 代码，完成 confusion_matrix 函数实现二分类混淆矩阵的构建。confusion_matrix 函数中的参数：y_true：数据的真实类别，类型为 ndarray；y_predict：模型预测的类别，类型为 ndarray。测试输入：{‘y_true’:[1, 0, 0, 1, 0, 1, 0], ‘y_predict’:[0, 1, 0, 1, 0, 1, 0]}预期输出： [[3 1] [1 2]]
评分规则: 【 import numpy as np
def confusion_matrix(y_true, y_predict):
def TN(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 0))
def FP(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 1))
def FN(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 0))
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
return np.array([
[TN(y_true, y_predict), FP(y_true, y_predict)],
[FN(y_true, y_predict), TP(y_true, y_predict)]
])
】

2、问题:编写 python 代码，完成 precision_score 函数和 recall_score 函数分别实现计算精准率和召回率。precision_score函数中的参数:y_true ：数据的真实类别，类型为 ndarray；y_predict ：模型预测的类别，类型为 ndarray。recall_score 函数中的参数:y_true：数据的真实类别，类型为 ndarray；y_predict：模型预测的类别，类型为 ndarray。‍代码根据输入来输出正确的精准率和召回率，以下为其中一个测试用例( y_true 表示真实类别，y_predict 表示预测类别)：测试输入：{‘y_true’:[1, 0, 0, 1, 0, 1, 0], ‘y_predict’:[0, 1, 0, 1, 0, 1, 0]}预期输出：0.666667, 0.666667
评分规则: 【 import numpy as np
def precision_score(y_true, y_predict):
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
def FP(y_true, y_predict):
return np.sum((y_true == 0) & (y_predict == 1))
tp = TP(y_true, y_predict)
fp = FP(y_true, y_predict)
try:
return tp / (tp + fp)
except:
return 0.0
def recall_score(y_true, y_predict):
def FN(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 0))
def TP(y_true, y_predict):
return np.sum((y_true == 1) & (y_predict == 1))
tp = TP(y_true, y_predict)
fn = FN(y_true, y_predict)
try:
return tp / (tp + fn)
except:
return 0.0
】

第三讲线性模型第三讲测验

1、问题:下列两个变量之间的关系，哪个是函数关系
选项：
A:学生的性别与数学成绩
B:人的工作环境与健康状况
C:正方形的边长与面积
D:儿子的身高与父亲的身高
答案: 【正方形的边长与面积】

2、问题:下面属于多元线性回归的是（）。
选项：
A:求得正方形面积与对角线之间的关系。
B:建立股票价格与成交量、换手率等因素之间的线性关系。
C:建立西瓜价格与西瓜大小、西瓜产地、甜度等因素之间的线性关系。
D:建立西瓜书销量与时间之间的线性关系。
答案: 【建立股票价格与成交量、换手率等因素之间的线性关系。;
建立西瓜价格与西瓜大小、西瓜产地、甜度等因素之间的线性关系。】

【作业】第三讲线性模型第三讲作业

1、问题:调用 sklearn 中的线性回归模型，并通过波斯顿房价数据集中房价的13种属性与目标房价对线性回归模型进行训练，并对模型的性能和预测能力进行测试。数据集介绍波斯顿房价数据集共有506条波斯顿房价的数据，每条数据包括对指定房屋的13项数值型特征和目标房价组成。用数据集的80%作为训练集，数据集的20%作为测试集，训练集和测试集中都包括特征和目标房价。
评分规则: 【获取训练数据train_data = pd.read_csv(‘./step3/train_data.csv’)#获取训练标签train_label = pd.read_csv(‘./step3/train_label.csv’)train_label = train_label[‘target’]#获取测试数据test_data = pd.read_csv(‘./step3/test_data.csv’)lr = LinearRegression()#训练模型lr.fit(train_data,train_label)#获取预测标签predict = lr.predict(test_data)#将预测标签写入csvdf = pd.DataFrame({‘result’:predict}) df.to_csv(‘./step3/result.csv’, index=False)
】

【作业】第三讲线性模型算法实战

获取训练标签

train_label = pd.read_csv(‘./step3/train_label.csv’)
train_label = train_label[‘target’]

获取测试数据

test_data = pd.read_csv(‘./step3/test_data.csv’)
lr = LinearRegression()

训练模型

lr.fit(train_data,train_label)

获取预测标签

predict = lr.predict(test_data)

将预测标签写入csv

df = pd.DataFrame({‘result’:predict})
df.to_csv(‘./step3/result.csv’, index=False)
】

第四讲支持向量机第四讲测验

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题！！
本文章不含期末不含主观题！！
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦，电子资源购买后不支持退款哦

点我支付 ¥5

已支付？输入手机号或商家订单号阅读

第一讲 机器学习简介 第一讲测验

第二讲 机器学习的评估方法 第二讲测验

【作业】第二讲 机器学习的评估方法 算法实战

第三讲 线性模型 第三讲测验

【作业】第三讲 线性模型 第三讲作业

【作业】第三讲 线性模型 算法实战