2022 数据挖掘(国防科技大学)1468090443 最新满分章节测试答案
- 【作业】1 绪论 单元作业
- 2 认识数据 测验
- 1 绪论 测验
- 【作业】3 数据预处理 单元作业
- 【作业】2 认识数据 单元作业
- 3 数据预处理 测验
- 8 关联规则挖掘 测验
- 4 朴素贝叶斯分类 测验
- 【作业】11 神经网络分类 单元作业
- 5 决策树分类 测验
- 【作业】7 逻辑回归 单元作业
- 【作业】12 集成学习 单元作业
- 【作业】4 朴素贝叶斯分类 单元作业
- 10 支持向量机 测验
- 9 数据挖掘实践 测验
- 【作业】6 k-均值聚类 单元作业
- 11 神经网络分类 测验
- 7 逻辑回归 测验
- 【作业】9 数据挖掘实践 单元作业
- 6 k-均值聚类 测验
- 12 集成学习 测验
- 【作业】5 决策树分类 单元作业
- 【作业】10 支持向量机 单元作业
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2022-07-11到2023-01-16
【作业】1 绪论 单元作业
小提示:本节包含奇怪的同名章节内容
1、 问题:结合同学们的各自专业,给出数据挖掘典型案例,并且简述属于分类问题、聚类问题,还是关联规则问题?
评分规则: 【 给出一个案例,并且给出该案例属于数据挖掘的哪类问题。
】
2、 问题:同学们自学《数据挖掘原理与应用》教材,完成学习后知识总结。 京东购买:https://item.jd.com/10042588370746.html 淘宝购买:https://detail.tmall.com/item.htm?id=663741312308 当当购买:https://product.dangdang.com/11048586084.html
评分规则: 【 知识点总结
】
2 认识数据 测验
1、 问题:下面哪个不属于数据的属性类型:
选项:
A:标称
B:序数
C:区间
D:相异
答案: 【相异】
2、 问题:只有非零值才重要的二元属性被称作:
选项:
A:计数属性
B:离散属性
C:非对称的二元属性
D:对称属性
答案: 【非对称的二元属性】
3、 问题:一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:
选项:
A:一年级
B:二年级
C:三年级
D:四年级
答案: 【一年级】
4、 问题:杰卡德系数用来度量非对称的二进制属性的相似性
选项:
A:正确
B:错误
答案: 【正确】
5、 问题:欧式距离用来度量连续数值属性数据的相似性
选项:
A:正确
B:错误
答案: 【正确】
1 绪论 测验
1、 问题:什么是KDD?
选项:
A:数据挖掘与知识发现
B:领域知识发现
C:文档知识发现
D:动态知识发现
答案: 【数据挖掘与知识发现】
2、 问题:“8,000”和“10,000”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【数据】
3、 问题:人从出生到长大的过程中,是如何认识事物的?
选项:
A:聚类过程
B:分类过程
C:先分类,后聚类
D:先聚类,后分类
答案: 【先聚类,后分类】
4、 问题:“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【信息】
5、 问题:“飞机无法飞过高山”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【知识】
【作业】3 数据预处理 单元作业
1、 问题:请利用sklearn库实现具体数据的PCA降维方法,z得分规范化
评分规则: 【 给出PCA方法的python函数得3分,给出z得分规范化python函数得3分。
】
【作业】2 认识数据 单元作业
1、 问题:请利用sklearn库实现具体数据的直方图、箱线图、散点图。
评分规则: 【 直方图python实现函数2分;箱线图python实现函数2分;散点图的python实现函数2分。
】
3 数据预处理 测验
1、 问题:所谓高维数据,指的是
选项:
A:数据对象很多
B:数据属性很多
C:以上都正确
D:以上都错误
答案: 【数据属性很多】
2、 问题:假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:
选项:
A:0.821
B: 1.224
C: 1.458
D: 0.716
答案: 【 0.716】
3、 问题:假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?
选项:
A:第一个
B:第二个
C:第三个
D:第四个
答案: 【第二个】
4、 问题:卡方测试用来度量离散标称属性数据的相关性
选项:
A:正确
B:错误
答案: 【正确】
5、 问题:相关系数用来度量标称属性数据的相关性
选项:
A:正确
B:错误
答案: 【错误】
8 关联规则挖掘 测验
1、 问题:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?
选项:
A:关联规则发现
B:聚类
C:分类
D:自然语言处理
答案: 【关联规则发现】
2、 问题:数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务
选项:
A:正确
B:错误
答案: 【正确】
3、 问题:具有较高的支持度的项集具有较高的置信度。
选项:
A:正确
B:错误
答案: 【错误】
4、 问题:先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。
选项:
A:正确
B:错误
答案: 【错误】
5、 问题:利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数
选项:
A:正确
B:错误
答案: 【正确】
4 朴素贝叶斯分类 测验
1、 问题:考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为
选项:
A:0.75
B:0.35
C:0.4678
D:0.5738
答案: 【0.5738】
2、 问题:朴素贝叶斯分类器的朴素之处在于:
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦