2022 数据科学技术与应用(东华大学)1468312441 最新满分章节测试答案
- 多维数据结构与运算 第一次单元测验
- 数据汇总与统计(一) 第二次单元测验
- 数据汇总与统计(二) 第三次单元测验
- 【作业】数据可视化 第一次综合作业
- 数据可视化 第四次单元测验
- 机器学习建模分析(三) 第五次单元测验
- 【作业】机器学习建模分析(三) 第二次综合作业
- 文本数据处理 第六次单元测验
- 图像数据处理 第七次单元测验
- 时序与语音数据处理 第八次单元测验
- 【作业】多维数据结构与运算 第二次作业
- 【作业】数据可视化 第五次作业
- 【作业】数据汇总与统计(一) 第三次作业
- 【作业】数据科学基础 第一次作业
- 【作业】机器学习建模分析(一) 第六次作业
- 【作业】机器学习建模分析(三) 第八次作业
- 【作业】数据汇总与统计(二) 第四次作业
- 【作业】机器学习建模分析(二) 第七次作业
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2022-08-29到2023-01-20
多维数据结构与运算 第一次单元测验
1、 问题:下面__不是大数据的特征。
选项:
A:规模性
B:高速性
C:多样性
D:低价值性
答案: 【低价值性】
2、 问题:下面关于数据科学与大数据之间的关系描述,错误的是__。
选项:
A:大数据属于数据科学的范畴
B:大数据分析遵循数据科学处理问题的基本工作流程
C:大数据分析采用的技术完全不同于数据科学技术
D:大数据技术是指数据量达到某种规模时引入的分布式存储、计算和传输等方法
答案: 【大数据分析采用的技术完全不同于数据科学技术】
3、 问题:names=np.array([’马化腾’,’李彦宏’,’雷军’,’扎克伯格’]),names[2]的值是__。
选项:
A:马化腾
B:李彦宏
C:雷军
D:扎克伯格
答案: 【雷军】
4、 问题:记录同学成绩的scores数组如下,scores[ 1:3, [2,5]] 取得的数据是__。scores: array([[70, 85, 77, 90, 82, 84, 89], [60, 64, 80, 75, 80, 92, 90], [90, 93, 88, 87, 86, 90, 91], [80, 82, 91, 88, 83, 86, 80], [88, 72, 78, 90, 91, 73, 80]])
选项:
A:array( [ [80,92], [88,90]] )
B:array( [ [64,80], [93,86]] )
C:array( [ [85,84],[64,92], [93,90]] )
D:array( [ [64,92], [93,90],[82,86]] )
答案: 【array( [ [80,92], [88,90]] )】
5、 问题:names记录同学名字,subjects记录考试科目数据中,scores记录同学成绩,求Python课程成绩的最高分的语句__。names:array([‘王微’, ‘肖良英’, ‘方绮雯’, ‘刘旭阳’,’钱易铭’, dtype='<U3′)subjects:array([‘Math’, ‘English’, ‘Python’, ‘Chinese’, ‘Art’, ‘Database’, ‘Physics’], dtype='<U8′)scores: array([[70, 85, 77, 90, 82, 84, 89], [60, 64, 80, 75, 80, 92, 90], [90, 93, 88, 87, 86, 90, 91], [80, 82, 91, 88, 83, 86, 80], [88, 72, 78, 90, 91, 73, 80]])
选项:
A:scores[subjects==’Python’].max()
B:scores[:,subjects==’Python’].max()
C:scores(subjects==’Python’).max()
D:scores[subjects==’Python’, : ].max()
答案: 【scores[:,subjects==’Python’].max()】
6、 问题:将一维数组转化为多维数组的numpy函数是__。
选项:
A:arange()
B:reshape()
C:zeros()
D:ones()
答案: 【reshape() 】
7、 问题:subjects=np.array([‘Math’, ‘English’, ‘Python’, ‘Chinese’, ‘Art’, ‘Database’, ‘Physics’]),mask=(subjects==’English’|subjects==’Art’)。则mask数组中值为True的元素个数是__。
选项:
A:2
B:3
C:4
D:5
答案: 【2】
8、 问题:淘宝卖家销售10斤一箱的陕西红富士,应采用__来模拟生成40箱苹果的重量较合理。
选项:
A:np.random.radint(6, 15, 40)
B:np.random.uniform(8,12,40)
C:np.random.normal(10, 5, 40)
D:np.random.normal(10, 1, 40)
答案: 【np.random.normal(10, 1, 40)】
9、 问题:下列能实现将shape为dtype[5,7] 的scores数组所有元素都加10的语句是__。
选项:
A:scores + 10
B:np.add(scores, 10)
C:scores[10].add(10)
D:scores + [10,10,10,10,10,10,10]
答案: 【scores + 10;
np.add(scores, 10);
scores + [10,10,10,10,10,10,10]】
10、 问题:如果某便利店开有多家门店,为了分析各门店各种奶制品每天的销售情况,需要建立__,以便分析。
选项:
A:2个一维数组,分别存放门店名称、商品名称
B:3个一位数组,分别存放门店名称、商品名称、时间
C:2个二维数组,1个存放每个门店的每个商品在本月的总销量,1个存放每天每个商品在所有门店的销量
D:1个三维数组,存放每个门店的每个商品在每天的销量
答案: 【3个一位数组,分别存放门店名称、商品名称、时间;
1个三维数组,存放每个门店的每个商品在每天的销量】
数据汇总与统计(一) 第二次单元测验
1、 问题:DataFrame对象的列索引通常表示__。
选项:
A:列的位置信息
B:每列数据的总数
C:列的数据类型
D:每列数据对应的现实概念
答案: 【每列数据对应的现实概念】
2、 问题:DataFrame对象df中基于位置序号选取第2行第3列数据的方式是_。(序号从0开始)
选项:
A:df.find(1,2)
B:df.iloc[1,2]
C:df.loc[1,2]
D:df.rloc[1,2]
答案: 【df.iloc[1,2]】
3、 问题:CSV文件是_,可以使用_查看。
选项:
A:图像文件,画图工具查看
B:word文件,word查看
C:纯文本文件,文本编辑器
D:ppt文件,powerpoint查看
答案: 【纯文本文件,文本编辑器】
4、 问题:关于DataFrame和Series对象,下列叙述正确的是_。
选项:
A:DataFrame对象只能用于处理两维数据
B:DataFrame对象不能转化为Series对象
C:Series对象主要用于处理一维数据
D:Series对象可以用来处理多维数据
答案: 【Series对象主要用于处理一维数据】
5、 问题:创建height对象,_语句能选出高度为190的数据。height=Series({’13’:187,’14’:190,’7′:185,’2′:178,’9′:185})
选项:
A:height[0]
B:height[height.values > 190]
C:Height[‘7’]
D:height[1]
答案: 【height[1]】
6、 问题:创建students对象,下面语句筛选出_大于67公斤同学的_。students数据如下: age height weight1 19 170 682 20 165 653 18 175 65>>>students.loc[students[‘weight’]>67, ‘height’]
选项:
A:身高、体重
B:体重、身高
C:年龄、身高
D:体重、年龄
答案: 【体重、身高】
7、 问题:关于数据文件读写,_是错误的描述。
选项:
A:pandas读取的数据文件中可以包含中文字符组成的数据
B:文件中第一行必须给出列的索引名(columns),否则pandas无法读取各列内容
C:csv数据文件用换行符来区分数据行
D:读取excel文件时,可以为 sheetname 参数赋值,以读取指定表单的数据
答案: 【文件中第一行必须给出列的索引名(columns),否则pandas无法读取各列内容】
8、 问题:创建students对象,_语句可以选出第二个同学的身高。students数据如下: age height weight1 19 170 682 20 165 653 18 175 65
选项:
A:students[1,’height’]
B:students.loc[2,’height’]
C:students.iloc[1, 1]
D:students[‘height’][3]
答案: 【students.loc[2,’height’];
students.iloc[1, 1]】
9、 问题:关于DataFrame数据对象的添加和删除操作,_是正确的描述。
选项:
A:DataFrame对象不能直接添加新的列数据
B:DataFrame对象不能直接添加新的行数据
C:可以设置axis的值删除DataFrame指定行或列的数据
D:DataFrame中数据元素的值不能修改
答案: 【DataFrame对象不能直接添加新的行数据;
可以设置axis的值删除DataFrame指定行或列的数据】
10、 问题:在数据统计中,均值和中位数是相同的概念。
选项:
A:正确
B:错误
答案: 【错误】
数据汇总与统计(二) 第三次单元测验
1、 问题:有3张同学信息表,存储为DataFrame对象stu1,stu2,stu3,具有相同的列索引,合并的方法是__。
选项:
A:pd.concat( [stu1,sut2,sut3] )
B:stu1.concat([sut2,sut3])
C:pd.concat(stu1,sut2,sut3)
D:[stu1,stu2,stu3].concat(axis =0)
答案: 【pd.concat( [stu1,sut2,sut3] )】
2、 问题:统计量“方差”描述__。
选项:
A:样本(一组数据)的平均值
B:样本个体距离均值的离散程度
C:样本中不同的值占样本容量的比例
D:样本中出现次数最多的值
答案: 【样本个体距离均值的离散程度】
3、 问题:统计DataFrame对象stu中各‘省份’同学人数的方法是__。
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦