形考任务1
表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。请注意分组时按照下列标准:
等级
A
A-
B+
B
B-
C+
C
C-
D+
D
F
分数
90-100
86-89
83-85
80-82
76-79
73-75
70-72
66-69
63-65
60-62
0-59
请注意分组时按照下列标准:
表1某专业二年级同学社会统计学期末考试成绩(百分制)
学生
成绩
学生
成绩
学生
成绩
学生
成绩
学生
成绩
1
86
28
34
55
88
82
70
109
71
2
60
29
65
56
93
83
88
110
80
3
65
30
30
57
85
84
88
111
87
4
28
31
78
58
83
85
68
112
66
5
85
32
86
59
93
86
87
113
84
6
87
33
84
60
95
87
88
114
83
7
70
34
87
61
71
88
91
115
85
8
64
35
85
62
90
89
76
116
78
9
51
36
93
63
86
90
87
117
81
10
58
37
96
64
89
91
81
118
81
11
90
38
82
65
89
92
61
119
71
12
50
39
78
66
83
93
72
120
86
13
87
40
80
67
84
94
86
121
91
14
82
41
74
68
44
95
29
122
66
15
65
42
72
69
68
96
37
123
58
16
68
43
73
70
89
97
82
124
68
17
86
44
86
71
84
98
82
125
80
18
80
45
85
72
86
99
82
126
77
19
81
46
90
73
79
100
85
127
55
20
70
47
69
74
78
101
78
128
54
21
80
48
86
75
87
102
80
129
62
22
49
49
86
76
88
103
90
130
54
23
80
50
84
77
82
104
82
131
65
24
70
51
81
78
83
105
72
132
74
25
59
52
90
79
92
106
86
133
70
26
80
53
34
80
86
107
80 134
72
27
52
54
84
81
86
108
82
135
73
形考任务2
表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件。
(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。
(2)计算学生上网时间的标准分(Z值)及其均值和标准差。(20分)
(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。(30分)
表1某专业一年级同学一周上网时间(小时)
学生 上网 时间 学生 上网 时间 学生 上网 时间 学生 上网 时间 学生 上网 时间
1 13 21 18 41 14 61 8 81 10
2 9 22 22 42 7 62 19 82 10
3 8 23 22 43 9 63 24 83 20
4 12 24 10 44 8 64 13 84 21
5 8 25 13 45 10 65 21 85 16
6 26 26 10 46 18 66 21 86 10
7 13 27 12 47 26 67 10 87 10
8 5 28 22 48 14 68 13 88 21
9 3 29 19 49 8 69 20 89 19
10 18 30 10 50 10 70 21 90 10
11 3 31 22 51 13 71 12 91 32
12 10 32 30 52 28 72 15 92 7
13 20 33 8 53 12 73 26 93 28
14 19 34 20 54 10 74 20 94 19
15 15 35 17 55 9 75 17 95 15
16 8 36 14 56 10 76 19 96 10
17 8 37 8 57 12 77 9 97 20
18 15 38 12 58 24 78 21 98 8
19 20 39 15 59 26 79 17 99 14
20 22 40 13 60 20 80 16 100 18
形考任务3(占比20%)
试卷总分:100 得分:100
一、单项选择题(每题2分,共20分)
1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于(?? ) 。
A.简单随机抽样
B.整群抽样????
C.分层抽样
D.系统抽样
2.以下关于因变量与自变量的表述不正确的是( )
A.自变量是引起其他变量变化的变量
B.因变量是由于其他变量的变化而导致自身发生变化的变量
C.自变量的变化是以因变量的变化为前提
D.因变量的变化不以自变量的变化为前提
3.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( )。
A.茎叶图
B.环形图
C.饼图
D.线图
4.以下关于条形图的表述,不正确的是(??? )
A.条形图中条形的宽度是固定的
B.条形图中条形的长度(或高度)表示各类别频数的多少
C.条形图的矩形通常是紧密排列的
D.条形图通常是适用于所有类型数据
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。
A.数学
B.语文
C.两门课程一样
D.无法判断
6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是( )
A.甲的离散程度小,稳定性水平低
B.甲的离散程度小,稳定性水平高
C.乙的离散程度小,稳定性水平低???
D.乙的离散程度大,稳定性水平高
7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(??? )组。
组别
按年龄分组(岁)
工作人员数(人)
1
20~24
6
2
25~29
14
3
30~34
24
4
35~39
18
5
40~44
12
6
45~49
18
7
50~54
14
8
55~59
6
?
合计
112
A.第3组
B.第4组??
C.第5组
D.第6组
8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间(???? )
A.相关程度越大
B.相关程度越小??
C.完全相关
D.完全不相关
9.回归平方和(SSR)反映了y的总变差中( )
A.由于x与y之间的线性关系引起的y的变化部分
B.除了x对y的现有影响之外的其他因素对y变差的影响
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于x与y之间的函数关系引起的y的变化部分
10.下列哪种情况不适合用方差分析(??? )
A.性别对收入的影响
B.专业对收入的影响
C.年龄对收入的影响
D.行业对收入的影响6
二、名词解释(每题5分,共20分)
11.非概率抽样
12.二维表
13.置信水平
14.卡方检验
三、简答题(每题10分,共30分)
15.等距分组和不等距分组有什么区别?请举例说明
16.简述相关系数的取值与意义
17.简述什么是简单回归分析?其作用是什么
四、计算题(共30分)
18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:
(1)是男生体重差异大还是女生体重差异大?为什么?
(2)男生中有多少比重的人体重在55千克-65千克之间?
(3)女生中有多少比重的人体重在40千克-60千克之间?
备注:ф(1)=0.8413,ф(2)=0.9772
19.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下方差分析表:
?
变差来源
SS
df
MS
F
Sig.
回归
6
B
D
F
0.000
残差
40158.08
C
E
—
—
总计
A
11
—
—
—
要求:
(1)计算上面方差分析表中A、B、C、D、E、F处的值。
(2)商品销售量的变差中有多少是由价格的差异引起的?
形考任务4(占比20%)
试卷总分:100 得分:100
一、单项选择题(每题2分,共20分)
1.以下关于因变量与自变量的表述不正确的是(??? )
A.自变量的变化是以因变量的变化为前提
B.自变量是引起其他变量变化的变量
C.因变量的变化不以自变量的变化为前提
D.因变量是由于其他变量的变化而导致自身发生变化的变量
2.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( )
A.5小时
B.6小时
C.5.5小时
D.6.5小时
3.以下关于条形图的表述,不正确的是( )
A.条形图中条形的宽度是固定的
B.条形图的矩形通常是紧密排列的
C.条形图中条形的长度(或高度)表示各类别频数的多少
D.条形图通常是适用于所有类型数
4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(??? )组
组别
按年龄分组(岁)
工作人员数(人)
1
20~24
6
2
25~29
14
3
30~34
24
4
35~39
18
5
40~44
12
6
45~49
18
7
50~54
14
8
55~59
6
?
合计
112
A.第3组
B.第4组
C.第5组
D.第6组
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(?? )的成绩考得更好。
A.数学
B.语文
C.两门课程一样
D.无法判断散
6.在假设检验中,不拒绝虚无假设意味着(??? )
A.虚无假设是肯定正确的
B.虚无假设肯定是错误的
C.没有证据证明虚无假设是正确的
D.没有证据证明虚无假设是错误的
7.根据一个样本均值求出的90%的置信区间表明(??? )
A.总体均值一定落入该区间内
B.总体均值有90%的概率不会落入该区间内
C.总体均值有90%的概率会落入该区间内
D.总体均值有10%的概率会落入该区间内
8.在回归方程中,若回归系数等于0,这表明(??? )
A.因变量y对自变量x的影响是不显著的??
B.自变量x对因变量y的影响是不显著的
C.因变量y对自变量x的影响是显著的
D.自变量x对因变量y的影响是显著的
9.中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为(?? )、方差为(?? )的正态分布。
A.μ,σ2
B.μ/n ,σ2/n
C.μ,σ2/n?
D.μ/n,σ2
10.下列哪种情况不适合用方差分析(?? )
A.性别对收入的影响
B.年龄对收入的影响
C.专业对收入的影响 ??
D.行业对收入的影响
二、名词解释(每题5分,共20分)
11.整群抽样
12.?Z值
13.二维表
14.误差减少比例
三、简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的
(5)上月网购次数
16.简述什么是简单回归分析?其作用是什么?
17.如何对配对样本进行t检验。
四、计算题(共30分)
18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。
(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。
注: Z025=1.96
19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。
变差来源
SS
df
MS
F
Sig.
组间
A
C
320
F
000
组内
6048
D
E
—
—
总计
B
39
—
—
—
?
?
?
?
?