B E C C A D C B A E
贾俊平哪个学校_贾俊平老师
贾俊平哪个学校_贾俊平老师
贾俊平哪个学校_贾俊平老师
贾俊平哪个学校_贾俊平老师
贾俊平哪个学校_贾俊平老师
D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的数据属于什么类型。
顺序数据
(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:
接收 频率
E100.00 - 109.00 9 22.5 14 35.0 16
D 17
C 32
B 21
A 14
(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:
(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:
接收 频数 频率(%) 累计频率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10
3、分组频数表
销售收入 频数 频率% 累计频数 累计频率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
总和 40 100.0
(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
频数 频率% 累计频数 累计频率%
先进企业 10 25.0 10 25.0
良好企业 12 30.0 22 55.0
一般企业 9 22.5 31 77.5
落后企业 9 22.5 40 100.0
总和 40 100.0
3.3 某百货公司连续40天的商品销售额如下:
单位:万元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
1、确定组数:
,取k=6
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(49-25)÷6=4,取5
3、分组频数表
销售收入(万元) 频数 频率% 累计频数 累计频率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
总和 40 100.0
3.4 利用下面的数据构建茎叶图和箱线图。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:
单位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6或7
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5
组距=( 值 - 最小值)÷ 组数=(61-40)÷7=3,
3、分组频数表
组距3,上限为小于
频数 百分比 累计频数 累积百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合计 100 100.0
直方图:
组距4,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合计 100 100.0
直方图:
组距5,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合计 100 100.0
直方图:
分布特征:左偏钟型。
3.8 下面是北方某城市1——2月份各天气温的记录数据:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的数据属于什么类型。
数值型数据
(2)对上面的数据进行适当的分组。
1、确定组数:
,取k=7
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5
3、分组频数表
温度 频数 频率% 累计频数 累计频率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合计 60 100.0
(3)绘制直方图,说明该城市气温分布的特点。
3.11 对于下面的数据绘制散点图。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩 人数
甲班 乙班
优良
中及格
不及格 3
618
94 6
15
98
2要求:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
(2)比较两个班考试成绩分布的特点。
甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。
(3)画出雷达图,比较两个班考试成绩的分布是否相似。
分布不相似。
3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):
单位:亿元
年份 国内生产总值
产业 第二产业 第三产业
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
87 17947
20428
23029
25174
27038
29905
33153
36075
388
43721
要求:
(1)用Excel绘制国内生产总值的线图。
(2)绘制、二、三产业国内生产总值的线图。
(3)根据2004年的国内生产总值及其构成数据绘制饼图。
第四章 统计数据的概括性描述
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准。
(4)说明汽车销售量分布的特征。
解:
Statistics
汽车销售数量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 随机抽取25个网络用户,他们的年龄数据如下:
单位:周岁
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
1、确定组数:
,取k=6
2、确定组距:组距=( 值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分组后的均值与方:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分组后的直方图:
4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到种排队方式的平均等待时间为7.2分钟,标准为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 2 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准。
解:
Statistics
百货公司每天的销售额(万元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.0
50 272.5000
75 2.0
4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 单位成本 总成本(元)
名称 (元) 甲企业 乙企业
AB
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比较两个企业的总平均成本,哪个高,并分析其原因。
产品名称 单位成本(元) 甲企业 乙企业
总成本(元) 产品数 总成本(元) 产品数
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) 企业数(个)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 计 120
要求:
(1)计算120家企业利润额的平均数和标准。
(2)计算分布的偏态系数和峰态系数。
解:
Statistics
企业利润组中值Mi(万元)
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准是否相同?如果不同,哪组样本的标准较大?
(3)两位调查人员得到这l 100名少年儿童身高的者或者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准大的可能性大。
(3)机会不相同,样本量大的得到者和者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准为5kg;女生的平均体重为50kg,标准为5kg。请回答下面的问题:
(1)是男生的体重异大还是女生的体重异大?为什么?
女生,因为标准一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1= = =-1;Z2= = =1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?
计算标准分数:
Z1= = =-2;Z2= = =2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准是15分;在B项测试中,其平均分数是400分,标准是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA= = =1;ZB= = =0.5
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3850 3670 3690 3720 3610 3590 3700
日平均产量 3700
日产量标准 50
标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
标准分数界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
B E C C A D C B A E
N Valid 120D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的数据属于什么类型。
顺序数据
(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:
接收 频率
E 16
D 17
C 32
B 21
A 14
(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:
(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:
接收 频数 频率(%) 累计频率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10
3、分组频数表
销售收入 频数 频率% 累计频数 累计频率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
总和 40 100.0
(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
频数 频率% 累计频数 累计频率%
先进企业 10 25.0 10 25.0
良好企业 12 30.0 22 55.0
一般企业 9 22.5 31 77.5
落后企业 9 22.5 40 100.0
总和 40 100.0
3.3 某百货公司连续40天的商品销售额如下:
单位:万元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
1、确定组数:
,取k=6
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(49-25)÷6=4,取5
3、分组频数表
销售收入(万元) 频数 频率% 累计频数 累计频率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
总和 40 100.0
3.4 利用下面的数据构建茎叶图和箱线图。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:
单位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6或7
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5
组距=( 值 - 最小值)÷ 组数=(61-40)÷7=3,
3、分组频数表
组距3,上限为小于
频数 百分比 累计频数 累积百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合计 100 100.0
直方图:
组距4,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合计 100 100.0
直方图:
组距5,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合计 100 100.0
直方图:
分布特征:左偏钟型。
3.8 下面是北方某城市1——2月份各天气温的记录数据:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的数据属于什么类型。
数值型数据
(2)对上面的数据进行适当的分组。
1、确定组数:
,取k=7
2、确定组距:
组距=( 值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5
3、分组频数表
温度 频数 频率% 累计频数 累计频率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合计 60 100.0
(3)绘制直方图,说明该城市气温分布的特点。
3.11 对于下面的数据绘制散点图。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩 人数
甲班 乙班
优良
中及格
不及格 3
618
94 6
15
98
2要求:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
(2)比较两个班考试成绩分布的特点。
甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。
(3)画出雷达图,比较两个班考试成绩的分布是否相似。
分布不相似。
3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):
单位:亿元
年份 国内生产总值
产业 第二产业 第三产业
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
87 17947
20428
23029
25174
27038
29905
33153
36075
388
43721
要求:
(1)用Excel绘制国内生产总值的线图。
(2)绘制、二、三产业国内生产总值的线图。
(3)根据2004年的国内生产总值及其构成数据绘制饼图。
第四章 统计数据的概括性描述
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准。
(4)说明汽车销售量分布的特征。
解:
Statistics
汽车销售数量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 随机抽取25个网络用户,他们的年龄数据如下:
单位:周岁
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
1、确定组数:
,取k=6
2、确定组距:组距=( 值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分组后的均值与方:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分组后的直方图:
4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到种排队方式的平均等待时间为7.2分钟,标准为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 2 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准。
解:
Statistics
百货公司每天的销售额(万元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.0
50 272.5000
75 2.0
4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 单位成本 总成本(元)
名称 (元) 甲企业 乙企业
AB
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比较两个企业的总平均成本,哪个高,并分析其原因。
产品名称 单位成本(元) 甲企业 乙企业
总成本(元) 产品数 总成本(元) 产品数
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) 企业数(个)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 计 120
要求:
(1)计算120家企业利润额的平均数和标准。
(2)计算分布的偏态系数和峰态系数。
解:
Statistics
企业利润组中值Mi(万元)
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准是否相同?如果不同,哪组样本的标准较大?
(3)两位调查人员得到这l 100名少年儿童身高的者或者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准大的可能性大。
(3)机会不相同,样本量大的得到者和者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准为5kg;女生的平均体重为50kg,标准为5kg。请回答下面的问题:
(1)是男生的体重异大还是女生的体重异大?为什么?
女生,因为标准一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1= = =-1;Z2= = =1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?
计算标准分数:
Z1= = =-2;Z2= = =2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准是15分;在B项测试中,其平均分数是400分,标准是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA= = =1;ZB= = =0.5
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3850 3670 3690 3720 3610 3590 3700
日平均产量 3700
日产量标准 50
标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
标准分数界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
版权声明:本文内容由互联。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发 836084111@qq.com 邮箱删除。