次数分布用于评估概率分布情况,首先要从试验中得到大样本数据资料,然后从次数分析资料所来自总体的概率分布情况。数量性状和质量性状都有对应的次数分布制作方法。
以某研究者试验中得到的水稻品种资源小区产量为例,说明次数分布的制作和分析。资料列入表1。
5.67 | 4.17 | 5.24 | 4.33 | 5.10 | 3.68 | 4.52 | 3.27 | 3.33 | 4.05 | 4.08 | 5.66 | 1.68 | 4.08 | 5.91 |
4.12 | 5.39 | 6.03 | 4.42 | 4.42 | 3.02 | 3.61 | 4.51 | 4.39 | 3.14 | 4.83 | 4.83 | 4.35 | 3.95 | 5.32 |
6.63 | 5.34 | 3.95 | 2.81 | 4.30 | 3.58 | 4.50 | 4.68 | 4.89 | 3.72 | 3.79 | 4.73 | 3.90 | 4.59 | 3.91 |
3.60 | 3.87 | 4.06 | 3.67 | 3.42 | 3.12 | 3.65 | 6.34 | 4.98 | 3.69 | 5.47 | 3.09 | 3.14 | 2.51 | 2.96 |
4.46 | 4.82 | 3.27 | 3.50 | 3.67 | 3.54 | 2.12 | 4.20 | 4.68 | 4.80 | 4.46 | 3.37 | 4.30 | 5.33 | 2.16 |
5.48 | 3.58 | 5.51 | 4.43 | 4.51 | 4.02 | 1.55 | 3.96 | 1.64 | 4.31 | 3.48 | 4.14 | 3.11 | 3.01 | 3.92 |
6.63 | 4.56 | 3.82 | 2.89 | 5.58 | 4.07 | 2.19 | 3.33 | 3.34 | 4.45 | 3.75 | 3.80 | 4.76 | 3.94 | 4.12 |
4.20 | 5.82 | 3.43 | 4.99 | 4.47 | 3.68 | 3.66 | 3.70 | 4.80 | 4.05 | 3.62 | 2.28 | 3.97 | 3.54 | 4.95 |
3.11 | 4.06 | 6.08 | 5.68 | 2.69 | 3.75 | 3.28 | 3.85 | 4.29 | 3.54 | 4.14 | 2.39 | 2.26 | 4.05 | 2.95 |
4.70 | 3.60 | 4.71 | 3.60 | 4.33 | 3.93 | 3.18 | 2.14 | 3.90 | 3.96 | 4.65 | 4.93 | 1.48 | 1.96 | 4.69 |
2.58 | 3.40 | 4.62 | 3.89 | 3.81 | 4.36 | 3.94 | 3.64 | 4.34 | 4.12 | 3.61 | 3.14 | 3.62 | 5.42 | 3.97 |
3.63 | 4.62 | 2.89 | 4.41 | 3.66 | 5.18 | 3.24 | 4.65 | 5.03 | 2.50 | 4.36 | 5.98 | 5.05 | 4.45 | 3.13 |
首先计算资料的基本统计数据,包括平均数、方差等。计算这里180个观察的平均数为:
计算方差为:
查找最小观察值为,查找最大观察值为
,进而用最大值减去最小值得到极差
。
确定组距:用极差除以组数()得到组距。本例中,设
,那么组距
为
。以最小观察值为第一个组中点,以等组距方式,可以得到
个组。组中点
,分别得到组下限和组上限。本例中,13个组的组下限和组上限以及组中点见表2。
将观察值按照大小归类,可知各组中观察值个数(次数,表2)。次数本身就是一种概率的估计,估计的是数值区间对应的概率。
组下限 | 组上限 | 组中点 | 观察值的个数 |
1.265 | 1.695 | 1.480 | 4 |
1.695 | 2.124 | 1.909 | 2 |
2.124 | 2.553 | 2.338 | 8 |
2.553 | 2.982 | 2.768 | 7 |
2.982 | 3.411 | 3.197 | 20 |
3.411 | 3.840 | 3.626 | 34 |
3.840 | 4.270 | 4.055 | 33 |
4.270 | 4.699 | 4.484 | 33 |
4.699 | 5.128 | 4.913 | 17 |
5.128 | 5.557 | 5.343 | 10 |
5.557 | 5.986 | 5.772 | 7 |
5.986 | 6.415 | 6.201 | 3 |
6.415 | 6.845 | 6.630 | 2 |
评估分布的形状:以组上限和下限以及次数,可以绘制矩形图。矩形图的高度由次数确定,矩形图的边界由组下限和组上限确定。矩形图的高度是概率估计结果的直观表示(见图)。矩形图的形状包括对称与否,有几个峰态等信息。本例中,可以看出矩形图是近似对称的。由表2可以看出,本例中观察值集中分布在2.982到5.128之间,偏离这个区间的观察是比较少的。
次数分布形状还可由偏度和峰度计算,作出说明。本例中,偏度系数(coefficient of skewness,cs)计算为:
偏度系数在0附近,说明这个分布式近似对称的。
峰度系数计算为:
峰度系数大于3,说明分布形状是比较陡峭的。