它是定量变量概率分布的一种估计,最早由K.皮尔逊引入。构建直方图(见图),首先是确定取值范围,将整个取值范围划分成一系列连续且不重叠的区间,通常每个区间的大小相同(但并非必须相同),然后计算落入每个区间的数据个数,即频数。如果区间大小相同,在每个区间上竖立一个矩形,其高度与频数成正比。直方图还可以被归一化,以频率(频数/总数)表示,这样每个区间上的矩形就表示这一类别占总数的比例,则所有矩形的高度之和等于1。如果区间大小不同,则要求竖立的矩形的面积与频数成正比。直方图给出了数据分布密度的一种粗略表示,可以看成是一种最简单的核密度估计。用于概率密度的直方图的总面积总是归为1,如果横轴上的所有区间长度为1,则直方图与频率图相同。
直方图是一个多义词,请在下列义项上选择浏览(共3个义项)