频率标度分为线性频率标度与听觉频率标度。
线性频率标度上,两个频率的距离由两个频率值之间的差值决定。相同的频率差,在线性标度上的距离相同,和频率的分布区域无关。例如,在线性标度下,100Hz和200Hz之间的频率差为100Hz、200Hz与300Hz之间的频率差也为100Hz,二者相同。
听觉频率标度则是基于心理感知的声学心理标度,并非严格的物理空间标度。不同的听觉频率标度用来表示感知的不同特性。常用的听觉频率标度有对数标度(logarithmic scale)、半音标度(semitone scale)、美标度(mel scale)、巴克标度(bark scale)和等效矩形带宽标度(equivalent rectangular bandwidth,简称ERB)等。
线性标度下,同比例的两个频率可用相同的距离表示,这种关系可用一个对数(logarithmic)关系表示。对数标度很常用,因为在不同维度上,例如音高或响度,人的主观感知基于不同值的相对差异而非绝对差异。在对数标度下,100Hz和200Hz之间的距离,与200Hz与400Hz之间距离相同,log10(200)-log10(100)=log10(400)-log10(200),都是1个倍频程。
在对数标度中,把一个倍频程进行12等分,两个相邻频率之间的距离是一个半音(semitone,简称st)。线性标度的频率X与频率Y之间的半音距离计算公式为:
以半音为单位的距离(st)=
……(1)
按照这个公式,100Hz和200Hz之间的距离是12个半音,200Hz与400Hz之间距离也是12个半音,二者一致。
S.S.史蒂文斯、J.沃克曼和E.B.纽曼通过对乐音的感知研究,引入非线性频率标度美标度。又称美尔标度、梅尔标度。
Mel的名字来自单词melody(旋律)。这个标度通过把人的感知与1000Hz的正弦音(参考音)相比较,对正弦音进行分类得到。1梅尔被定义为1000Hz正弦音感知音高的千分之一,被感知为只有参考音1000Hz一半高的音设定为500梅尔,被感知为参考音两倍高的音被设定为2000梅尔。美标度和线性或对数标度不一样,完全基于人的感知。原则上,美标度只能通过汇总每个听辨人的印象获得,而不能通过物理频率计算。不过,美值可以通过下面的经验公式近似计算:
……(2)
测量人对音高感知的标度,以德国物理学家H.G.巴克豪森的名字命名。由K.E.茨威克于1961年提出。
巴克标度的定义基于H.弗莱彻1940年提出的听觉临界带宽(Critical Bands)理论。巴克标度的范围是从1到24,分别对应24个听觉临界带宽。巴克标度考虑到,同时发生的两个频率相近的信号,在低频时,会被感知为不同的音,但都在高频时,会被感知为同一个音,这个现象可以通过临界带宽理论描述。
该理论认为,在人的音高感知中,频率范围被划分为不同的滤波频带,低频带的带宽会窄一些(区分更细一些),高频带的带宽要宽一些。在一个临界频带中的所有能量都投射到这个频带的中心,即一定频率范围的声音能量被合成为一个感知量。临界频带并非都包含相同的频率范围。对低频感知的临界频率范围,比对高频感知的临界频率范围窄很多。
因为上述特点,人们认为,巴克标度比美标度更准确地反映人的音高感知。音高感知值巴克(Bark)和赫兹(Hz)之间的关系,可以采用下面的经验公式近似计算:
……(3)
当f[Bark]CB<2时,f[Bark]CB=0.85×f[Bark]CB+0.3,
当f[Bark]CB>20.1时,f[Bark]CB=1.22×f[Bark]CB-4.422。
等效矩形带宽标度和巴克标度非常相似,但是决定临界带宽的方法更加细化,这样可以更好地体现对复杂声音本质的感知。与巴克标度相比,该标度能更为准确地表示频率的感知。和巴克标度一样,它包括估计临界带宽及将频率映射到ERB标度上这两个部分。下面的经验公式把Hz转换为ERB值(不用考虑临界频率带中的能量分布):当100Hz≤f≤6500Hz时,
……(4)