强频区的分布模式还受相邻音段影响。一位51岁北京人的清辅音能量集中区数据见于下表。
辅音 | 能量集中区分布范围(Hz) | 强频峰(Hz) | 相对声级(dB) |
b | 200~1600 | 250 | 22 |
d | 300~6000 | — | 20 |
g | 250~6300 | — | 20 |
p | 150~8000 | 1250,2500 | 25 |
t | 150~8000 | 200 | 28 |
k | 120~6000 | 2000 | 24 |
f | 150~10000 | 200,6300 | 10 |
s | 3000~10000 | 6300 | 25 |
sh | 1500~8000 | 2500,4500 | 26 |
x | 2500~8000 | 3000,5000 | 28 |
h | 1000~3000 | 1500,2500 | 20 |
z | 3200~8000 | 6300 | 22 |
zh | 2000~5000 | 4000 | 22 |
j | — | 5000 | 22 |
c | 4000~8000 | 6500 | 25 |
ch | 250~8000 | 4000 | 30 |
q | 2000~8000 | 3500 | 30 |
通常采用谱矩谱参数(spectral moments)对频谱形进行宏观、定量的考察,量化频谱的分布特性,反应能量集中区的情况。谱参数常采用前四阶谱矩参数,包括频谱重心(center of gravity)、频谱标准差值(standard deviation)、频谱偏度(skewness)、频谱峰度(kurtosis)。
频率重心反映谱能量的集中分布。标准差值反映谱能量分布的变化范围。偏度反映谱的形状在频率中心的基础上,左偏还是右偏,如果偏度值为零,说明在频率重心,两边对称分布;如果值为正数,说明频率重心右边的尾巴比左边的尾巴长,是向左偏的,如果值为负数,说明重心左边的尾巴比右边的长,是向右偏的。语音学中,偏度是对谱斜率的一个反映,反映整个谱能量分布的倾斜程度。偏度为正,说明能量集中在低频区域;偏度为负,说明能量集中在高频区域。峰度描述谱能量分布的峰的情况,正值说明谱有很清晰的峰的结构,峰度值越大,谱的峰越突出,在频率中心附近的能量越集中;负值说明谱没有很明确的峰,峰度值越小,频谱峰的分布情况越分散。峰度与标准差密切相关,标准差越大,频谱的频率重心周围的谱峰能量越分散,谱的峰度值就越低。这些谱参数组合起来,能很好地反映谱的整体特征。
频谱重心的计算公式为:
……(1)
式中f为频率;s(f)为语音信号复杂的二维谱;p为级数。p=1,上面加权为绝对谱,p=2,加权为功率谱,一般情况下的默认值是p=2。频率重心是在整个频率域内由|s(f)|p衡量的频率值,反映整个谱在平均状态下,频率成分的能量高低情况。
标准差值的计算公式为:
……(2)
式中fc为频率中心的值。
偏度计算公式为:
……(3)
峰度的计算公式为:
……(4)