发音器官主要由声带、甲状软骨、杓状软骨、环状软骨、环甲肌等组成。声带是发声的主要振动体,其结构大致可分为上皮层、固有层和声带肌三层,上皮层是复层鳞状上皮和液体,固有层主要是弹力纤维和韧带等,声带肌层主要是声带肌。
从声学上讲,当声带闭合,肺部压缩使声门下压增高,冲破声带产生声门脉冲,形成乐音声源或噪声声源。具体来说,声门下气流冲破声门形成体积、流速度变化,随着声门开闭形成声门脉冲,声门脉冲对空气的扰动转换为声压的变化,形成声源。声源的声学特性是每个倍频程下降大约12分贝。有时声带过分挤压或部分裂开也可形成噪声声源。
语音学和语言学中的发声类型指那些具有语言学意义的声源类型。语言中常见的发声类型有常态嗓音、紧嗓音、嘎裂音、假声(falsetto)、气嗓音、吸气音、喉室发声(ventricular voice)等。
对语言发声类型的生理和声学分析主要用周期、基频、开商(open quotient)和速度商(speech quotient)定义和描写。其中,开商和速度商的公式如下:
图1 发声参数和定义
开商 = 〔声门打开段(bd)/周期(ad)〕*100%
速度商=〔声门正在打开段(bc)/声门正在关闭段(cd)〕*100%
研究言语发声类型的常用方法有语音谐波分析法,逆滤波声源谱斜率分析法,逆滤波声源基频、开商和速度商分析法,声门阻抗信号(electroglottography,简称EGG)谱斜率分析法,声门阻抗信号基频、开商和速度商分析法,高速数字成像分析法等。
语音谐波分析法是对语音或声门阻抗信号先进行功率谱分析,然后测量第一谐波和第二谐波的比值。第二谐波数值越大、速度商、嗓音高频能量也越大,通常称为紧;第一谐波越大,速度商越小,开商越大,嗓音高频能量越小,通常称为松;但当元音第一共振峰较小时,如[i]、[u]、[y]等高元音,不能采用谐波分析法,因为第一共振峰会和第一、二谐波重叠,无法得到正确的谐波数据。此时可以尝试利用第一谐波或第二谐波和第二共振峰之比来描写语言的发声类型。
从逆滤波声源和声门阻抗信号中分析提取基频、开商和速度商是一种分析和定量描写语言发声类型的有效方法。具体方法是先对语音进行逆滤波得到声源信号,或用喉头仪(电声门仪)采集声门阻抗信号,从信号上检测基频、开商和速度商。
利用高速数字成像技术研究嗓音比较复杂。首先要用高速数字成像设备采集声带振动录像,图像信号的采样频率最好多于每秒钟4000帧,以保证研究假声的精度。然后对图像信号进行数字图像处理,测出动态声门面积,最终提取需要的参数。这种方法虽然复杂,但能提取大量参数,如声门面积函数、左右声门面积、左右声门宽度、前后声门面积和前后声门长度等参数。采用高速数字成像技术研究发声类型,不仅能很好地描写发声类型的共性,还能看到发声类型的个人特征。利用这些生理参数,可进行发声类型的定性和定量描写,建立发声类型的生理模型。
常态嗓音参数的范围较大,因为在这个嗓音参数变化范围内,一般不区别语言学意义,例如,基频可以从几十赫兹到三四百赫兹,开商的范围是周期的40%~60%,速度商的范围是大约100~300,基本涵盖人们正常言语的范围。
气嗓音有正常的气嗓音和紧的气嗓音两种。正常气嗓音发声类型的主要特征是声带在振动过程中始终漏气,开商较大,速度商较小,基频一般较小。紧的气嗓音速度商较大,有声带的摩擦噪声,基频可大可小。假声的开商一般较大,速度商在一百左右,基频很高,部分声带会一直敞开,形成直流分量,比较容易测定其声学特性。
紧嗓音的特征是速度商较大,高频能量较强,基频范围较大,可以很高。
挤喉音的声学特征是基频很低,速度商很大,声带振动周期不规则,需要用基于非周期的方法来提取基频。
吸气音的特征是速度商小,基频因人而定,比较固定,有非常大的直流分量,言语中主要用于表达不同的情感。
喉室发声类型在中国境外的语言中有语言学意义,在中国境内的语言里主要用于藏传佛教的诵经和蒙古呼麦的演唱。这种发声类型的生理特征是真声带和假声带同时振动,参数提取上主要是测量真假声带振动的两个基频、它们相位差以及两个基频导致的语音波形叠加形成的大周期。
在嗓音数据的表征上,利用开商和速度商两个参数可画出二维的嗓音发声图,利用基频、开商和速度商三个参数可以画出三维立体的嗓音发声图,用于表征嗓音发声类型的特征、性质和差别,如图2所示。语言中发声类型的参数是相对的,语音学研究通常更注重有区别意义的两种发声类型的参数差别,但在言语工程研究中,就需要注重实际的参数,以便合成不同声源。
图2 二维和三维的嗓音发声图
图2的左图是二维发声图,横轴为开商,纵轴为速度商。图中菱形为常态嗓音,右下角的小方形表示紧喉音,左下角的大方形是气泡音,常态嗓音上边的圆形是高音调嗓音,三角形是气嗓音。图2的右图是三维发声图,三个轴分别是基频、开商和速度商,图中参数代表藏语说话和诵经的嗓音特性和分布。
在中国境内的语言中,多个少数民族语言的嗓音发声具有语言学意义。例如,苗语有浊送气嗓音发声类型,语言学上称为松音;哈尼语、彝语等语言中,紧元音往往是紧嗓音和挤喉音发声类型,而松音是常态嗓音发声类型。在缅语支语言中,紧音是紧元音发声类型,基频较高,松音是常态嗓音。另外,汉语方言中也发现了具有区别意义的发声类型。中国境内语言的发声类型和声母清浊、喉塞、声调以及发音音质有发生学关系。