语音计量研究按照内容可以分为少数民族语和方言两大类。方言的语音计量研究包含音标、文字及音韵地位等方面;而少数民族语语音计量研究主要涉及音标。语音计量方法有算数统计法、概率统计法、数理统计法和实验统计法。算数统计和概率统计是最基本的统计方法,计算总样本中符合条件的单位个数和简单百分比,在语音计量上主要用于统计符合某个语音条件的字数和分布的概率。数理统计可分为古典概率统计和现代数理统计。现代数理统计从20世纪80年代进入音韵学领域,同期,现代概率统计也进入了方言学,从语音角度研究方言。随着语音研究的深入,有些问题采用数理统计方法无法解决,因而出现了实验统计法,这是综合运用实验语音学、方言学和统计学的研究方法。数理统计法和实验统计法目前较常用,前者较成熟,后者正在发展阶段。
计量语音学
用音位的、语音的(仪器的)和统计的方法对口头语言进行分析和描写的语音学的一个分支。
- 英文名称
- measuring phonetics
- 所属学科
- 统计学
数理统计的原则是对语音的统计项目进行数量计算,根据统计项获得数据表;在数据表的基础上分析语音统计项目的树形结构和聚类结构,从结构中解读语音之间的关系,检验和量化描写分析法中的结论;还可以做显着度的检验分析,说明语音之间差异的程度。根据统计项目的不同,方言数理统计方法,可以分为4类,但是其过程和步骤大体一致。①音值分类统计。根据字的中古音的音韵地位分成小类,如帮、母、东、董、送、合、口、一等字;再统计小类中方言点发音不同的字数。②音值切分统计。③区分特征统计。④多状态特征量化编码法。
选取吴语古阳声韵韵尾的消失变化特征,通过音变特征规则和历史层次,为多状态的语音特征进行编码,将原始数据数值化,为每一个方言点构建一条特征序列。具体步骤如下:首先选取多状态特征,根据方言点的音系材料和语音特征,确定该特征的音变规律和历史发展状态。再对应方言特征的时间状态,最原始状态的标记为“0”,后续的特征状态标记为“1、2、3……”等,完成特征数值化。另外,还有民族语的加权比率统计方法,如黄行列举了苗瑶语中符合某类条件的语音元素,计算它们的加权出现比率,计算公式为:
运用这种方法对主客位苗语的声、韵、调进行穷尽式的分析,以判断苗语方言的亲疏关系。加权比率法适用于民族语。
这是在现代实验语音学基础上发展的统计方法:首先录制语音资料,其次采用语音分析软件对语音特征进行分析,随后用数理统计的方法统计特征并分析结果。例如在声调格局的研究中进行基频的语音分析和归一统计,在此基础上研究方言声调系统格局。辅音和元音也能够采用语音统计法,如张梦翰采用Matlab软件,利用短时语音信号处理技术分析水语的清鼻音材料,找出区分清鼻音和送气鼻音的信号特征。元音也可以采用归一法进行处理。
计量的方法选用的材料需要统一规范。如果要使用不同作者的二手方言材料,需要有音系录音材料,然后根据计量需要进行规范统一。在有声调录音数据的基础上,声调的统一可以进行基频归一后,根据各类声调类型进行归类。声母和韵母的统一比较复杂,例如介音和滑音在不同的方音描写系统中有不同的处理方法。韵母有严式记音和宽式记音的区别,音系经过了音位处理,掩盖了字的实际发音。这些问题在进行二手方言材料的处理上都有很多难以处理的问题。
在方言语音处理前,还必要面对一字多读的现象,包括文白读、新旧读法等。还有一些字处于变化中,呈现动态的面貌,例如在粤西某地粤语中有一类入声字韵尾有两种“-t”和“-p”,彼此之间没有意义区别等情况。计量的规范统一涉及在具体操作时应该如何处理这些语音现象。在以往的研究中,这些语音处理的原则和方法都是依靠试验规定,没有具体理由。如果要以理服人,则需要对比采用规则前后产生的不同效果,以选择最佳方式方法。对比统计的结果差异,确定统计原则。
在语音数理统计过程中,统计的要求需要收集尽可能多的方言点的文字材料和录音,并对材料按照一定格式编排,放在方言数据处理平台进行操作。每个计量的字要对应中古音的地位,其声韵调要按照规定的格式进行记录,例如送气音有三种不同记录方式,在记录时要统一,不能混用。
数理统计都有现成统计学的公式可以套用,但是统计方法的选择需要进行试用和比照。对于同一个问题采用不同的方法,结果会有差异。例如麦耘用T检验、X2检验算押韵问题,结果有时就不同。还有在方言距离关系上也有欧式距离和明式距离可选用。选用哪种方法需要进行试验,比照结果,结合已有的定性研究的结果才能确定。获得统计结果后,对于这些数据还要进行一个还原的步骤,把统计结果和实际研究的问题结合起来。计量方法应用在音类研究上有加权的问题。有的学者不主张加权,但由于各音类特征之于亲疏关系的作用或权重大小不同,例如声母清浊的分与合,韵母塞音尾的去留这两个特征在衡量方言的类型时的作用不同,所以加权成为计量法的瓶颈。若要消除这种不真实的影响,就需要给不同的特征以不同的权重,这个权重的设置影响因素太多,各专家依靠经验值有各自不同的看法。因此,以往语音研究一般以描写分析为主,很少使用计量方法。
实验统计的录音环境和设备要求较高,需要安静的录制环境,背景噪音不能太高。在田野调查中录音条件较差,小孩哭闹声、家禽叫声和人们交谈的声音经常成为噪音源,影响所录制语料的质量。比较理想、安静的录音地点是在宾馆、教室或把发音人请到专门的录音室录制,由于田野调查的条件限制,也不太容易实现。在录音设备上,实验统计法需要单指向性较好的话筒(如AKG,铁三角Audio-Technica等)和国外著名厂家生产的声卡(如M-Audio,得胜TAKSTAR),以提高录音清晰度,还需要有配置较高存储量大的计算机(如联想手提笔记本Think Pad X系列),用于安装录音软件,存储录音材料。
常用录音平台和音频处理软件有4类:田野调查系统软件自带的录音软件,如上海师范大学开发的田野调查系统;实验语音处理软件的录音模块,如Praat;专业的音频处理软件录音模块,如Adobe Audition;还有专业录音机,如Tascam。除了录音设备外,还有喉头仪、鼻流计等辅助设备和其他软件用于分析语音。录音后需要进行处理分析。实验语音处理的前提是要对音节进行声韵切分和标注,切分的方法受个人差异因素影响,而且同样的录音对象因不同的录音环境也有不同录音结果,所以在切分时需要有一定数量的语音统计样本,还要采用稳定可靠的方式方法进行切分。切分和标注一般都是人工操作,虽然采用程序切分样本能够提高切分效率,但是容易忽略在切分中的细致问题。对切分标注好的语料采用哪种统计方法,则需要根据试验比照实际情况来决定。