计量语音学

首页 . 理学 . 统计学 . 人文统计 . 【基本原理】

/measuring phonetics/

条目作者刘秉辉

刘秉辉

最后更新 2022-01-20

浏览 223次

最后更新 2022-01-20

浏览 223次

0 意见反馈条目引用

用音位的、语音的（仪器的）和统计的方法对口头语言进行分析和描写的语音学的一个分支。

英文名称: measuring phonetics

所属学科: 统计学

研究方法　

　　语音计量研究按照内容可以分为少数民族语和方言两大类。方言的语音计量研究包含音标、文字及音韵地位等方面；而少数民族语语音计量研究主要涉及音标。语音计量方法有算数统计法、概率统计法、数理统计法和实验统计法。算数统计和概率统计是最基本的统计方法，计算总样本中符合条件的单位个数和简单百分比，在语音计量上主要用于统计符合某个语音条件的字数和分布的概率。数理统计可分为古典概率统计和现代数理统计。现代数理统计从20世纪80年代进入音韵学领域，同期，现代概率统计也进入了方言学，从语音角度研究方言。随着语音研究的深入，有些问题采用数理统计方法无法解决，因而出现了实验统计法，这是综合运用实验语音学、方言学和统计学的研究方法。数理统计法和实验统计法目前较常用，前者较成熟，后者正在发展阶段。

数理统计法

数理统计的原则是对语音的统计项目进行数量计算，根据统计项获得数据表；在数据表的基础上分析语音统计项目的树形结构和聚类结构，从结构中解读语音之间的关系，检验和量化描写分析法中的结论；还可以做显着度的检验分析，说明语音之间差异的程度。根据统计项目的不同，方言数理统计方法，可以分为4类，但是其过程和步骤大体一致。①音值分类统计。根据字的中古音的音韵地位分成小类，如帮、母、东、董、送、合、口、一等字；再统计小类中方言点发音不同的字数。②音值切分统计。③区分特征统计。④多状态特征量化编码法。

选取吴语古阳声韵韵尾的消失变化特征，通过音变特征规则和历史层次，为多状态的语音特征进行编码，将原始数据数值化，为每一个方言点构建一条特征序列。具体步骤如下：首先选取多状态特征，根据方言点的音系材料和语音特征，确定该特征的音变规律和历史发展状态。再对应方言特征的时间状态，最原始状态的标记为“0”，后续的特征状态标记为“1、2、3……”等，完成特征数值化。另外，还有民族语的加权比率统计方法，如黄行列举了苗瑶语中符合某类条件的语音元素，计算它们的加权出现比率，计算公式为：

$加权出现比率=\frac{相对出现次数（客位方言与主位方言某音类的对当次数）}{绝对出现次数（客位方言某音类在音系中的出现次数）}$

运用这种方法对主客位苗语的声、韵、调进行穷尽式的分析，以判断苗语方言的亲疏关系。加权比率法适用于民族语。

实验语音统计法

这是在现代实验语音学基础上发展的统计方法：首先录制语音资料，其次采用语音分析软件对语音特征进行分析，随后用数理统计的方法统计特征并分析结果。例如在声调格局的研究中进行基频的语音分析和归一统计，在此基础上研究方言声调系统格局。辅音和元音也能够采用语音统计法，如张梦翰采用Matlab软件，利用短时语音信号处理技术分析水语的清鼻音材料，找出区分清鼻音和送气鼻音的信号特征。元音也可以采用归一法进行处理。

研究内容及问题

数理统计的材料

计量的方法选用的材料需要统一规范。如果要使用不同作者的二手方言材料，需要有音系录音材料，然后根据计量需要进行规范统一。在有声调录音数据的基础上，声调的统一可以进行基频归一后，根据各类声调类型进行归类。声母和韵母的统一比较复杂，例如介音和滑音在不同的方音描写系统中有不同的处理方法。韵母有严式记音和宽式记音的区别，音系经过了音位处理，掩盖了字的实际发音。这些问题在进行二手方言材料的处理上都有很多难以处理的问题。

在方言语音处理前，还必要面对一字多读的现象，包括文白读、新旧读法等。还有一些字处于变化中，呈现动态的面貌，例如在粤西某地粤语中有一类入声字韵尾有两种“-t”和“-p”，彼此之间没有意义区别等情况。计量的规范统一涉及在具体操作时应该如何处理这些语音现象。在以往的研究中，这些语音处理的原则和方法都是依靠试验规定，没有具体理由。如果要以理服人，则需要对比采用规则前后产生的不同效果，以选择最佳方式方法。对比统计的结果差异，确定统计原则。

在语音数理统计过程中，统计的要求需要收集尽可能多的方言点的文字材料和录音，并对材料按照一定格式编排，放在方言数据处理平台进行操作。每个计量的字要对应中古音的地位，其声韵调要按照规定的格式进行记录，例如送气音有三种不同记录方式，在记录时要统一，不能混用。

数理统计的方法

数理统计都有现成统计学的公式可以套用，但是统计方法的选择需要进行试用和比照。对于同一个问题采用不同的方法，结果会有差异。例如麦耘用T检验、X₂检验算押韵问题，结果有时就不同。还有在方言距离关系上也有欧式距离和明式距离可选用。选用哪种方法需要进行试验，比照结果，结合已有的定性研究的结果才能确定。获得统计结果后，对于这些数据还要进行一个还原的步骤，把统计结果和实际研究的问题结合起来。计量方法应用在音类研究上有加权的问题。有的学者不主张加权，但由于各音类特征之于亲疏关系的作用或权重大小不同，例如声母清浊的分与合，韵母塞音尾的去留这两个特征在衡量方言的类型时的作用不同，所以加权成为计量法的瓶颈。若要消除这种不真实的影响，就需要给不同的特征以不同的权重，这个权重的设置影响因素太多，各专家依靠经验值有各自不同的看法。因此，以往语音研究一般以描写分析为主，很少使用计量方法。　

实验统计的设备与方法

实验统计的录音环境和设备要求较高，需要安静的录制环境，背景噪音不能太高。在田野调查中录音条件较差，小孩哭闹声、家禽叫声和人们交谈的声音经常成为噪音源，影响所录制语料的质量。比较理想、安静的录音地点是在宾馆、教室或把发音人请到专门的录音室录制，由于田野调查的条件限制，也不太容易实现。在录音设备上，实验统计法需要单指向性较好的话筒（如AKG，铁三角Audio-Technica等）和国外著名厂家生产的声卡（如M-Audio，得胜TAKSTAR），以提高录音清晰度，还需要有配置较高存储量大的计算机（如联想手提笔记本Think Pad X系列），用于安装录音软件，存储录音材料。

常用录音平台和音频处理软件有4类：田野调查系统软件自带的录音软件，如上海师范大学开发的田野调查系统；实验语音处理软件的录音模块，如Praat；专业的音频处理软件录音模块，如Adobe Audition；还有专业录音机，如Tascam。除了录音设备外，还有喉头仪、鼻流计等辅助设备和其他软件用于分析语音。录音后需要进行处理分析。实验语音处理的前提是要对音节进行声韵切分和标注，切分的方法受个人差异因素影响，而且同样的录音对象因不同的录音环境也有不同录音结果，所以在切分时需要有一定数量的语音统计样本，还要采用稳定可靠的方式方法进行切分。切分和标注一般都是人工操作，虽然采用程序切分样本能够提高切分效率，但是容易忽略在切分中的细致问题。对切分标注好的语料采用哪种统计方法，则需要根据试验比照实际情况来决定。