實(shí)驗(yàn)語(yǔ)音學(xué)與計(jì)算語(yǔ)言學(xué)(漢文部分)

發(fā)布時(shí)間:2021-11-19 17:53:49 | 來(lái)源: | 作者: | 責(zé)任編輯:

二、實(shí)驗(yàn)語(yǔ)音學(xué)與計(jì)算語(yǔ)言學(xué)

2010年藏語(yǔ)實(shí)驗(yàn)語(yǔ)音學(xué)的成果在整個(gè)藏語(yǔ)文研究成果中占據(jù)很大比例,具不完全統(tǒng)計(jì)有近30篇相關(guān)論文。鑒于藏語(yǔ)實(shí)驗(yàn)語(yǔ)音學(xué)與計(jì)算語(yǔ)言學(xué)在研究方法和研究對(duì)象上各有偏重,在實(shí)踐過(guò)程中又互有交叉,本文將這兩個(gè)學(xué)科的研究成果放在一起進(jìn)行梳理。代表性的研究成果有:楊陽(yáng)蕊、周一心、于洪志《藏語(yǔ)音素音位系統(tǒng)的功能負(fù)擔(dān)計(jì)算》(《蘭州學(xué)刊》第1期),楊陽(yáng)蕊、于洪志、李永宏《基于呼吸信號(hào)的藏語(yǔ)詩(shī)歌韻律研究》(《微計(jì)算機(jī)信息》第28期),王雙成、陳忠敏的《安多藏語(yǔ)送氣擦音的實(shí)驗(yàn)研究》(《民族語(yǔ)文》第2期),李亮、于洪志、楊陽(yáng)蕊、李永宏等的《現(xiàn)代藏語(yǔ)聲調(diào)研究現(xiàn)狀及方法》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),陳小瑩、陳晨、胡妍茹、李永宏、華侃的《基于EGG信號(hào)的安多藏語(yǔ)元音嗓音特征研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),陳晨、陳琪、李永宏、于洪志的《藏語(yǔ)語(yǔ)音合成語(yǔ)料庫(kù)的韻律標(biāo)注規(guī)則設(shè)計(jì)》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),李永宏、于洪志、孔江平的《藏語(yǔ)連續(xù)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)與實(shí)現(xiàn)》(《計(jì)算機(jī)工程與應(yīng)用》第13期),達(dá)哇彭措的《基于優(yōu)化Apriori算法的藏語(yǔ)音韻律規(guī)則研究》(《微計(jì)算機(jī)信息》第18期),李永宏、張金爽、王姝文、于洪志的《藏語(yǔ)新聞朗讀的呼吸信號(hào)聲學(xué)分析》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),高璐、陳琪、李永宏、于洪志的《藏語(yǔ)語(yǔ)音合成中文本分析的若干問(wèn)題研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),韓清華、于洪志的《基于HMM的安多藏語(yǔ)非特定人孤立詞語(yǔ)音識(shí)別研究》(《軟件導(dǎo)刊》第7期),多杰卓瑪?shù)摹冬F(xiàn)代藏語(yǔ)詞語(yǔ)信息庫(kù)構(gòu)建研究》(《電腦開(kāi)發(fā)與應(yīng)用》第7期),才讓卓瑪、才智杰的《基于語(yǔ)料庫(kù)的藏語(yǔ)TTS技術(shù)研究》(《青海師范大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),陳小瑩、華侃、于洪志的《藏語(yǔ)拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》(《語(yǔ)文學(xué)刊》第15期),廖艷莎、安亞彬、楊陽(yáng)蕊、何向真的《藏語(yǔ)單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)》(《隴東學(xué)院學(xué)報(bào)》第4期),劉澤國(guó)、張會(huì)慶、張環(huán)、張兆基的《結(jié)合語(yǔ)音學(xué)知識(shí)的藏語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)方法研究》(《福建電腦》第8期),扎西加、頓珠次仁的《自然語(yǔ)言處理用藏語(yǔ)格助詞的語(yǔ)法信息研究》(《中文信息學(xué)報(bào)》第5期)等。上述成果中,對(duì)于藏語(yǔ)語(yǔ)音相關(guān)參數(shù)的實(shí)驗(yàn)研究、分析和藏語(yǔ)聲學(xué)數(shù)據(jù)庫(kù)的建設(shè)是藏語(yǔ)實(shí)驗(yàn)語(yǔ)音學(xué)界關(guān)注的重點(diǎn)。楊陽(yáng)蕊、周一心、于洪志的《藏語(yǔ)音素音位系統(tǒng)的功能負(fù)擔(dān)計(jì)算》一文,以藏語(yǔ)的音素音位系統(tǒng)為研究對(duì)象,對(duì)拉薩話和夏河話的元音、輔音及聲調(diào)的音位功能負(fù)擔(dān)進(jìn)行了量化研究,該項(xiàng)研究的意義在于為歷史語(yǔ)言中關(guān)于方言分化和聲調(diào)產(chǎn)生理論提供了參考基礎(chǔ)。韓清華、于洪志的《基于HMM的安多藏語(yǔ)非特定人孤立詞語(yǔ)音識(shí)別研究》以VC++6.0為開(kāi)發(fā)平臺(tái),實(shí)現(xiàn)一個(gè)基于隱馬爾可夫模型(Hidden Markov Model,簡(jiǎn)稱HMM)非特定人的安多藏語(yǔ)孤立詞語(yǔ)音識(shí)別系統(tǒng)。對(duì)有聲段語(yǔ)音進(jìn)行MFCC參數(shù)的提取,對(duì)提取后的MFCC參數(shù)進(jìn)行矢量量化后訓(xùn)練HMM模型,形成特征模板庫(kù),最后進(jìn)行識(shí)別。根據(jù)安多藏語(yǔ)的特點(diǎn),改進(jìn)端點(diǎn)檢測(cè)的方法,提高了孤立詞語(yǔ)音信號(hào)檢測(cè)的準(zhǔn)確性,并進(jìn)一步提高了識(shí)別率。

端點(diǎn)檢測(cè)是語(yǔ)音識(shí)別中的一項(xiàng)關(guān)鍵技術(shù),端點(diǎn)檢測(cè)的準(zhǔn)確性對(duì)語(yǔ)音識(shí)別的性能有很大影響。劉澤國(guó)、張會(huì)慶、張環(huán)、張兆基的《結(jié)合語(yǔ)音學(xué)知識(shí)的藏語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)方法研究》一文,將藏語(yǔ)語(yǔ)音學(xué)知識(shí)融入端點(diǎn)檢測(cè)過(guò)程中,同時(shí)綜合時(shí)域頻域特征,根據(jù)短時(shí)能頻值和語(yǔ)音能量集中區(qū)的頻域譜幅采取自適應(yīng)門(mén)限方法,改進(jìn)端點(diǎn)檢測(cè)的方法。實(shí)驗(yàn)表明該方法提高了端點(diǎn)檢測(cè)的識(shí)別率,對(duì)于藏語(yǔ)語(yǔ)音識(shí)別起到了很好的輔助作用。

韻律是語(yǔ)音的一個(gè)重要特征。對(duì)韻律規(guī)則進(jìn)行研究和韻律標(biāo)注是藏語(yǔ)語(yǔ)音合成語(yǔ)料庫(kù)建設(shè)的重要環(huán)節(jié)。楊陽(yáng)蕊、于洪志、李永宏等的《基于呼吸信號(hào)的藏語(yǔ)詩(shī)歌韻律研究》、達(dá)哇彭措的《基于優(yōu)化Apriori算法的藏語(yǔ)音韻律規(guī)則研究》和陳晨、陳琪、李永宏、于洪志等的《藏語(yǔ)語(yǔ)音合成語(yǔ)料庫(kù)的韻律標(biāo)注規(guī)則設(shè)計(jì)》就是這方面的研究成果。上述研究成果為建立藏語(yǔ)語(yǔ)音合成語(yǔ)料庫(kù)提供了直觀的、科學(xué)的方法。

運(yùn)用實(shí)驗(yàn)設(shè)備和手段對(duì)藏語(yǔ)具體語(yǔ)音現(xiàn)象進(jìn)行研究是實(shí)驗(yàn)語(yǔ)音學(xué)的重要特征之一。相關(guān)的成果有王雙成、陳忠敏的《安多藏語(yǔ)送氣擦音的實(shí)驗(yàn)研究》,陳小瑩、陳晨、胡妍茹、李永宏、華侃的《基于EGG信號(hào)的安多藏語(yǔ)元音嗓音特征研究》和陳小瑩、華侃、于洪志的《藏語(yǔ)拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》。《安多藏語(yǔ)送氣擦音的實(shí)驗(yàn)研究》一文的作者根據(jù)送氣擦音的發(fā)音機(jī)制,對(duì)安多藏語(yǔ)許多土語(yǔ)有清擦音送氣和不送氣的對(duì)立進(jìn)行研究,提出在安多方言里可以用三個(gè)聲學(xué)特征來(lái)區(qū)別一般清擦音和送氣清擦音?!痘贓GG信號(hào)的安多藏語(yǔ)元音嗓音特征研究》和《藏語(yǔ)拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》二文,就是通過(guò)提取元音的參數(shù)基頻,就元音之間、元音與輔音之間的組合對(duì)嗓音參數(shù)的影響進(jìn)行研究,得出基頻、開(kāi)商和速度商之間有很強(qiáng)的關(guān)聯(lián)性,各種組合方式下前置輔音對(duì)嗓音參數(shù)的影響不及輔音韻尾的影響程度、各元音由于組合方式變化對(duì)于參數(shù)影響的趨勢(shì)基本一致。

聲調(diào)研究是現(xiàn)代藏語(yǔ)語(yǔ)音研究的一個(gè)基礎(chǔ)部分,同時(shí)也為漢藏語(yǔ)系其他語(yǔ)言的研究奠定了基礎(chǔ)。李亮、于洪志、楊陽(yáng)蕊、李永宏等的《現(xiàn)代藏語(yǔ)聲調(diào)研究現(xiàn)狀及方法》一文,分別從起源時(shí)間和形成條件兩方面說(shuō)明藏語(yǔ)聲調(diào)的產(chǎn)生和發(fā)展,縱向闡述了藏語(yǔ)聲調(diào)研究及研究結(jié)果,并從聲學(xué)角度分析、論述了藏語(yǔ)聲調(diào)的現(xiàn)代語(yǔ)音學(xué)研究方法。

計(jì)算語(yǔ)言學(xué)為藏語(yǔ)文的信息化處理提供技術(shù)思路和技術(shù)支持保障。藏漢雙語(yǔ)語(yǔ)料庫(kù)建設(shè)對(duì)計(jì)算語(yǔ)言學(xué)的發(fā)展具有重要意義。語(yǔ)料庫(kù)的建設(shè)涉及對(duì)語(yǔ)料的描述、標(biāo)記,數(shù)據(jù)庫(kù)的總體結(jié)構(gòu)、設(shè)計(jì)與實(shí)現(xiàn)等多個(gè)方面。多杰卓瑪?shù)摹冬F(xiàn)代藏語(yǔ)詞語(yǔ)信息庫(kù)構(gòu)建研究》一文,以語(yǔ)言學(xué)的理論和方法為主導(dǎo),在藏文信息處理中引入了藏語(yǔ)詞語(yǔ)的信息化和形式化,并對(duì)構(gòu)建的信息庫(kù)進(jìn)行了結(jié)構(gòu)上的總體設(shè)計(jì),從而制定了信息處理用藏語(yǔ)詞語(yǔ)信息庫(kù)的構(gòu)建原則及收詞規(guī)則,即一形一項(xiàng)、一時(shí)(式)一項(xiàng)、一義一項(xiàng)。為此構(gòu)建了以藏文詞匯為主的音、形、義等的信息庫(kù)。

才讓卓瑪、才智杰的《基于語(yǔ)料庫(kù)的藏語(yǔ)TTS技術(shù)研究》通過(guò)比較分析國(guó)內(nèi)外TTS技術(shù)的發(fā)展,提出基于語(yǔ)料庫(kù)的藏語(yǔ)TTS技術(shù)的可行性,研究了藏語(yǔ)TTS的文本分析模塊、語(yǔ)音合成模塊及語(yǔ)音數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù),并設(shè)計(jì)了一個(gè)完整的基于語(yǔ)料庫(kù)的藏語(yǔ)TTS系統(tǒng)。廖艷莎、安亞彬、楊陽(yáng)蕊、何向真的《藏語(yǔ)單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)》一文,在分析藏語(yǔ)三大方言音節(jié)結(jié)構(gòu)基礎(chǔ)上設(shè)計(jì)了藏語(yǔ)單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫(kù),其中包括39項(xiàng)聲學(xué)參數(shù)。這些聲學(xué)參數(shù)在表征語(yǔ)音現(xiàn)象的同時(shí),最終服務(wù)于工程語(yǔ)音學(xué)。李永宏、于洪志、孔江平等在《藏語(yǔ)連續(xù)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)與實(shí)現(xiàn)》一文中,以藏語(yǔ)夏河話為研究對(duì)象,建立了基于三音子的藏語(yǔ)連續(xù)語(yǔ)音語(yǔ)料庫(kù),實(shí)現(xiàn)了語(yǔ)料自動(dòng)選取。李永宏、張金爽、王姝文、于洪志的《藏語(yǔ)新聞朗讀的呼吸信號(hào)聲學(xué)分析》一文從言語(yǔ)生理的角度研究藏語(yǔ)新聞朗讀時(shí)的呼吸生理特性。主要利用統(tǒng)計(jì)學(xué)的方法研究新聞?wù)Z料的男女發(fā)音人的呼吸信號(hào)的聲學(xué)表現(xiàn),包括:1.選取20篇250字左右的新聞?wù)Z料,進(jìn)行呼吸信號(hào)的錄制;2.利用已建好的呼吸信號(hào)處理平臺(tái),進(jìn)行呼吸重置的標(biāo)注,提取新聞呼吸信號(hào)的重置時(shí)長(zhǎng)和幅度參數(shù);3.統(tǒng)計(jì)分析新聞朗讀的三級(jí)呼吸特性,并對(duì)男女呼吸特征進(jìn)行對(duì)比分析,得出呼吸重置時(shí)長(zhǎng)和重置幅度的正相關(guān)和呼吸節(jié)奏特點(diǎn)。

文本分析是文語(yǔ)轉(zhuǎn)換系統(tǒng)的前端,是制約語(yǔ)音合成自然度的一個(gè)重要因素。高璐、陳琪、李永宏、于洪志的《藏語(yǔ)語(yǔ)音合成中文本分析的若干問(wèn)題研究》一文在考察漢語(yǔ)文本分析方案的基礎(chǔ)上,分析藏語(yǔ)的特點(diǎn),提出了一套適合于藏語(yǔ)語(yǔ)音合成的文本分析模塊的實(shí)現(xiàn)方案。文中采用最大匹配法和分詞詞庫(kù)相結(jié)合的方法實(shí)現(xiàn)文本的自動(dòng)分詞,建立一套層次化的規(guī)則體系對(duì)文本進(jìn)行規(guī)范化處理,字音轉(zhuǎn)換則通過(guò)SAMPA-ST的藏語(yǔ)機(jī)讀音標(biāo)系統(tǒng)來(lái)實(shí)現(xiàn)。本研究的完成為藏語(yǔ)的語(yǔ)音合成打下了良好的基礎(chǔ)。扎西加、頓珠次仁的《自然語(yǔ)言處理用藏語(yǔ)格助詞的語(yǔ)法信息研究》一文主要探討了藏語(yǔ)格助詞的語(yǔ)法信息、語(yǔ)義信息、功能結(jié)構(gòu)等內(nèi)容,從而為建立藏語(yǔ)格助詞的語(yǔ)法屬性庫(kù)提供翔實(shí)的參數(shù)。這對(duì)句子進(jìn)行分析與描述,觀察句子歧義都有著重要的意義。

版權(quán)所有 中國(guó)藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號(hào)-1

京公網(wǎng)安備 11010502035580號(hào)