淺談信息處理與現(xiàn)代漢語輕聲(2)
時間:
年玉萍1由 分享
三、普通話常見的輕聲詞語
普通話中常見的輕聲詞語一般有一定的規(guī)律,主要有以下幾種:
1.助詞“的、地、得、著、了、過”和語氣詞“吧、嘛、呢、啊”等。 例如:
我的、迅速地、熱得很、拿著、看了、去過、好吧、好嘛、你呢、是啊。
2.部分單純詞中的疊音詞和合成詞中的重疊式的后一個音節(jié)。例如:
猩猩、餑餑、媽媽、星星、坐坐、勸勸、催催、講講。
3.構(gòu)詞后綴“子、頭”和表示群體的“們”等。例如:
桌子、辮子、木頭、石頭、我們、他們。
4.名詞、代詞后面表示方位的語素或詞。例如:
桌子上、臉上、山下、前面、前邊、教室里、箱子里。
5.動詞、形容詞后面表示趨向的詞“來、去、起來、下去”等。例如:
起來、過去、出去、上去、熱起來、拿出來、跑過去、走回去。
6.下面詞語里加著重號的字一律讀輕聲。例如:
來來去去、打打鬧鬧、黑不溜秋、胡里糊涂、傻不楞登。
7.有一批常用的雙音節(jié)詞,第二個音節(jié)習(xí)慣上要讀輕聲。例如:
巴結(jié)、巴掌、包袱、本事、編輯、扁擔(dān)、別扭、玻璃、薄荷、簸箕、不是、裁縫。
蒼蠅、柴火、稱呼、出息、畜生、刺激、聰明、湊合、耷拉、大方、大爺、大意。
大夫、耽擱、燈籠、嘀咕、地道、地方、地下、東西、動彈、豆腐、對頭、多少。
哆嗦、耳朵、翻騰、分析、風(fēng)箏、高粱、胳膊、疙瘩、工夫、功夫、姑娘、故事。
棺材、官司、規(guī)矩、閨女、哈欠、含糊、核桃、合同、狐貍、葫蘆、胡同、糊涂。
四、信息處理與輕聲
由于輕聲能區(qū)別詞性和詞義,再加上漢字是表意性的文字,不直接表音,所以,輕聲現(xiàn)象通過表意性的漢字表現(xiàn)不出來,這給人們朗讀帶來了很大的麻煩。特別是習(xí)慣輕聲,由于人們把握不準(zhǔn)的話,不知道該不該讀輕聲,有的讀不讀輕聲,意思不一樣,例如:
1.他這種助人為樂的精神值得我們學(xué)習(xí)。
2.老張年齡那么大了,但顯得很有精神。
3.這篇文章的大意我明白。
4.你太大意了,以后可要小心哪!
這兩組句子,分別都有兩個“精神”和“大意”,但在每一個句子中只有一種讀法,前一個讀原調(diào),后一個讀輕聲。聯(lián)系“精神”和“大意”前后的詞語,就可以理解句子意思。
但是,像下面的句子:
5.到一個新的地方分不清東西。
6.這是你的不是?
7.他們一直打冷戰(zhàn)。
8.那兩個是小王的兄弟。
9.他實在不會說那種話。
10.那個人很像大爺。
這些句子例5中的“東西”里的“西”讀陰平,“東西”表示方位,指東邊和西邊。當(dāng)“西”讀輕聲時,“東西”指的是物品。例6中的“不是”里的“是”讀去聲時,“是”為動詞,“不是”表示否定。當(dāng)“是”讀輕聲時,“不是”表示錯處、過失。例7中的“冷戰(zhàn)”中的“戰(zhàn)”讀去聲時,“冷戰(zhàn)”指他們雙方之間進(jìn)行的無聲較量。當(dāng)“戰(zhàn)”讀輕聲時,表示因寒冷或害怕渾身突然發(fā)抖。例8中的“兄弟”里的“弟”讀去聲時,“兄弟”指的是哥哥和弟弟,當(dāng)“弟”讀輕聲時,指的是弟弟。例9中的“實在”里的“在”讀去聲時,“實在”是形容詞,表示很老實、本分,當(dāng)“在”讀輕聲時,“實在”是副詞,表示的確的意思。例10中的“大爺”,當(dāng)“爺”讀陽平時,“大爺”指的是不好好勞動、傲慢任性的男子,當(dāng)“爺”讀輕聲時,表示是伯父或尊稱年長的男子。
這些詞語在句子里會有兩種讀法,兩種理解,而且單獨就一個句子而言,兩種讀法、兩種理解都成立。我們?nèi)斯ら喿x或說話時,要準(zhǔn)確地理解其中的意思,只有聯(lián)系上下文去理解。那么,這種現(xiàn)象在計算機(jī)信息處理時,就遇到了困難。在一個句子里,讀原調(diào)和輕聲,所表示的意思都成立,這是由于輕聲的緣故構(gòu)成的歧義句。這種現(xiàn)象給人工閱讀帶來了麻煩,需要再聯(lián)系上下文去理解意思,當(dāng)然,計算機(jī)要理解這些句子的意思就更困難了。也正如亢世勇說的“盡管信息處理專家運用了規(guī)則排歧、統(tǒng)計概率排歧或者兩者結(jié)合起來等多種方法進(jìn)行排歧,但到目前為止,還沒有一種方法、一種系統(tǒng)能夠徹底解決這個問題。”
因為,目前,計算機(jī)完成了“字處理”,在“詞處理”和“句處理”的過程中,遇到的問題比較多。例如:詞的切分問題,詞性的標(biāo)記問題,也就是說讓計算機(jī)面對真實文本自動進(jìn)行詞的切分和詞性標(biāo)記。其中詞的切分這一項,是字處理突破后中文信息處理所必須突破的又一個核心問題,是必須要闖過的第二道難關(guān)。從20世紀(jì)80年代以來,計算機(jī)學(xué)界和漢語言學(xué)界聯(lián)手攻克詞的切分這一難關(guān),20多年來,都取得了可喜的成果,研制了一些相應(yīng)的軟件。到目前為止,計算機(jī)自動分詞,正確率可達(dá)到90%到95%,剩下的5——10%的詞的切分問題,難度也比較大。其中就包括歧義句的詞的切分問題,當(dāng)然也包括由于輕聲引起的歧義現(xiàn)象。對于歧義句的理解,我們運用增加、替換詞語,或聯(lián)系上下文理解意思。這又涉及到“句處理”的問題。句處理的主要內(nèi)容是,怎樣使計算機(jī)理解自然語言(現(xiàn)代漢語)的句子的意思,又怎樣使計算機(jī)生成符合自然語言規(guī)則的句子。由此可見,“句處理”所需要的語言知識,將是一種涉及到語音、語義、語法、語用等多方面的綜合性知識。而且,“句處理”要解決的核心問題是排除歧義的問題??茖W(xué)家們正在努力攻克這一難關(guān),爭取早日突破信息處理中的一大瓶頸問題。
參考文獻(xiàn):
[1]徐世榮:《試論北京語音的“聲調(diào)音位”》,《中國語文》,1957.7。
[2]羅常培、王 均:《普通語音學(xué)綱要》,商務(wù)印書館,2002。
[3]厲為民:《試論輕聲和重音》,《中國語文》,1981.1。
[4]林 燾、王理嘉:《語音學(xué)教程》,北京大學(xué)出版社,1992。
[5]林茂燦、顏景助:《普通話輕聲與輕重音》,《語言教學(xué)與研究》,1990.3。
[6]亢世勇:《面向信息處理的現(xiàn)代漢語語法研究》,上海辭書出版社,2004。