程式用台語變調規則筆記#1

-p, -t, -k收尾的都是入聲字

例如:bat捌(4調→ 變8調ba̍t)、ba̍t密(8調→ 變4調bat)

-h收尾的都是入聲字

例如:tah貼(4調→ 變2調tá)、ta̍h踏(8調→ 變3調tà),變調後h會消失。

程式不易處理部分

rule 14 ~ rule 21語意的結尾處本調,其他都一律「變調輸出」。或必要時可以手動選項作更改,再重新輸出?

輕聲不在一般1-8調內

但輕聲可以原字的3調或4調替用,聽起來很近似。

例如:āu--ji̍t(後日)→ /āu jit/(āu 原調,ji̍t 8調變輕聲時,語音輸出可以用jit 4調替用 )
例如:sin--ê(新的)→ /sin è/(sin原調,ê 5調變輕聲時,語音輸出可以用è 3調替用 )
例如:khiā--khí-lâi(徛起來)→ /khiā khì lài /(khiā原調,khí 2調lâi 5調變輕聲時,語音輸出時都用3調替用 )
例如:tsáu--tshut-khì走出去 → /tsáu-tshut-khì/(tsáu 原調,tshut 4調khì 3調變輕聲時,語音輸出可以用tshut 4調tshut 3調替用。這個詞套用規則後等於沒變化)

說明:此處為電腦輸出時的「替用」,與真實語音的「輕聲」近似,但嚴格說來稍有不同。也不能算是台語變調的規則,而是專給電腦抓語音資料輸出的方法。即台語變調「輕聲」的部分,我們讓電腦以無論原來是1, 2, 3, 5, 7調都一律改為3調,而4, 8調的入聲字都一律改為4調,這是目前比較簡便的替用輸出方案。

輕聲符之後皆為輕聲,不限一字。

rule 23 高揚調

不在一般1-8調內,但可以原字的5調替用,聽起來pitch低一些但很上揚的感覺近似。

例如:tshe̋nn-tshenn-tshenn 青青青 → /tshênn tshēnn tshenn/(tshe̋nn高揚調,語音輸出時用5調替用)
例如:a̋ng-âng-âng(紅紅紅) → /âng āng âng /(a̋ng高揚調,語音輸出時用5調替用)

說明:同樣的,此處也是為電腦輸出時的「替用」,與真實語音的「高揚調」近似,但音高有差別。真實說話的「高揚調」比5調的頻率更高音一些,即從1調的音高上揚,而5調是比較低的7調上揚。即台語變調「高揚調」的部分,我們讓電腦以改為5調,稍微低音一些,但這是目前比較簡便的用輸出方案。

錄音資料裡並沒有tshe̋nn, a̋ng這種檔案,tshe̋nn, a̋ng只是當文件裡偶然出現時,讓電腦選一個「替用」發音。

beh只對應「欲」一個字

剛好是唯一的讀音。所以電腦可以讓beh → /be/ (beh入聲4調一般變調成/bé/ 2調,但特例變調成/be/ 1調)

khì不只對應「去」一個字

沒有漢字就難以辨識,建議先一般化處理變為2調即可。

仔前變調

仔前面一定有”-“

雙引號括

例如"Gē-su̍t"一般都是專有名詞=詞組,即雙引號等於中間加 "-"。( )  [ ] 「  」 『  』也類似。

語意的結尾處

, ; . ?! 這些符號之前的字(語意結尾處)唸本調。

本站為台語AI分享與筆記,適用程式研發非學術文獻。

作者:台灣國民學校

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *