-p, -t, -k收尾的都是入聲字
例如:bat捌(4調→ 變8調ba̍t)、ba̍t密(8調→ 變4調bat)
-h收尾的都是入聲字
例如:tah貼(4調→ 變2調tá)、ta̍h踏(8調→ 變3調tà),變調後h會消失。
程式不易處理部分
rule 14 ~ rule 21語意的結尾處本調,其他都一律「變調輸出」。或必要時可以手動選項作更改,再重新輸出?
輕聲不在一般1-8調內
但輕聲可以原字的3調或4調替用,聽起來很近似。
例如:āu--ji̍t(後日)→ /āu jit/(āu 原調,ji̍t 8調變輕聲時,語音輸出可以用jit 4調替用 )
例如:sin--ê(新的)→ /sin è/(sin原調,ê 5調變輕聲時,語音輸出可以用è 3調替用 )
例如:khiā--khí-lâi(徛起來)→ /khiā khì lài /(khiā原調,khí 2調lâi 5調變輕聲時,語音輸出時都用3調替用 )
例如:tsáu--tshut-khì走出去 → /tsáu-tshut-khì/(tsáu 原調,tshut 4調khì 3調變輕聲時,語音輸出可以用tshut 4調tshut 3調替用。這個詞套用規則後等於沒變化)
說明:此處為電腦輸出時的「替用」,與真實語音的「輕聲」近似,但嚴格說來稍有不同。也不能算是台語變調的規則,而是專給電腦抓語音資料輸出的方法。即台語變調「輕聲」的部分,我們讓電腦以無論原來是1, 2, 3, 5, 7調都一律改為3調,而4, 8調的入聲字都一律改為4調,這是目前比較簡便的替用輸出方案。
輕聲符之後皆為輕聲,不限一字。
rule 23 高揚調
不在一般1-8調內,但可以原字的5調替用,聽起來pitch低一些但很上揚的感覺近似。
例如:tshe̋nn-tshenn-tshenn 青青青 → /tshênn tshēnn tshenn/(tshe̋nn高揚調,語音輸出時用5調替用)
例如:a̋ng-âng-âng(紅紅紅) → /âng āng âng /(a̋ng高揚調,語音輸出時用5調替用)
說明:同樣的,此處也是為電腦輸出時的「替用」,與真實語音的「高揚調」近似,但音高有差別。真實說話的「高揚調」比5調的頻率更高音一些,即從1調的音高上揚,而5調是比較低的7調上揚。即台語變調「高揚調」的部分,我們讓電腦以改為5調,稍微低音一些,但這是目前比較簡便的用輸出方案。
錄音資料裡並沒有tshe̋nn, a̋ng這種檔案,tshe̋nn, a̋ng只是當文件裡偶然出現時,讓電腦選一個「替用」發音。
beh只對應「欲」一個字
剛好是唯一的讀音。所以電腦可以讓beh → /be/ (beh入聲4調一般變調成/bé/ 2調,但特例變調成/be/ 1調)
khì不只對應「去」一個字
沒有漢字就難以辨識,建議先一般化處理變為2調即可。
仔前變調
仔前面一定有”-“
雙引號括
例如"Gē-su̍t"一般都是專有名詞=詞組,即雙引號等於中間加 "-"。( ) [ ] 「 」 『 』也類似。
語意的結尾處
, ; . ?! 這些符號之前的字(語意結尾處)唸本調。
本站為台語AI分享與筆記,適用程式研發非學術文獻。
作者:台灣國民學校