程式用台語變調規則筆記#4

針對分寫詞組(無連字符號以空一格表示)

不容易辨識(應先視為一整體後變調)

問題:無完整漢字對照資料庫時程式應如何處理?

建議先處理TL標音獨用者(無其他意義而不會混淆)

(rule 14)動詞+補語,或動詞+名詞,二者間無「-」,但是要視為一整體,連續變調。

  • 動詞+補語:tsíng-lí hó(整理好)、pâi tsò-hué(排做伙)
  • 動詞+名詞:sé/sué sann(洗衫)、khuànn tiān-sī(看電視)
    • tsíng-lí (整理)、pâi(排)、sé/sué (洗)、khuànn(看),以上單字(或最後一字)除在句尾外可一律變調。

(rule 15)助動詞「會」、「袂」、「欲」、「有」、「無」+動詞,要視為一整體,連續變調。

  • ē khì(會去)、bē/buē khì(袂去)、beh/bueh lâi(欲來)、ū tsò(有做)、bô tsò(無做)
  • ē(會)、bē/buē(袂)、beh/bueh (欲)、ū(有)、bô(無),以上單字(或最後一字)除在句尾外可一律變調。

(rule 16)形容詞+名詞,要視為一整體,連續變調。

  • ū-tsînn lâng(有錢人)、bô-tsînn lâng(無錢人)
    • lâng(人)字之前的單字(或最後一字)可一律變調。

(rule 17)單音節副詞+形容詞or動詞,要視為一整體,連續變調。

  • tsin hó(真好)、siōng tuā(上大)、lóng ū(攏有)
    • 暫不特別處理

(rule 18)多音節副詞+形容詞or動詞,要視為一整體,連續變調。

  • ū-kàu kín(有夠緊)、koh-khah suí(閣較媠)、m̄-bián khì(毋免去)、teh-beh kàu(咧欲到)、bē-sái kóng(袂使講)、bān-bān-á kiânn(慢慢仔行)
    • ū-kàu(有夠)、koh-khah(閣較)、m̄-bián(毋免)、teh-beh(咧欲)、bē-sái(袂使)、bān-bān-á(慢慢仔),以上單字(或最後一字)除在句尾外可一律變調。

(rule 19)數詞和量詞分寫,但要視為一整體,連續變調。

  • sann ê lâng(三個人)、gōo pún tsheh(五本冊)、la̍k kin(六斤)
    • 暫不特別處理

(rule 20)我的、你的、伊的等所有格,中間沒有連字號,但「我」「你」「伊」須變調。

  • guá ê(我的)、lí ê(你的)、i ê(伊的)
  • ê(的)除在句尾外可一律變調。

(rule 21)所有格「的」+名詞,「的」要變調。

  • guá ê mi̍h-kiānn(我的物件)、i ê miâ(伊的名)
  • ê(的)除在句尾外可一律變調。(實際上同rule 20)

注意!上述若為beh/bueh(欲)、khì(去),二者都是再變調的特例(二者都一律次變為1調)

即:特殊規則(多半出現在喉塞音)變調兩次

(rule 24)喉塞音(-h)4調,規則變調兩次(4→2→1)

  • beh/bueh tha̍k-tsu(欲讀書),beh/bueh(欲)4調原應變2調,但實際變1調
  • beh/bueh(欲)除在句尾外可一律變調(變為1調)。若與其他字組合為常用詞(即有"-"連結)則依一般規定變調決定與否(原調為4調,變調為1調)

(rule 25)khì(去)3調,規則變調兩次(3→2→1)

  • khì guā-kháu(去外口),khì(去)3調原應變2調,但實際變1調
  • khì(去)除在句尾外可一律變調(變為1調)。若與其他字組合為常用詞(即有"-"連結)則依一般規定變調決定與否(原調為3調,變調為1調)

程式用台語變調規則筆記#3

同樣文字,分為三種腔調變調輸出流程

Thài-khong pîng-iú, lín hó! Lín tsia̍h-pá bē? Ū-îng, tō-lâi gún-tsia tsē--ooh.

(太空朋友,恁好!恁食飽未?有閒就來阮遮坐喔。)

https://zh.wikipedia.org/wiki/File:Greetings_to_the_Universe_in_Amoy_(Min_dialect).oga

語音輸出讀音

(建議計算後取消大小寫、符號,以避免混淆導致無限變調)

偏泉腔
thái khong pìng iú lin hó lin tsià pá bē ù îng tò lâi gun tsia tsē ooh

偏泉海口腔
thái khong pìng iú lîn hó lîn tsià pá bē ù îng tò lâi gûn tsia tsē ooh

偏漳腔
thái khong pīng iú lin hó lin tsià pá bē ù îng tò lâi gun tsia tsē ooh

介面圖例(海口腔的計算結果)

本站為台語AI分享與筆記,適用程式研發非學術文獻。

作者:台灣國民學校

程式用台語變調規則筆記#2

程式如何處理這段TL文字,正確變調輸出語音

Gē-su̍t sī bûn-huà tang-tiong khuah-khǹg ê tsi̍t hūn, hâm tsē tsióng tshòng-tsō kang-hu kap ha̍k-būn. “Gē-su̍t” ê ì-sù sī pí bí-su̍t khah khuah, nā bí-su̍t sī ti̍k-pia̍t tsí sī-kak gē-su̍t uî tsú ê pōo-hūn.

TL的正式的書寫方形式與英文很類似。首字大寫、句中有逗號「,」、分號「;」、句尾有句號「.」、問號「?」、驚嘆號「!」,所以一整句是可以初步辨識「語意中斷」。

即:

「hūn,」「 khuah,」(逗號之前)、「pōo-hūn.」「 ha̍k-būn.」(句號之前)以粗體紅字標示者,一定是本調。

  1. 逗號/分號/句號/問號/驚嘆號之前的字(語意結尾處)唸本調:

句首(大寫)第一個字唸變調:
「Gē-su̍t」在句首有大寫字母,「, hâm」「, nā」在逗號後,一定是變調,都以粗體綠字標示。

因此可見逗號(or分號)之前(即語意結尾)必為「本調」,逗號之後(即語意開始)必為「變調」。

-su̍t sī bûn-huà tang-tiong khuah-khǹg ê tsi̍t hūn, hâm tsē tsióng tshòng-tsō kang-hu kap ha̍k-būn. -su̍t” ê ì-sù sī pí bí-su̍t khah khuah, bí-su̍t sī ti̍k-pia̍t tsí sī-kak gē-su̍t uî tsú ê pōo-hūn.

粗體紅字是本調,粗體綠字是變調。

  • 連字符”-”所連接的詞組,最後一字唸本調:

Gē-su̍t、bûn-huà、tang-tiong、khuah-khǹg、tshòng-tsō、kang-hu、ha̍k-bū、ì-sù、bí-su̍t、ti̍k-pia̍t、sī-kak、pōo-hūn這幾個有「-」連接,可以得知是常用詞。常用詞的規則是這些詞的音節在「結尾」處,應為本調。

因此,除了上面的本調音節的以粗體紅字標示之外,還有必須維持本調的音節,再加上這些粗體紅字:`:

su̍tbûnhuà tangtiong khuahkhǹg ê tsi̍t hūn, hâm tsē tsióng tshòngtsō kanghu kap ha̍kbūn. su̍t” ê ì sī pí su̍t khah khuah, su̍tti̍kpia̍t tsí kak su̍t uî tsú ê pōohūn.

粗體紅字是本調,粗體綠字&黑字都是變調。

以上,粗體紅字真實讀音是本調,其他句首粗體綠字與黑字都是變調。若變調正確輸出,我們就可以理解這二句話是說:

「藝術是文化當中闊曠的一份,含濟種創造功夫佮學問。「藝術」的意思是比美術較闊,若美術是特別指視覺藝術為主的部分」

(變本變變本變本變本變變本,變變本變本變本變變本。「變本」變變本變變變本變本,變變本變變變變變本變本變本變變本)

先盡量找到有特徵可定位的字,以便確認本調or變調的必然,其他無法定位辨識的,一律改為輸出雖然一定偶有錯誤,但目前是最簡便的方式。

本站為台語AI分享與筆記,適用程式研發非學術文獻。

作者:台灣國民學校

程式用台語變調規則筆記#1

-p, -t, -k收尾的都是入聲字

例如:bat捌(4調→ 變8調ba̍t)、ba̍t密(8調→ 變4調bat)

-h收尾的都是入聲字

例如:tah貼(4調→ 變2調tá)、ta̍h踏(8調→ 變3調tà),變調後h會消失。

程式不易處理部分

rule 14 ~ rule 21語意的結尾處本調,其他都一律「變調輸出」。或必要時可以手動選項作更改,再重新輸出?

輕聲不在一般1-8調內

但輕聲可以原字的3調或4調替用,聽起來很近似。

例如:āu--ji̍t(後日)→ /āu jit/(āu 原調,ji̍t 8調變輕聲時,語音輸出可以用jit 4調替用 )
例如:sin--ê(新的)→ /sin è/(sin原調,ê 5調變輕聲時,語音輸出可以用è 3調替用 )
例如:khiā--khí-lâi(徛起來)→ /khiā khì lài /(khiā原調,khí 2調lâi 5調變輕聲時,語音輸出時都用3調替用 )
例如:tsáu--tshut-khì走出去 → /tsáu-tshut-khì/(tsáu 原調,tshut 4調khì 3調變輕聲時,語音輸出可以用tshut 4調tshut 3調替用。這個詞套用規則後等於沒變化)

說明:此處為電腦輸出時的「替用」,與真實語音的「輕聲」近似,但嚴格說來稍有不同。也不能算是台語變調的規則,而是專給電腦抓語音資料輸出的方法。即台語變調「輕聲」的部分,我們讓電腦以無論原來是1, 2, 3, 5, 7調都一律改為3調,而4, 8調的入聲字都一律改為4調,這是目前比較簡便的替用輸出方案。

輕聲符之後皆為輕聲,不限一字。

rule 23 高揚調

不在一般1-8調內,但可以原字的5調替用,聽起來pitch低一些但很上揚的感覺近似。

例如:tshe̋nn-tshenn-tshenn 青青青 → /tshênn tshēnn tshenn/(tshe̋nn高揚調,語音輸出時用5調替用)
例如:a̋ng-âng-âng(紅紅紅) → /âng āng âng /(a̋ng高揚調,語音輸出時用5調替用)

說明:同樣的,此處也是為電腦輸出時的「替用」,與真實語音的「高揚調」近似,但音高有差別。真實說話的「高揚調」比5調的頻率更高音一些,即從1調的音高上揚,而5調是比較低的7調上揚。即台語變調「高揚調」的部分,我們讓電腦以改為5調,稍微低音一些,但這是目前比較簡便的用輸出方案。

錄音資料裡並沒有tshe̋nn, a̋ng這種檔案,tshe̋nn, a̋ng只是當文件裡偶然出現時,讓電腦選一個「替用」發音。

beh只對應「欲」一個字

剛好是唯一的讀音。所以電腦可以讓beh → /be/ (beh入聲4調一般變調成/bé/ 2調,但特例變調成/be/ 1調)

khì不只對應「去」一個字

沒有漢字就難以辨識,建議先一般化處理變為2調即可。

仔前變調

仔前面一定有”-“

雙引號括

例如"Gē-su̍t"一般都是專有名詞=詞組,即雙引號等於中間加 "-"。( )  [ ] 「  」 『  』也類似。

語意的結尾處

, ; . ?! 這些符號之前的字(語意結尾處)唸本調。

本站為台語AI分享與筆記,適用程式研發非學術文獻。

作者:台灣國民學校