這樣說我了解了。問題分好幾個部分。

第一:
"hun" 理論上只會顯示出讀音為 "hun1" 的漢字。現在"hun"會顯示那個多個漢字,是「詞庫的問題」。例如現在打"hun"會出現"份", 這是不對的。在未來的版本不會出現"份"。
因為當初弄詞庫的時候,hun2,3,5,7的字,常不小心混入 hun1了,所以會有這個問題,目前在單字方面,有努力在校對。

第二:
如果打"hun",然後正確的只顯示了"hun1"的漢字,但是你要選的字還是在第二或第三頁,怎麼辦?輸入法有自動調整的功能,也就是說,如果你常常打"熏",過一陣子,這個詞的順位就會提昇,你就可以在第一頁就看到這個字。
多謝回答.
另外, 收字的問題, 我也想講下我的看法. 輸入法能不能加入福建通行或學界求證出的字?  我發現 m̄ 的選項下只有唔, 沒有呣, 從音韻的角度, 呣比唔要好, 但卻拍不出來. chhân 只有訓讀'田', 沒有'塍', kàu也只有訓讀字'到', 沒有'遘', boē只有音讀'袂', 沒有'勿會',  塍, 遘和'勿會'在閩語學界還是用得很普遍.
最愛還是閩東語(Eastern Ming Language)..., 欲罷不能.

 平上去入
上1234
下5678

回復 #12 Nguang 的帖子

Nguang 兄,

以下這樣回答(這是比較個人的想法):

大家知道漢字要怎樣用,常常無法有個定論。我個人不是本字派,覺得實際上,大家能夠訂出「規範用字」比找本字重要。目前詞庫在實作上,主要參考的是教育部的「台灣閩南語網路辭典」。這辭典如果是「替用漢字」,會標明。因為種種因素,有的時候就算是知道本字,還是可能使用替用字。(以上主要指雙音節以上詞)。

在上面的大原則下,會有下列情形。
「本字」或學界用字 unicode 還沒有收,如'勿會', 這類的字目前是直接不用。因為我還不想去煩惱這些字的 unicode 問題。

如 chhân -->'田', '塍', 這類問題,我將來會這樣做。在詞的部份,將依然使用「田」。
tshân-hn̂g->田園, tshân-tsng->田庄。但是在「單字」的部份,我會加入本字/其他通用字。如「塍」

但是我對閩語漢字沒有太大的專研,需要大家提供該增加那些「單字」。

有點離題,不過這些困難也是為什麼我總覺得該在漢字上面再用ruby方式並列羅馬字。
我講錯了,我要講的是

mai3->勿愛(這個好像沒收)

我會把
雖然(勿愛)在unicode中沒有, 但是在台灣宋體和台灣楷體中都有收.
我之所以提出勿會, 是因為我拍 boe 的時候, 得到一個字
最愛還是閩東語(Eastern Ming Language)..., 欲罷不能.

 平上去入
上1234
下5678

回復 #16 Nguang 的帖子

台灣宋體和台灣楷體針對UNICODE沒有收的字有特別去造字,然後應該是放在private use area的區段。(也就是使用別的字型就無法正確顯示)。如果要考慮這些外字的外碼,我還得想想怎樣比較有系統性。
其實那個區段裡面的字, 常用的關鍵漢字只有幾個, 既然字庫做出來給台灣的諸母語使用, 我覺得輸入法還是要考慮下裡面的字. 另外中國學術界通用而輸入法(或台灣閩南語常用辭典)沒有取用的常用本字或俗字也不是很多, 林大哥如果有空, 不曉得能否整理下這些字.
最愛還是閩東語(Eastern Ming Language)..., 欲罷不能.

 平上去入
上1234
下5678
我想就請大家把「應該有但還沒有的常用/重要漢字」在這裡整理一下。最好能標出 unicode 的碼位。
目前猶無:
鹭水芗南-闽南语部落(http://hokkienese.com/)  ·
甘願做牛,毋驚無犁通拖