潮州话 广韵韵部 音值统计

如题,分属于不同韵部的字对于其中任意一个韵部都会被重复计数。

The 2nd file is revised.

[ 本帖最後由 Bodhisatua 於 2008-12-4 23:33 編輯 ]

潮州话 广韵韵部 音值统计.zip (62.33 KB)(右键另存为,手动重命名)

潮州话 广韵韵部 音值统计.zip (63.4 KB)(右键另存为,手动重命名)

不好意思,有bug...

回復 #2 Bodhisatua 的帖子

所以我偏向于人工校核,虽然工作量很大、个人功底也不足,但我当重新学习一遍潮州音,顺便也发掘一些不同的地方...
有bug是因为人会出错,因为人会出错,所以人工输入、检校也可能出错,所以需要程序帮忙检校。

回復 #4 Bodhisatua 的帖子

程序做不到一定对应哪一个反切,判别不了是否误读,找寻不了不相同之处。
没有程序或许不能,但程序绝不是万能... 可惜就是感兴趣而且有毅力的人太少... 其实我也做不到...
《广韵》啊,我现在在看,不大懂……郁闷……
,   
,   
,   
  

真剣にやると、知恵が出る。

Ĉiu rajtas lerni la gepatran lingvon,kaj la internacian lingvon.

namah samanta buddhanam vajra me

微博  http://weibo.com/bambooheng

回復 #5 lee 的帖子

其实程序只是实施,核心是对于规则的提取并基于此所提出的算法,越高精度的规则的归纳和提取赋予程序越高的能力。at least程序在很短的时间内对mogher上万字中存在的不少很低级明显的错误进行了排除。人需要focus的是规则以外的事情。程序嘛,显然不是唯一依赖的东西,但是是高效的辅助工具,可以把人从大量重复的工作中解放出来思考有用的东西嘛

实际上对规则的研究和提取本身就是对潮州话研究的过程。
ps. 统计表中字数<3的行中的字我觉得有这几种可能:
1. 真的是此韵中很少出现的白读
2. 来自其他韵的多属韵的字的干扰
3. 这些字注音有错。这给提高字表的质量提供了一个方向。