LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 3236|回复: 9

scim的简繁体过滤器的一些小问题, 与诸位讨论下

[复制链接]
发表于 2006-1-21 16:33:22 | 显示全部楼层 |阅读模式
scim-fcitx的繁体候选字库不如智能拼音的繁体候选字库大。

简繁体汉字并非是一一对应的, 有一个简体字对应多个繁体字的, 一个繁体字对应多个简体字的; 不同的两个或多个简体字, 其繁体是一样的; 不同的两个或多个繁体字, 其简体是一样的。
下面就scim-fcitx来说的:

1, '云'字的繁体有两个,作为‘云朵’的意思时是‘雲’字, 但作为‘言说’的意思时就是现在简体的‘云’字。

2, ‘范’字的繁体有两个, 作为‘模范’的意思时是‘範’字, 但作为姓氏时就是现在简体的‘范’字。

4, ‘干’字有很多意思, 做动词表示‘做’时, 其繁体是‘幹’; 做形容词表示湿度时, 其繁体是‘乾’; 做动词表示‘相关’时, 其繁体就是现在的‘干’字。

5, ‘复’字的繁体有两个, 表示‘又’的意思时, 其繁体是‘復’; 表示‘重复’、‘繁复’的意思时, 其繁体是‘複’字。

6, ‘周’字的繁体有两个, 表示‘一遍’、‘周围’的意思时, 其繁体是‘週’; 表示‘周王朝’和名字时, 其繁体就是现在的‘周’字。

7, ‘丑’字的繁体有两个, 表示‘丑陋’时, 其繁体是‘醜’字; 表示天干-地支纪年法、名字时, 其繁体就是现在的‘丑’字。

8, ‘后’字的繁体有两个, 表示‘前后’时, 其繁体是‘後’字; 表示‘皇后’、‘皇帝’和名字时, 其繁体就是现在的‘后’字。

9, ‘谷’字的繁体有两个, 表示‘稻谷’时, 其繁体是‘榖’字; 表示‘山谷’时, 其繁体就是现在的‘谷’字。 (这个是候选字里有后者而无前者)

10, ‘里’字的繁体有两个, 表示‘里面’时, 其繁体是‘裡’字(或者其异体字‘裏’字); 表示‘乡里’和‘公里’时, 其繁体就是现在的‘里’字。

11, ‘适’字在繁体字中是两个不同的字, 表示‘合适’、‘刚才’的意思时, 其繁体是‘適’字; 表示名字时(念kuo4, 就象‘阔’字的发音一样), 其繁体就是现在的‘适’字。

12, ‘几’字的繁体有两个, 表示数量、程度的时候, 其繁体字是‘幾’字; 表示‘征兆’或者作为‘机器’的‘机’字的假借字时, 其繁体就是现在的‘几’字。

13, ‘岳’字的繁体有两个, 表示‘大山’时, 其繁体是‘嶽’字; 表示姓氏、名字时, 其繁体就是现在的‘岳’字。 (这个也是候选表有后者, 无前者)

14, ‘尸’字的繁体有两个, 表示‘尸体’时, 其繁体是‘屍’字; 表示祭祀时的主持者、‘拥有’、名字的意思时, 其繁体就是现在的‘尸’字。


暂时就能想起来这么多, 这个问题我们是否可以帮助解决下?  至少在遇到这样的字的时候, 候选字里边让它出现多个选择也好。 我也是Linux下的C程序员, 如果有程序开发上的需要也可以帮些忙。 谢谢诸位;-)
发表于 2006-1-21 21:39:23 | 显示全部楼层
这是一个已知问题,解决起来也没那么简单。有兴趣的话可以一起来解决。
现在的关键是缺少一个比较全的简繁词汇对照表。就是你说的这种对照表,不是把 "信息" 对照成 "资讯" 的那种表。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-1-22 20:19:11 | 显示全部楼层
Post by james_su
这是一个已知问题,解决起来也没那么简单。有兴趣的话可以一起来解决。
现在的关键是缺少一个比较全的简繁词汇对照表。就是你说的这种对照表,不是把 "信息" 对照成 "资讯" 的那种表。


這個沒問題。 一方面我可以自己整理, 一方面可以找人文學界的朋友幫忙, 請他們幫助提供:-)

等偶的消息哦;-)
回复 支持 反对

使用道具 举报

发表于 2006-1-22 22:15:32 | 显示全部楼层
好啊,等你的消息。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-1-23 10:37:21 | 显示全部楼层
这是一份通用汉字的非对称简繁体对照表, 其它的偶再想办法搜集。 明天要回家了, 可能要耽搁一段时间, 抱歉:)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-5-10 18:19:24 | 显示全部楼层
这里也有一份很不错的对照表。 其实平时输入繁体字的时候, 往往容易混淆的也就那么多比较常用的, 或许还有其他不对称的, 但很少用到

http://wyx.nbtvu.net.cn/jmm/Sim-Tra%20CN.htm
回复 支持 反对

使用道具 举报

发表于 2006-5-11 08:50:47 | 显示全部楼层
scim的智能拼音如果选繁体的話,词组不能直接打出来,必须一个字一个字的选择,真是费神的事情,有些字的繁体看到能认识,但自己打的話就困难了。
回复 支持 反对

使用道具 举报

发表于 2006-5-12 14:09:30 | 显示全部楼层
to albcamus:
patches are always welcomed ;)
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-5-15 14:53:37 | 显示全部楼层
Post by liuspider
to albcamus:
patches are always welcomed ;)


惭愧。 输入法和字体、locale、字符集这些概念我还在懵懂阶段, 不知道怎么学习, 是个完全陌生的领域, ,
回复 支持 反对

使用道具 举报

发表于 2006-7-4 23:07:23 | 显示全部楼层
http://wyx.nbtvu.net.cn/jmm/Sim-Tra%20CN.htm   这里面的汉繁对照表不是很准确吧,比如说懵懂的懵明明没有简化,为什么成了蒙古的蒙了,谁做的啊,也不查查新华字典啊,照你这样写直接写拼音得了,不是更简化了吗。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表