LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1248|回复: 2

把win下面的码表文件转化为scim的码表文件时候出错。

[复制链接]
发表于 2007-12-19 19:24:38 | 显示全部楼层 |阅读模式
大家好。我在UB7.10下面把win下面的码表文件(超强两笔)用:
scim-make-table cqeb.txt -b -o cqeb.bin
这个命令转化成为scim的码表时候出错。
我在转化前已经把原来的头和尾都去掉了,我的码表格式是这样的:
, ,
. 。
/ 、
; ;
a 安
a, 嫒
a,g 婩
a,gk 婩
a,k 娾
a,kv 娾
a,r 嫒
a,rk 嫒
a,s 媪
a,sg 媪
aabq 傲岸不群
aabx 皑皑白雪
aadb 嗷嗷待哺
aajj 安安静静
aaqq 哀哀切切
aass 矮矮实实
aaww 安安稳稳
aaxx 安安心心
ab 艾
abbd 按兵不动
abbs 哀兵必胜
abdc 安步当车
abdg 安邦定国
abh 蔜
abhb 艾蒿
abhq 蔜
abjb 按部就班
abji 艾卷
abjt 艾灸
abk 菴
abkg 菴
abmj 艾美奖
abo 荌
abo, 荌
abp 蔼
abps 蔼

现在有两个问题:
1.我的码表在windows下面显示完全正常的。但是在UB7.10 linux下面却有些字显示不出来。估计是内部编码不同的原因,但是不知道怎么解决。
2.在使用上面那个转换的命令之前是不是要对码表文件做些处理或者需要什么配置之类的。
发表于 2007-12-19 19:37:38 | 显示全部楼层
先用
  1. iconv -f ucs2 -t utf8 cqeb.txt -o cqeb-utf8.txt
复制代码
转成utf8编码的,你就能看到了。

另外你还需要给字、词条添加词频,scim中最大的频率的65535.
scim的码表是有格式的,你可以参看其五笔的码表,可以用scim-make-tables把bin转成txt源码,然后看看其格式。

最好写个脚本利用正则表达式来做。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-12-20 09:48:33 | 显示全部楼层
好的。谢谢。我先试试。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表