LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 12749|回复: 34

海峰五笔98版v9.0的for debian scim的码表(附:转换步骤及程序)

[复制链接]
发表于 2005-11-14 23:49:37 | 显示全部楼层 |阅读模式

最新的9.0版的码表。
转换思路与步骤:
1. IMEGEN
    用它可以逆转换安装目录下的SunWb_98.MB为文本文件SunWb_98.txt。
2. GBEXTSUP
    用它可以把得到的unicode格式的文本转换为gb18030格式。
3. 这两个软件如何获得:以上第一个工具可以从windows安装盘中找到,第二个工具微软的网站上有。
4. 写一小段程序,把DOS格式的回车换行变为UNIX格式的换行。即 0d0a -> 0a 也。
5. 再写一段程序,把文字在前、编码在后改为编码在前、文字在后,而且每条编码单独起一行。设此文件名为wb98-0.txt。
6. 转换为UTF-8格式:iconv --from=gb18030 --to-code=utf-8 wb98-0.txt --output=wb98.txt。iconv是debian下的一个字符集转换工具。
6. 找到SCIM放码表的地方:/usr/share/scim/talbes/,假设原来的86版的码表文件为wb86.bin,执行scim-make-table wb86.bin -o wb86.txt,得到逆转换后的五笔86版的码表。
7. 打开wb86.txt,复制文件头、尾并覆盖wb98.txt中相应部分;修改UUID,建议增一即可,以示与86版不同。(输入法名称及所用图片亦可修改。)
8. 执行:scim-make-table wubi98.txt -b -o /usr/share/scim/tables/wb98.bin,重启x-window,完成! :cool:
 楼主| 发表于 2005-11-14 23:59:36 | 显示全部楼层

文件的第一部分

文件的第一部分

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-11-15 00:00:29 | 显示全部楼层

文件的第二部分

文件的第二部分

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-11-15 00:01:19 | 显示全部楼层

文件的第三部分

文件的第三部分

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2005-11-15 08:27:11 | 显示全部楼层
谢谢了。
回复 支持 反对

使用道具 举报

发表于 2005-11-15 10:34:36 | 显示全部楼层
Post by lsg-debian

最新的9.0版的码表。
转换思路与步骤:
1. IMEGEN
    用它可以逆转换安装目录下的SunWb_98.MB为文本文件SunWb_98.txt。
2. GBEXTSUP
    用它可以把得到的unicode格式的文本转换为gb18030格式。
3. 这两个软件如何获得:以上第一个工具可以从windows安装盘中找到,第二个工具微软的网站上有。
4. 写一小段程序,把DOS格式的回车换行变为UNIX格式的换行。即 0d0a -> 0a 也。
5. 再写一段程序,把文字在前、编码在后改为编码在前、文字在后,而且每条编码单独起一行。设此文件名为wb98-0.txt。
6. 转换为UTF-8格式:iconv --from=gb18030 --to-code=utf-8 wb98-0.txt --output=wb98.txt。iconv是debian下的一个字符集转换工具。
6. 找到SCIM放码表的地方:/usr/share/scim/talbes/,假设原来的86版的码表文件为wb86.bin,执行scim-make-table wb86.bin -o wb86.txt,得到逆转换后的五笔86版的码表。
7. 打开wb86.txt,复制文件头、尾并覆盖wb98.txt中相应部分。
8. 执行:scim-make-table wubi98.txt -b -o /usr/share/scim/tables/wb98.bin,完成! :cool:


"5. 再写一段程序,把文字在前、编码在后改为编码在前、文字在后,而且每条编码单独起一行。"程序在哪?
回复 支持 反对

使用道具 举报

发表于 2005-11-15 11:53:19 | 显示全部楼层
很好
原来我用白日极点五笔白码表
不过感觉海峰白码表更丰富些
现在用你转换过的海峰98五笔码表了
回复 支持 反对

使用道具 举报

发表于 2005-11-15 12:04:22 | 显示全部楼层
码表有问题
一按逗号(,)
fcitx立马崩溃-_-#
-----
问题解决
是我自己的问题
表头没做好
多了些,./字符(照抄fcitx主页上的文档-_-#)
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-11-15 21:49:21 | 显示全部楼层

忘了附上程序了,抱歉!

    

这是两个perl程序,具体用法如下:
perl dos2unix.pl < wb98gb18030.txt >tmp
perl trans2scim.pl < tmp
在trans2scim.pl中可以修改要输出的文件名,默认为wb98.txt

当然也可以用自己熟悉的语言写一段程序进行转换,我就用过C,但较麻烦。还用过一个是AWK或GAWK,处理表格非常方便。

祝大家好运!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2005-11-17 14:25:38 | 显示全部楼层
Post by lsg-debian

7. 打开wb86.txt,复制文件头、尾并覆盖wb98.txt中相应部分。

这样做会使得五笔 86 和五笔 98 同用一个 UUID 标识,我看不妥。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表