LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1295|回复: 4

重新生成拼音库的问题,请教

[复制链接]
发表于 2009-4-22 16:45:09 | 显示全部楼层 |阅读模式
我现在把SCIM PINYIN移植到手机上,打字时的速度还挺好,可是初始化的时候加载拼音库的时间太长了,最开始是30+秒,后来对代码做了一些优化,现在还要18秒,于是必须对拼音库做精减了。拼音引擎里面的global类中有函数可以根据精精减后的phrase_lib来生成pinyin_phrase_lib和pinyin_phrase_index。可是有一个大问题,就是一个汉字语句中当有多音字的时候(比如会:hui kuai发音)就会自动生成多条pinyin_phrase,这样就大大的增加了库的容量。但如果要手动的去一条条的精减由于多音字而产生的多余的pinyin_phrase,工作量可想而知,怎么办呢?
发表于 2009-4-22 19:13:12 | 显示全部楼层
全键盘手机?
触摸屏手机?
普通的小键盘手机?
如果是最后一种,偶对您的移植很有兴趣(纯个人兴趣,非专业),能开源否?

精简的问题您不妨直接联系 scim-pinyin 作者。
另,不妨看看这里 http://www.limodev.cn/blog/?s=scim&x=0&y=0

关于启动速度,一个猜测,如果您的硬件空间允许,不妨直接放到 flash 中试试。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-4-23 14:22:11 | 显示全部楼层
是全键盘的LINUX手机

系统会在第一次使用输入法的时候初始化,之后再次使用就不用了

谢谢你
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-4-30 13:00:45 | 显示全部楼层
最近研究了段时间,终于解决了所有的问题:
首先减少词库,将原来的16W多条,去掉长度大于4,小于2,频率小于10的语句后,大概还乘下7W多条,这样大大节省了时间。
其次装载库的时候分步装载,第一时间只装载pinyin_table,当装载pinyin_table完成后,便可以输入单个字的拼音了,然后启动一个线程来装载词库,当词库装载完成之后,此时拼音进入语句模式,即可完全正常使用。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-4-30 13:06:11 | 显示全部楼层
这里人气真少
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表