LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: epico

novel-pinyin 基于自然语言处理的拼音输入法

[复制链接]
 楼主| 发表于 2007-10-15 15:45:33 | 显示全部楼层
Post by findsun
Sunpinyin是还有待完善,但并不是说没做完,呵呵。
P.S., Sunpinyin向SCIM平台的移植已经基本完成了,非常感谢Kov Chai,参见http://src.opensolaris.org/sourc ... n/ime/wrapper/scim/
欢迎交换意见,共同促进输入法开发。呵呵,苏哲老师走后,我在公司就一个人,欢迎交流意见。我对sunpinyin也很感兴趣。他应该是第一个用自然语言模型的开源输入法。
回复 支持 反对

使用道具 举报

发表于 2007-10-15 20:00:20 | 显示全部楼层
Post by epico
Url:http://sourceforge.net/projects/novel-pinyin
这是我正在制作的一个输入法。
目前,计划支持:
模糊拼音,不完全拼音,双拼支持。

此输入法是基于scim-pinyin的。请大家提一些需求和建议。
先谢谢大家了。

嘿,我就是 findsun 说的 Kov Chai。我也曾有改进 scim-pinyin 的想法,但是由于各种原因,一直没有实际的成果出来。
我想,对于输入法来说,算法很关键,但是词库也很重要。希望 novel-pinyin 能重视一下语料库的收集和处理(平滑,聚类之类的)。
回复 支持 反对

使用道具 举报

发表于 2007-10-15 22:11:21 | 显示全部楼层
Post by epico
我也觉得使用完整双拼的比较好,如果配合上基于n-gram的智能匹配,估计输入速度会更快。

你比较一下FITX的智能双拼和SCIM-PINYIN的双拼,看看谁快
回复 支持 反对

使用道具 举报

发表于 2007-10-15 23:00:37 | 显示全部楼层
chaisave, wow, 原来你老兄是斑竹啊,失敬失敬
回复 支持 反对

使用道具 举报

发表于 2007-10-15 23:04:33 | 显示全部楼层
Post by epico
欢迎交换意见,共同促进输入法开发。呵呵,苏哲老师走后,我在公司就一个人,欢迎交流意见。我对sunpinyin也很感兴趣。他应该是第一个用自然语言模型的开源输入法。


嗯,相互间的确应该多交流,不知道你有blog没有,想去订阅一下。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-10-16 10:02:02 | 显示全部楼层
Post by findsun
嗯,相互间的确应该多交流,不知道你有blog没有,想去订阅一下。
有,Blog上的东西不多
http://alex-epico.blogspot.com/
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-10-16 10:16:05 | 显示全部楼层
Post by chaisave
嘿,我就是 findsun 说的 Kov Chai。我也曾有改进 scim-pinyin 的想法,但是由于各种原因,一直没有实际的成果出来。
我想,对于输入法来说,算法很关键,但是词库也很重要。希望 novel-pinyin 能重视一下语料库的收集和处理(平滑,聚类之类的)。
chaisave敬仰敬仰,非常佩服您在这么快的时间内port sunpinyin到scim平台。欢迎提出各种建议。
语料库的平滑算法已经有一个参考实现,是在实验原型中实现的,backoff和interpolation都有,效果还不错。
目前关心的是算法性能的问题。在语料库的处理上,前期打算用最简单的cut-off prune比sunpinyin现在用的要简单一些,在后期可能会使用基于distribution的算法。
我的词库已经出来了,欢迎提出修改意见,请见http://novel-pinyin.cvs.sourcefo ... pinyin/data/origin/.
是基于cedict制作出来的,没有版权问题。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-10-16 10:21:14 | 显示全部楼层
在现在的实现中使用了一种和原型中不同的算法,不知道对性能的影响如何。原型中的数据占的空间太大了。
回复 支持 反对

使用道具 举报

发表于 2007-10-16 11:15:26 | 显示全部楼层
Post by epico
在现在的实现中使用了一种和原型中不同的算法,不知道对性能的影响如何。原型中的数据占的空间太大了。

不知到是否将你使用的算法介绍一二。另外,我有一个冒昧的建议,我们各自的力量都比较薄弱,是否可以考虑合兵一处?;)
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-10-16 11:36:29 | 显示全部楼层
Post by findsun
不知到是否将你使用的算法介绍一二。另外,我有一个冒昧的建议,我们各自的力量都比较薄弱,是否可以考虑合兵一处?;)
是个好想法,同意。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表