LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: wpyh

为fcitx开发词库,征网友的帮助:)

[复制链接]
发表于 2006-8-8 09:35:29 | 显示全部楼层
现在fcitx用的就是拼音佳佳词库
回复 支持 反对

使用道具 举报

发表于 2006-8-12 16:21:26 | 显示全部楼层
现在fcitx用的就是拼音佳佳词库
现在词库是拼音加加的? 我怎么觉得这么难用呢? 好多常用词都不在前面..
回复 支持 反对

使用道具 举报

发表于 2006-8-12 16:48:12 | 显示全部楼层
呵呵,这个问题我以前也想过呢,输入法要有一个好的词库还是很重要的,另外就是现在好像也还没有中文的语法拼写检查的软件,这些都应该有一个好的词库的吧

我以前的想法是,想googlebar的在线翻译一样,在线提交的,看能不能修改一下输入法,做一个带提交数据的版本出来,比如每次输入一个词的时候(提交给应用程序的时候,这个是应该输入法程序判断的吧)就自动提交到数据库里面,已经提交过的就不再提交了,这样大家在平时打字的时候就帮助完成了造词的工作(分布式?),不过问题是,如果用户重新装了系统的话,就又会重复提交这些数据了,另外就是大家肯定会重复提交很多那些常用的词汇,另外就是可能大家会觉得泄漏了隐私。还有一个问题就是平时大家输入的时候可能错别字也不少。

不知道我这个想法是不是有什么其他的问题,其实开发相关的工具做出来了,这个东西就好完成了。剩下的没有什么技术含量的工作还比较好做。
回复 支持 反对

使用道具 举报

发表于 2006-8-13 01:25:43 | 显示全部楼层
Post by rushrush
现在词库是拼音加加的? 我怎么觉得这么难用呢? 好多常用词都不在前面..

是拼音佳佳4.0的词库,具体的字序还真不清楚……
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-11-9 07:35:46 | 显示全部楼层
帖子怎么聊成这样了,呵呵

其实我不是没有做点东西,我只是懒得收集而已(直接利用我打过的词,呵呵)。因为我发现,网上的很多词库都不是开放的,而是非商业应用的,所以我不能用。

今天下载3.4.1,顺便上传我的词库:)

注:本词库是PUBLIC DOMAIN。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2006-11-9 08:48:03 | 显示全部楼层
fcitx是应该有在自己的词库,自从用了拼音佳佳的词库,选词特别不舒服,主要是常用的词组都被挤到了后面。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-11-9 15:48:26 | 显示全部楼层
FangQ: suzhe那有消息了吗?

Yuking: 以前fcitx的词库是怎么保证顺序的呢?是不是用不同的格式?
回复 支持 反对

使用道具 举报

发表于 2006-11-9 21:22:24 | 显示全部楼层
格式没变,过去也有同样的问题啊
不过现在应该好一些了吧
回复 支持 反对

使用道具 举报

发表于 2006-11-17 21:09:25 | 显示全部楼层
要是Fcitx能像拼音加加那样方便地添加词库就好了,现在加加论坛上掀起了一股词库热潮,有很多不错的词库出现,和作者们联系联系,应该有很多好的东西可以取得,Fcitx也可以考虑和Ahman商量一下,把他的首选词引入进来,这样词频真的就会好很多的。
回复 支持 反对

使用道具 举报

发表于 2006-11-20 18:55:02 | 显示全部楼层
用程序去统计比较好,人工做这种活太枯燥了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表