|
在linux下使用fcitx,在windows下使用sogou。
发现即使是以词库著称的sogou输入法,也有一些非常常用的日常词汇没有收入词库,使用初期还是需要一些训练。fcitx相对来说要稍差一些,很奇怪的是相当一部分常用词汇在词库里有,但是打出来时被排在后边,而排前几位的是一些明显不靠普的词,感觉fcitx的词频处理还大有提高空间:)
言归正传。我想一些简单常见、但是被词库忽略的词汇,被大量用户在本地训练并加入本地词库。如果能支持用户词汇上传,那么这些“边边角角”的常见词汇就会很快充实到服务器词库中。再被其它用户下载,或随下一版软件发布,我想能很好的提高用户的使用舒适感。
当然用户词汇上传也存在一些问题。一是自动上传的用户隐私问题,在开源软件里,这个有很多种方法可以解决,例如使用手动上传。另一个问题是防止恶意干扰问题,可能存在恶意上传非法言论,或恶意上传版权词库的问题,这个需要好好考虑看如何能解决。
开源的开放词库如果能形成规范标准,将会在整体上提高开源中文输入法的词库水平。如果能有助于改进词频信息就更好了。不知道大家以为如何?是否有人感兴趣? |
|