|
发表于 2003-6-22 19:25:34
|
显示全部楼层
最初由 james_su 发表
嗯,我对这个挺感兴趣。你这个软件主要做什么工作呢?能够自动从语料库中生成词库么?
这个软件不是输入法,也不是输入法平台。它只是一个输入法技术评估和测试平台。在早期,大约在20天前,它的设计目的是有效的管理词库。现在,它的功能扩展到拼音输入法的技术的评估方面,当前它只是一个控制台程序。呵呵,当然了最终我会写一些XIM代码,让它在KDE下实现输入。因为我现在只能使用QT/KDE开发X程序。
我写这个程序的最初目的是因为我要在FreeBSD上写CSDN上的一个专栏。在Windows下写FreeBSD的专栏太困难了,因为我没有安装虚拟运行环境。我希望通过我的努力,FCITX能够迅速赶上来,让我在FreeBSD下能够顺畅的输入汉字。
我不太清楚“语料库中生成词库”的具体含义。我的理解是自动生成词库吧?
在这个程序(总说这个程序太麻烦了,这个程序的名字叫diy)的早期有一个小模块,我叫它Next-ONE。它主要是在统计文档中分析某个汉字或词的下一个汉字或词的频率。我的逻辑是用的多了,就是词。它的运行速度非常慢,分析1.9G的内容需要30分钟。但它统计出了非常多的正规的或不正规的词组。但是最终,我放弃了它。因为,多音字妨碍了我确定某个词组中的某个汉字的具体拼音。 |
|