LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 2079|回复: 27

能否发扬linux精神,告别“打字”,只须“打句”!

[复制链接]
发表于 2004-6-18 22:07:45 | 显示全部楼层 |阅读模式
我现在每天打字用的都是fcitx,它不止取代了其他输入法(黑马神拼、智能狂拼等等),而且很大程度上,是它,使我放弃了原来用的操作系统。有了fcitx,我在linux里也能找到感觉,而且是更棒的感觉。

但是,无庸讳言,fcitx还有一些不如人意之处。我认为,最大的问题是,它给出的字符串常常不是“合法”的,例如,我想打“生命诚可贵”,它出来的是“生命乘客鬼”,得不停选择,才能成为“生命诚可贵”。如果直接出来正确的字符串,那是多么美妙的事情啊。

要想出来的就是正确的(不见得唯一,但是合乎语法),其实并不太困难。我在选择、完成了“生命诚可贵”之后,“生命诚可贵”就成为可以直接打出来的了。所以我想,如果,我们所有使用fcitx的人,都共用一个句典,每个人都不停地向那个句典输入正确的句子,那么,用不了多久,fcitx就会被更新得更加顺畅。

我不懂程序。我想,尊敬的fcitx开发者、维护者,可不可以考虑将fcitx句典放在网页置顶位置(永远置顶,时时更新)?要让那句典是开放的,具有综合每个人的句典的能力,谁想要放进,随时吸收;谁想要更新,随时索取。

另外,如果有人,想要为fcitx作点贡献,还应该有其他的办法。例如,fcitx的开发者、维护者,不妨设计出来让机器自己“学习”的功能。现在,网上的报刊很多,那里面有大量鲜活的现成的句子,fcitx爱好者完全可以开动自己的计算机,不断更新句典。然后,汇入总句典。

事实上,不能给出完全合法的句子,这是现在所有拼音类输入法的通病。所以,fcitx不妨走在革新的前列,充分发扬linux精神,打造出一部超级句典。句典造成,会极大提高输入的准确性。

这种关于句典的想象,是有语言学支持的。汉语有数百个音节,这造成了,汉语有大量的同音字;但是,同音词,就相对少多了;而同音句,不可能没有,但是,相对来说,那是极少的。这告诉我们,我们就不必要“打字”,而只要“打句”!事实也是如此,我们说话也好,作文也好,都是一句一句进行的,句子没有完成的字和词,没有确定的意义!
发表于 2004-6-18 22:20:40 | 显示全部楼层
感觉分析的字数与时间/空间是指数关系
每长一个字,就要求你的内存更大,cpu 更快
狂拼最早就因为词库巨大而让人骂的
 楼主| 发表于 2004-6-18 22:24:41 | 显示全部楼层
长远看,内存、cpu不是问题吧?
发表于 2004-6-18 22:26:34 | 显示全部楼层
scim 中的做法似乎是一个句子输入了几次以后就作为固定的句式,因为输入几次的东西就不大可能出错了。如果用网络的方式来补充词库,怎么限定只能输入正确的内容就比较难。难道能有什么验证的办法吗?比如分别提交自己的词库,然后查找同时在多个人词库中存在的句子作为固定句式,这种程序怎么写?好像也是指数级吧
发表于 2004-6-18 22:33:12 | 显示全部楼层
但是我的pentium233怎么办
发表于 2004-6-18 22:35:49 | 显示全部楼层
scim-chinese is already sentence oriented, not word oriented
发表于 2004-6-18 23:19:58 | 显示全部楼层
wineinput好象还可以的说
发表于 2004-6-19 01:19:08 | 显示全部楼层
楼主说的其实已经超过了一个输入法的范畴,而是对汉语结构进行分析的问题了。如果一味的扩大字词库来改进所谓的智能性,必然会像智能狂拼一样数百M的大文件。况且,现在scim-chinese已经是一个很好的折衷方案了。

“生命诚可贵”你可以自造词。
 楼主| 发表于 2004-6-19 23:35:06 | 显示全部楼层
被汉语的句子数量给吓住
可能的汉语句子是多的
现实的汉语句子是少的

智能狂拼2大约90多m
在我的古董级的机子上能够顺畅运行
我的机子cpu是350,内存128(以前64也能用)

每个使用fcitx的人,当然能够自己“造句”,fcitx有这个功能
但是每个人都造的句子,注定了大多数甚至绝大多数是重复的
如果句子不重复,人们就无法进行语言交流,交流的前提是存在大量共用句子
这是不是一种可以避免的人力资源浪费

句典造成,语言学家的主要工作就是,判定一个句子是否合法
不合法,驱逐出句典;合法,保留在句典里面
这解放多少人

可能不单纯是打拼音输入的,就是语音输入问题,扫描录入问题,也可一劳永逸地予以解决了
其他打字根的输入,也可借鉴

这符合linux精神吧
诸位,请拿出你们的linux精神
发表于 2004-6-19 23:39:52 | 显示全部楼层
为什么不试一试 scim 的智能拼音?可以做到接近微软拼音的水平。

要想提高智能性,一味靠大的词库(句子库)是不行的。必须有语言模型的支持。这个就复杂多了。

最初由 岳伍 发表
被汉语的句子数量给吓住
可能的汉语句子是多的
现实的汉语句子是少的

智能狂拼2大约90多m
在我的古董级的机子上能够顺畅运行
我的机子cpu是350,内存128(以前64也能用)

每个使用fcitx的人,当然能够自己“造句”,fcitx有这个功能
但是每个人都造的句子,注定了大多数甚至绝大多数是重复的
如果句子不重复,人们就无法进行语言交流,交流的前提是存在大量共用句子
这是不是一种可以避免的人力资源浪费

句典造成,语言学家的主要工作就是,判定一个句子是否合法
不合法,驱逐出句典;合法,保留在句典里面
这解放多少人

可能不单纯是打拼音输入的,就是语音输入问题,扫描录入问题,也可一劳永逸地予以解决了
其他打字根的输入,也可借鉴

这符合linux精神吧
诸位,请拿出你们的linux精神
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表