能否发扬linux精神，告别“打字”，只须“打句”！

岳伍 · 发表于 2004-6-18 22:07:45

我现在每天打字用的都是fcitx，它不止取代了其他输入法(黑马神拼、智能狂拼等等)，而且很大程度上，是它，使我放弃了原来用的操作系统。有了fcitx，我在linux里也能找到感觉，而且是更棒的感觉。

但是，无庸讳言，fcitx还有一些不如人意之处。我认为，最大的问题是，它给出的字符串常常不是“合法”的，例如，我想打“生命诚可贵”，它出来的是“生命乘客鬼”，得不停选择，才能成为“生命诚可贵”。如果直接出来正确的字符串，那是多么美妙的事情啊。

要想出来的就是正确的(不见得唯一，但是合乎语法)，其实并不太困难。我在选择、完成了“生命诚可贵”之后，“生命诚可贵”就成为可以直接打出来的了。所以我想，如果，我们所有使用fcitx的人，都共用一个句典，每个人都不停地向那个句典输入正确的句子，那么，用不了多久，fcitx就会被更新得更加顺畅。

我不懂程序。我想，尊敬的fcitx开发者、维护者，可不可以考虑将fcitx句典放在网页置顶位置(永远置顶，时时更新)？要让那句典是开放的，具有综合每个人的句典的能力，谁想要放进，随时吸收；谁想要更新，随时索取。

另外，如果有人，想要为fcitx作点贡献，还应该有其他的办法。例如，fcitx的开发者、维护者，不妨设计出来让机器自己“学习”的功能。现在，网上的报刊很多，那里面有大量鲜活的现成的句子，fcitx爱好者完全可以开动自己的计算机，不断更新句典。然后，汇入总句典。

事实上，不能给出完全合法的句子，这是现在所有拼音类输入法的通病。所以，fcitx不妨走在革新的前列，充分发扬linux精神，打造出一部超级句典。句典造成，会极大提高输入的准确性。

这种关于句典的想象，是有语言学支持的。汉语有数百个音节，这造成了，汉语有大量的同音字；但是，同音词，就相对少多了；而同音句，不可能没有，但是，相对来说，那是极少的。这告诉我们，我们就不必要“打字”，而只要“打句”！事实也是如此，我们说话也好，作文也好，都是一句一句进行的，句子没有完成的字和词，没有确定的意义！

bbbush · 发表于 2004-6-18 22:20:40

感觉分析的字数与时间/空间是指数关系
每长一个字，就要求你的内存更大，cpu 更快
狂拼最早就因为词库巨大而让人骂的

岳伍 · 发表于 2004-6-18 22:24:41

长远看，内存、cpu不是问题吧？

bbbush · 发表于 2004-6-18 22:26:34

scim 中的做法似乎是一个句子输入了几次以后就作为固定的句式，因为输入几次的东西就不大可能出错了。如果用网络的方式来补充词库，怎么限定只能输入正确的内容就比较难。难道能有什么验证的办法吗？比如分别提交自己的词库，然后查找同时在多个人词库中存在的句子作为固定句式，这种程序怎么写？好像也是指数级吧

minus273 · 发表于 2004-6-18 22:33:12

但是我的pentium233怎么办

liuspider · 发表于 2004-6-18 22:35:49

scim-chinese is already sentence oriented, not word oriented

AlexChao · 发表于 2004-6-18 23:19:58

wineinput好象还可以的说

fundawang · 发表于 2004-6-19 01:19:08

楼主说的其实已经超过了一个输入法的范畴，而是对汉语结构进行分析的问题了。如果一味的扩大字词库来改进所谓的智能性，必然会像智能狂拼一样数百M的大文件。况且，现在scim-chinese已经是一个很好的折衷方案了。

“生命诚可贵”你可以自造词。

岳伍 · 发表于 2004-6-19 23:35:06

被汉语的句子数量给吓住
可能的汉语句子是多的
现实的汉语句子是少的

智能狂拼2大约90多m
在我的古董级的机子上能够顺畅运行
我的机子cpu是350,内存128(以前64也能用)

每个使用fcitx的人，当然能够自己“造句”，fcitx有这个功能
但是每个人都造的句子，注定了大多数甚至绝大多数是重复的
如果句子不重复，人们就无法进行语言交流，交流的前提是存在大量共用句子
这是不是一种可以避免的人力资源浪费

句典造成，语言学家的主要工作就是，判定一个句子是否合法
不合法，驱逐出句典；合法，保留在句典里面
这解放多少人

可能不单纯是打拼音输入的，就是语音输入问题，扫描录入问题，也可一劳永逸地予以解决了
其他打字根的输入，也可借鉴

这符合linux精神吧
诸位，请拿出你们的linux精神

james_su · 发表于 2004-6-19 23:39:52

为什么不试一试 scim 的智能拼音？可以做到接近微软拼音的水平。

要想提高智能性，一味靠大的词库（句子库）是不行的。必须有语言模型的支持。这个就复杂多了。

最初由岳伍发表
被汉语的句子数量给吓住
可能的汉语句子是多的
现实的汉语句子是少的

智能狂拼2大约90多m
在我的古董级的机子上能够顺畅运行
我的机子cpu是350,内存128(以前64也能用)

每个使用fcitx的人，当然能够自己“造句”，fcitx有这个功能
但是每个人都造的句子，注定了大多数甚至绝大多数是重复的
如果句子不重复，人们就无法进行语言交流，交流的前提是存在大量共用句子
这是不是一种可以避免的人力资源浪费

句典造成，语言学家的主要工作就是，判定一个句子是否合法
不合法，驱逐出句典；合法，保留在句典里面
这解放多少人

可能不单纯是打拼音输入的，就是语音输入问题，扫描录入问题，也可一劳永逸地予以解决了
其他打字根的输入，也可借鉴

这符合linux精神吧
诸位，请拿出你们的linux精神

		自动登录	找回密码
密码			注册

能否发扬linux精神，告别“打字”，只须“打句”！

浏览过的版块