LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: james_su

大家讨论输入法能不能不要只是停留在肤浅的使用上面?

[复制链接]
 楼主| 发表于 2003-2-7 09:06:05 | 显示全部楼层
为什么大家总要抓着SCIM-Chinese开不开源的问题不放呢?

SCIM 本身是开源的,大家可以参考它的源码呀。

当然如果只想使用的话,我想你对 SCIM-Chinese 的源码也不会感兴趣的。
发表于 2003-2-7 12:41:44 | 显示全部楼层
第一次到这里来,看到这么多高人,实在容幸
我现在就为工业领域用linux的中文输入法头疼,虽然现在选择的xsim已经非常不错了(我现在输入就用它),但我试过的输入法都不支持在多显示器的服务器上动态显示输入框,而且,更重要的一点,在远程windows客户端无法输入中文,如果james_su能够把scim做好,做到这些,我想作为商业使用,是可以考虑购买的。
不知道大家的想法中有没有这样的打算,或者说,不知道james_su和Yuking等有没有这方面的计划(从james_su的帖子中,好像看到有这个计划,能详细说说吗?)
 楼主| 发表于 2003-2-7 15:25:00 | 显示全部楼层
SCIM 在设计初期就考虑到了网络环境的输入法问题。在下一个版本中将会加入网络模块,到时,SCIM 就可以实现你所说的功能了。
发表于 2003-2-8 00:33:40 | 显示全部楼层
最初由 james_su 发布

当然如果只想使用的话,我想你对 SCIM-Chinese 的源码也不会感兴趣的。

如果只想使用的话,我不会关心是否开源的

我在这说这些,是因为我想为 中文输入法 的发展作些贡献,别无他意。如果出言冒犯,望海涵
发表于 2003-2-8 01:16:11 | 显示全部楼层
虽然是废话,还是要对各位表示我最崇高的敬意!
希望有一天我也能为Linux源码世界添砖加瓦!
发表于 2003-3-16 23:08:07 | 显示全部楼层
大家可以学学二笔,真的很好学,真正要记的字根只有10个,速度也很快。
发表于 2003-3-17 11:22:42 | 显示全部楼层
要记的字根:
金木水土草,日月人口手
没了。
发表于 2003-4-10 21:53:20 | 显示全部楼层
是否能考虑手写识别呢?我想应该有一些研究生的课题和ocr或者手写识别有关,能不能在这条路上探索一下。
发表于 2003-4-12 21:59:38 | 显示全部楼层
真的好难学啊
发表于 2003-5-25 00:23:33 | 显示全部楼层
我想大家所说的“输入法”不完全是一个概念,有人指的是“输入平台”,有人说的是“输入方案”,这里面是有区别的。我对这个问题的想法基本和苏大侠一致,就是建立一个统一的输入平台,至于具体什么输入方案,就只是码表的问题,完全可以利用现有的。苏大侠的工作也主要是建立了一个输入平台,没有公开源码的部分只是一个模块。我作为用户,不关心这个,只要不收钱就行了,呵呵。以下是我早些天写的一点东西,是介绍windows下龙文输入平台的,里面有我对这些问题的一些观点,还有一些我对一个好的输入平台的期望,主要是从用户的角度。供各位参考。
如果版主觉得太长了,而且有点跑题的话,就删了吧。


    我不是专职录入人员,打汉字差不多就是聊天的时候用。现在用的是郑码,在这之前主要用微软拼音。自认为普通话还不错,学形码是因为懒得选字,但又不能忍受白字满天飞。至于说为什么要学郑码,而不是五笔或是别的什么,我也觉的奇怪。反正我现在用的是郑码,不是别的。
    郑码不比五笔,知道的人本来就不多,相应的资源和选择的余地根本不是一个量级,基本上只有Windows系统里的那个能用,可那个用起来实在不爽。在我看来,一种输入法软件,或者说是一种"输入平台"至少应该具备下面这几点。一是好的词频调整算法。在Windows的郑码里打"jaja",始终是"口号"在前,"呵呵"在后,实在是令人恼火。这么说吧,除了写这篇短文和偶尔打错之外,还没有什么场合需要我输入"口号"。二是中英文切换要方便,这一点我比较习惯微软拼音的切换方式。三是要能输入GBK字符,最好还能直接输入BIG5什么的,不然怎么泡海峡那边的MM?至于说要不要自动加词的功能,那要看算法怎么样,如果算法不好,老是搞出来一堆莫名其妙的东西,就不如不要,特别是形码。音码的话,如果有这功能,输入人名地名的时候还是很不错的。但手动加词还是要的,这一点我觉的Windows系统里的郑码(可能标准的Windows输入法都是一样的)的操作还行,比较方便,而且能保证不会加入一个不想要的词进去。批量加词的功能也应该有,方便专业人士。最好是配一个词频统计的程序和一个自动编码的程序,先对大量的专业文献,比如论文,做词频统计,选出高频词,再自动编码,加到系统里去。
    在五笔几乎成为事实上的标准的情况下,出现了大量的"XX五笔"之类的东西。除了我提到的那几条都有之外,另外还有点别的很有意思的功能。但是很遗憾,我不会五笔,直到前天,我都只能用Windows系统里的那个比较差的郑码。那天,在偶MM上线之前,在网上闲逛。在华军看到一个自称可以挂接其它输入法的东东,"中文输入通",大概以前叫"龙文五笔"吧。下来一看,自己的帮助里写的很好,只要有Windows码表源文件就行了。这个不难,用"输入法生成器"转一下.MB文件就行了。
    可是在Windows 2000下面没找到输入法生成器。应该是装了的,但在附件组里没有。又在网上用Google搜了半天,才在d:\winnt\system32\dllcache\目录下才到"imegen.exe"。winzm.mb转成winzm.txt了之后,还是增加不上去,说是"没有TEXT字段"。这我就不懂了。帮助里说是和Windows的码表文件的格式是一样的,而且我根本没有改动输入法生成器生成的.txt文件,[TEXT]就在哪儿,怎么会找不到?我就把"中文输入通"给删了。
    又去找别的"声称"可以外挂别的输入法的软件。又找了两个,一个根本装不上,作者的主页也不能访问。另一个到是可以外挂,但不知道怎么回事,词组很多不能用,像"我们"这样词的都没有,这怎么用?
我就想,这中文输入通应该不会有这么大的Bug吧,这作者连这都测试不出来?不能,应该不能。又装上,再看帮助。呵呵,在"输入法设置"一节的最下面有一句话,说不能是UNICODE格式的,要转换一下。我用UltraEdit打开winzm.txt一看,果然是UNICODE格式的,那就转吧(File -> Conversions -> "Unicode->ASCII")。再试,搞定。
    确实不错,我说的那几条都有。"呵呵"总算拿第一了。中英文切换也有多种选择,可以设成我习惯的右Shift方式,但在输入中文时,如果按下Caps Lock键的话,状态条上没有相应的显示,略有不便。可以直接输入简、繁还有Big5。界面风格,也有多种选择。自动加词的功能不是很好,手动加词很方便,但由于郑码编码方式的原因,加词的时候自动生成的编码和标准的郑码编码不同,比如"郑码"。批量加词的功能也很强,但我还没有用到。软键盘方案和系统里的郑码,全拼什么的一样(会不会是系统自定的?)。主键盘可以挂三个不同的输入法,而且可以并存,比如选拼音/郑码,就会根据输入的内容,判断是什么拼音还是郑码,不过我觉的这样不是很实用,增加了重码,也不伦不类。有临时切换到拼音的功能就够了,不会拆的字,切换到拼音,输入的同时,还能把郑码的编码反查出来。反查拼音功能相比Windows系统的郑码,有长处有不足,长处是可以查出多音字的多个读音,不足是部分GBK中的生辟字的音查不出来,比如"筽",但Windows系统的郑码可以(筽,o)。还有一些功能,时间短,还没来及仔细看,可能也用不上了,我能想到的已经都有了。
    总的说来很不错,值的一试,觉的好就找作者注册吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表