|
发表于 2003-5-25 00:23:33
|
显示全部楼层
我想大家所说的“输入法”不完全是一个概念,有人指的是“输入平台”,有人说的是“输入方案”,这里面是有区别的。我对这个问题的想法基本和苏大侠一致,就是建立一个统一的输入平台,至于具体什么输入方案,就只是码表的问题,完全可以利用现有的。苏大侠的工作也主要是建立了一个输入平台,没有公开源码的部分只是一个模块。我作为用户,不关心这个,只要不收钱就行了,呵呵。以下是我早些天写的一点东西,是介绍windows下龙文输入平台的,里面有我对这些问题的一些观点,还有一些我对一个好的输入平台的期望,主要是从用户的角度。供各位参考。
如果版主觉得太长了,而且有点跑题的话,就删了吧。
我不是专职录入人员,打汉字差不多就是聊天的时候用。现在用的是郑码,在这之前主要用微软拼音。自认为普通话还不错,学形码是因为懒得选字,但又不能忍受白字满天飞。至于说为什么要学郑码,而不是五笔或是别的什么,我也觉的奇怪。反正我现在用的是郑码,不是别的。
郑码不比五笔,知道的人本来就不多,相应的资源和选择的余地根本不是一个量级,基本上只有Windows系统里的那个能用,可那个用起来实在不爽。在我看来,一种输入法软件,或者说是一种"输入平台"至少应该具备下面这几点。一是好的词频调整算法。在Windows的郑码里打"jaja",始终是"口号"在前,"呵呵"在后,实在是令人恼火。这么说吧,除了写这篇短文和偶尔打错之外,还没有什么场合需要我输入"口号"。二是中英文切换要方便,这一点我比较习惯微软拼音的切换方式。三是要能输入GBK字符,最好还能直接输入BIG5什么的,不然怎么泡海峡那边的MM?至于说要不要自动加词的功能,那要看算法怎么样,如果算法不好,老是搞出来一堆莫名其妙的东西,就不如不要,特别是形码。音码的话,如果有这功能,输入人名地名的时候还是很不错的。但手动加词还是要的,这一点我觉的Windows系统里的郑码(可能标准的Windows输入法都是一样的)的操作还行,比较方便,而且能保证不会加入一个不想要的词进去。批量加词的功能也应该有,方便专业人士。最好是配一个词频统计的程序和一个自动编码的程序,先对大量的专业文献,比如论文,做词频统计,选出高频词,再自动编码,加到系统里去。
在五笔几乎成为事实上的标准的情况下,出现了大量的"XX五笔"之类的东西。除了我提到的那几条都有之外,另外还有点别的很有意思的功能。但是很遗憾,我不会五笔,直到前天,我都只能用Windows系统里的那个比较差的郑码。那天,在偶MM上线之前,在网上闲逛。在华军看到一个自称可以挂接其它输入法的东东,"中文输入通",大概以前叫"龙文五笔"吧。下来一看,自己的帮助里写的很好,只要有Windows码表源文件就行了。这个不难,用"输入法生成器"转一下.MB文件就行了。
可是在Windows 2000下面没找到输入法生成器。应该是装了的,但在附件组里没有。又在网上用Google搜了半天,才在d:\winnt\system32\dllcache\目录下才到"imegen.exe"。winzm.mb转成winzm.txt了之后,还是增加不上去,说是"没有TEXT字段"。这我就不懂了。帮助里说是和Windows的码表文件的格式是一样的,而且我根本没有改动输入法生成器生成的.txt文件,[TEXT]就在哪儿,怎么会找不到?我就把"中文输入通"给删了。
又去找别的"声称"可以外挂别的输入法的软件。又找了两个,一个根本装不上,作者的主页也不能访问。另一个到是可以外挂,但不知道怎么回事,词组很多不能用,像"我们"这样词的都没有,这怎么用?
我就想,这中文输入通应该不会有这么大的Bug吧,这作者连这都测试不出来?不能,应该不能。又装上,再看帮助。呵呵,在"输入法设置"一节的最下面有一句话,说不能是UNICODE格式的,要转换一下。我用UltraEdit打开winzm.txt一看,果然是UNICODE格式的,那就转吧(File -> Conversions -> "Unicode->ASCII")。再试,搞定。
确实不错,我说的那几条都有。"呵呵"总算拿第一了。中英文切换也有多种选择,可以设成我习惯的右Shift方式,但在输入中文时,如果按下Caps Lock键的话,状态条上没有相应的显示,略有不便。可以直接输入简、繁还有Big5。界面风格,也有多种选择。自动加词的功能不是很好,手动加词很方便,但由于郑码编码方式的原因,加词的时候自动生成的编码和标准的郑码编码不同,比如"郑码"。批量加词的功能也很强,但我还没有用到。软键盘方案和系统里的郑码,全拼什么的一样(会不会是系统自定的?)。主键盘可以挂三个不同的输入法,而且可以并存,比如选拼音/郑码,就会根据输入的内容,判断是什么拼音还是郑码,不过我觉的这样不是很实用,增加了重码,也不伦不类。有临时切换到拼音的功能就够了,不会拆的字,切换到拼音,输入的同时,还能把郑码的编码反查出来。反查拼音功能相比Windows系统的郑码,有长处有不足,长处是可以查出多音字的多个读音,不足是部分GBK中的生辟字的音查不出来,比如"筽",但Windows系统的郑码可以(筽,o)。还有一些功能,时间短,还没来及仔细看,可能也用不上了,我能想到的已经都有了。
总的说来很不错,值的一试,觉的好就找作者注册吧。 |
|