LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: james_su

SCIM 0.4.1 & SCIM-Chinese 0.2.1 发布。

[复制链接]
发表于 2003-5-24 22:25:54 | 显示全部楼层
我用的是0.4的,用win下的码表转换器把系统里的郑码码表转出来,前天凌晨花了4个小时,写了一个程序,把字频信息从SCIM的wubi.txt里提取出来,加上,现在搞定了,很爽!多多少少和win下的有点区别,不过没大问题。
utf8的话,可以用ultraedit转,最后还要注意把格式转成unix的。

顺便问一句:这里有人用郑码吗?
发表于 2003-5-24 22:38:54 | 显示全部楼层
最初由 sofoot 发表
我用的是0.4的,用win下的码表转换器把系统里的郑码码表转出来,前天凌晨花了4个小时,写了一个程序,把字频信息从SCIM的wubi.txt里提取出来,加上,现在搞定了,很爽!多多少少和win下的有点区别,不过没大问题。
utf8的话,可以用ultraedit转,最后还要注意把格式转成unix的。

顺便问一句:这里有人用郑码吗?

兄弟大侠,前辈高人。能把你的方法写得详细点吗?
我总觉得的是我转换时有问题,因为win下的码表是同时包含gb2312和gbk的词汇。大侠求求你了,:p :p :p
发表于 2003-5-24 22:40:45 | 显示全部楼层
再问一下苏大侠,码表里第三列的词频信息必须要有吗?都写成0行不行?我为了从已有的wubi.txt里提取这个信息,费了很的大劲。
 楼主| 发表于 2003-5-24 23:17:06 | 显示全部楼层
没必要有。

最初由 sofoot 发表
再问一下苏大侠,码表里第三列的词频信息必须要有吗?都写成0行不行?我为了从已有的wubi.txt里提取这个信息,费了很的大劲。
发表于 2003-5-24 23:49:22 | 显示全部楼层
最初由 dato 发表
兄弟大侠,前辈高人。能把你的方法写得详细点吗?
我总觉得的是我转换时有问题,因为win下的码表是同时包含gb2312和gbk的词汇。大侠求求你了,:p :p :p


本来是打算过两天再写的,这两天实在是太忙,既然有人需要这个,就赶出来吧。

工作主要在win下完成,因为我不会C,只会pascal。
用到的软件:
1、SCIM-0.4;
2、windows的码表转换器;
3、UltraEdit
4、Delphi 7。
第一项显然是必须的。如果你打算从win自带的码表转,那么第二项也是必须的。第三个是我推荐的,可以完成文件编码格式部分的全部转化。第四个纯粹个人爱好。

step1:从SCIM中得到wubi.txt,主要是参考格式,其它的码表也可以,因为我用的郑码和五笔同样是形码,而且最长4码,有比较多的相似,所以我选用这个。
step2:用windows的码表转换器把winzm.mb转成winzm.txt。我用的是2K的转换器,2K里的郑码码表。大概有4万多字词吧。
step3:转出来的文件格式是UNICODE格式的,用UltraEdit打开,1、转成ASCII(Delphi也应该支持UNICODE,但我没有试);2、把文件头去掉;3、用"^p"(回车)替换所有的空格,因为win的码表是每行一个字或者是一个词,而SCIM的是每行一个编码。5、存盘。
step4:用UltraEdit把wubi.txt转成ASCII。
step5:写程序把winzm.txt里的码表转成SCIM格式,并从wubi.txt里提取出相应字词的频率信息,加到第三列。
step6:用UltraEdit把上一步的winzm.txt(或者别的名字,我新建了一个文件zhengma.txt)加上正确的文件头,转成UTF8,以及unix格式,存盘。
step7:用SCIM的工具生成二进制码表,放到相应的位置。
step8:注销,可以了!!

上面的过程很粗糙,如果有问题,就再说。
发表于 2003-5-24 23:51:24 | 显示全部楼层
最初由 james_su 发表
没必要有。

那就太FT了,我为了实现这个写了好久
发表于 2003-5-25 00:46:51 | 显示全部楼层
最初由 dato 发表
兄弟大侠,前辈高人。能把你的方法写得详细点吗?
我总觉得的是我转换时有问题,因为win下的码表是同时包含gb2312和gbk的词汇。大侠求求你了,:p :p :p


有问题发信
sofoot@163.com
我不能保证每天都来这里
发表于 2003-5-25 00:52:09 | 显示全部楼层
最初由 james_su 发表
没必要有。


如果是这样,我想我可以写一个程序,完成从windows码表到SCIM码表的转换。当然,win的码表要那种码表转换器转出来的纯文本文件,而且我现在写也只能是在win下,linux下还不知道怎么写。
这个东西对于苏兄也应该不难吧。就是换一下格式而已。
发表于 2003-5-25 00:55:30 | 显示全部楼层
ftp://linuxsir:linuxsir@218.5.64.133/Upload/scim/winbx.zip
谢谢老大你还在,我跑到win来了
码表已经上传,我不会编程帮我搞定好吗,谢谢
如果可以给份程序copy,我的信箱dato@wz163.com
谢谢老大一直在线
发表于 2003-5-25 02:59:32 | 显示全部楼层
Oh,
i am using Debian unstable,
i compile Scim & Table myself,
then install the Pinyin RPM use alien.
but when i start xsim, there are no Pinyin.
( make install -> /usr/local/share/scim,
  RPM install -> /usr/shar/scim,
  how can i fix this problem? )

。。。呵呵,搞定了。
find 来 find 去,找了很久,把东西 copy 到一块儿就好了。
不过发现光标跟随还是不太好阿。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表