LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: grounds

有没有给fcitx用的大词汇五笔98码表

[复制链接]
 楼主| 发表于 2003-5-10 13:54:06 | 显示全部楼层
原来的码表格式:(先把开头的无用信息删除)
工a aaaa
式aa aayi
工aaa aaaa
恭恭敬敬aaaa

tcitx码表格式:
a 工
aa 式
aaa 工
aaaa 恭恭敬敬

先用 dos2unix.pl 转成unix文本格式
usage: perl dos2unix.pl <old98.txt >wb98.txt

#!/usr/bin/perl -w
while(<>){
s/\r\n$/\n/;
print;
}

再用 wb.pl 转成fcitx格式
usage: perl wb.pl <wb98.txt

#!/usr/bin/perl -w
open(FH,">wbx.mb")||die('open fail');
while($str=<>){
    $str=~s/ .*//;                #erase extra data after space
    $str=~s/([a-z]{1,4}$)//;      #extract encodings
    $tmp=$1;
    chop($str);                          #erase \n
    if(length($str)%2){           #if true indicate wrong whwn extract encodings
        $str.=substr($tmp,0,1);   #fix the wrong problem
        $tmp=~s/[a-z]//;
    }
    print FH "$tmp $str\n";       #write to new file
}
发表于 2003-5-10 17:37:28 | 显示全部楼层
谢谢
发表于 2003-5-20 16:52:50 | 显示全部楼层
因为版权的问题,所以不能直接放到FCITX的官方站上。目前只能临时放在论坛上,以附件的形式下载。

多谢grounds兄

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
发表于 2003-5-20 21:46:56 | 显示全部楼层
谢谢
 楼主| 发表于 2003-5-22 15:04:05 | 显示全部楼层
最初由 北南南北 发表
因为版权的问题,所以不能直接放到FCITX的官方站上。目前只能临时放在论坛上,以附件的形式下载。

多谢grounds兄

好像没有版权问题的,海峰五笔是一个open source & free 软体
他的主页上说了码表可以自由使用,至少非商业目的使用是可以的
发表于 2003-9-4 16:29:31 | 显示全部楼层
谁能把它转换成红旗4.0下的码表文件。
发表于 2006-6-13 23:52:30 | 显示全部楼层
Post by grounds
版上给的那个才250K,词汇太少了
86版的有700多K呢


我把海峰五笔(WIN下的开放源代码输入法,很多人都用过吧?)的98词库转过来了,是GBK的字库,词还比较多,就是重码也比较多了。我用perl转的,花了我一天时间啊,关键是刚学perl,呵呵。。
没有仔细核对,先凑合着用吧,解开了改成wbx.mb放在~/.gWuBi/下面就行了,请斑竹把附件放在合适的地方




我的词库应该符合你的要求,折合成文件的话大约1M左右:)
另外,凭良心来讲,海峰的词库太大了,重码多还不算什么。。。关键是毒词废词太多,连他熟人的名字什么的都在里面。。。很烦人的-_-# 我的词库中就没我的名字,甚至没有我的偶像的名字??如果有的话肯定是维特根斯坦而不会是刘德华:P不知道这算不算作优点-_-#
不过里面的词很经久耐用,特别适合在其基础上扩充自已的常用词汇。。。而且绝对无版权
已经发到LINUXSIR上了,详情看这个帖子
http://www.linuxsir.cn/bbs/showthread.php?t=261114
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表