LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
123
返回列表 发新帖
楼主: 100100

输入法平台比较: IIIMF 及 SCIM

[复制链接]
发表于 2004-3-17 22:27:01 | 显示全部楼层

回复: 回复: 回复: 回复: 回复: 输入

最初由 james_su 发表
这个不存在升级的问题呀。直接可以用的。看看 SCIM 的用户手册吧。


俺还没用过SCIM,惭愧   不知道明华的那个SCIM包裹何时进入Debian官方啊

有在线版本的SCIM手册可以看么? :thank
发表于 2004-3-17 22:42:22 | 显示全部楼层

回复: 回复: 回复: 回复: 回复: 回复: 输入

最初由 FKtPp 发表
俺还没用过SCIM,惭愧   不知道明华的那个SCIM包裹何时进入Debian官方啊

有在线版本的SCIM手册可以看么? :thank


http://www.turbolinux.com.cn/~su ... CN/user-manual.html
发表于 2004-3-20 02:29:13 | 显示全部楼层
IIIMF 倒好像要成为我们国家的国家标准。等一会再去仔细看看那份标准草案。
发表于 2004-3-20 18:57:03 | 显示全部楼层
最初由 ShiyuTang 发表
IIIMF 倒好像要成为我们国家的国家标准。等一会再去仔细看看那份标准草案。


要成为国家标准的是红旗的 rfinput。
发表于 2004-3-20 19:46:54 | 显示全部楼层
最初由 waq 发表
看来UNICODE也不要了,就用这种编码吧,就叫U8码好了。编码解码更简单,又不浪费空间,2个字节就表示3万多个字了,3个字节就能表示800万字(未来所有的字?)了,应该更容易推广!

以上计算有误!使用这种方式,每字节浪费1bit,2字节空间为16384,3字节空间为2097152。
发表于 2004-3-20 20:03:47 | 显示全部楼层
最初由 james_su 发表
没这么简单。UTF-8/UCS-4 还是非常不错的。这点空间浪费对现在的存储器来说根本不算什么。

空间浪费只是其中一个方面,我说的U8方式除了没有UTF-8这么高的可靠性之外,可以代替UTF-8,也可以使用U8/UCS-4甚至U8/UCS-8(假如有的话)。
另一个方面是编码空间问题,UTF-8的空间为
1111110x 111110xx 11110xxx 1110xxxx 110xxxxx 10xxxxxx=2097152
加上0xxxxxxx=128
我应该没算错吧!UCS-4的空间为2power32=4294967296。我如果没理解错的话,UTF-8根本就表示不了USC-4! 而U8没有字节数的限制,5个字节完全覆盖USC-4。
发表于 2004-3-20 20:14:41 | 显示全部楼层
最初由 waq 发表
空间浪费只是其中一个方面,我说的U8方式除了没有UTF-8这么高的可靠性之外,可以代替UTF-8,也可以使用U8/UCS-4甚至U8/UCS-8(假如有的话)。
另一个方面是编码空间问题,UTF-8的空间为
1111110x 111110xx 11110xxx 1110xxxx 110xxxxx 10xxxxxx=2097152
加上0xxxxxxx=128
我应该没算错吧!UCS-4的空间为2power32=4294967296。我如果没理解错的话,UTF-8根本就表示不了USC-4! 而U8没有字节数的限制,5个字节完全覆盖USC-4。


你理解错了,UCS-4 的码位空间是 65536 * 17 = 1114112 和 UTF-8 一致。

UTF-8 的错误恢复能力保证在任何一个字节出错(丢失)的情况下,只会有一个编码出错。

先去查一下相关资料吧。
发表于 2004-3-20 21:43:32 | 显示全部楼层
这回“API草案”里面 XIM 讲了 50 页, IIIMF 讲了 50 页,文档倒是多得一塌糊涂了
su 大侠有什么打算吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表