LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: 100100

输入法平台比较: IIIMF 及 SCIM

[复制链接]
发表于 2004-3-1 17:35:44 | 显示全部楼层
呵呵,如果我们都使用utf8了,很容易啊:-)

最初由 apsus 发表
A IM supporting both Chinese and Japanese is very necessary. Many times I have to turn back to win2k/xp to deal with multi-language documents.
发表于 2004-3-1 19:51:36 | 显示全部楼层
很期待全面使用utf8 的一天呢~~
发表于 2004-3-2 17:47:31 | 显示全部楼层
就目前的形势来看,还早~~
发表于 2004-3-2 22:22:09 | 显示全部楼层
能完全实现gb18030就更好了
发表于 2004-3-16 19:18:28 | 显示全部楼层
UTF-8考虑太多关于解码的正确性了,浪费了不少编码空间,导致常用的字都要3个字节来表示,太浪费了!其实本身有错误的文件,解码再正确也是不完全的,为了一点不完全的完美这么浪费不值得。何况现在已经是光纤时代了,哪那么容易出错啊。
应该使用UTF-8-1编码(瞎编的名字),高位为1的字节就是多字节编码字符的一部分,高位为0的字节就是字符编码的结束。这样自动兼容ASCII码,而且出错的地方会错一个字符。如果是二进制文档,不管怎么错都是全盘皆错,如果是文本文档,错一个字也没什么了不起的,UTF-8字符的第一个字节的高位1变成0的话也会出错,也一样检测不出来。
看来UNICODE也不要了,就用这种编码吧,就叫U8码好了。编码解码更简单,又不浪费空间,2个字节就表示3万多个字了,3个字节就能表示800万字(未来所有的字?)了,应该更容易推广!
发表于 2004-3-16 22:09:46 | 显示全部楼层
没这么简单。UTF-8/UCS-4 还是非常不错的。这点空间浪费对现在的存储器来说根本不算什么。

最初由 waq 发表
UTF-8考虑太多关于解码的正确性了,浪费了不少编码空间,导致常用的字都要3个字节来表示,太浪费了!其实本身有错误的文件,解码再正确也是不完全的,为了一点不完全的完美这么浪费不值得。何况现在已经是光纤时代了,哪那么容易出错啊。
应该使用UTF-8-1编码(瞎编的名字),高位为1的字节就是多字节编码字符的一部分,高位为0的字节就是字符编码的结束。这样自动兼容ASCII码,而且出错的地方会错一个字符。如果是二进制文档,不管怎么错都是全盘皆错,如果是文本文档,错一个字也没什么了不起的,UTF-8字符的第一个字节的高位1变成0的话也会出错,也一样检测不出来。
看来UNICODE也不要了,就用这种编码吧,就叫U8码好了。编码解码更简单,又不浪费空间,2个字节就表示3万多个字了,3个字节就能表示800万字(未来所有的字?)了,应该更容易推广!
发表于 2004-3-16 22:37:04 | 显示全部楼层

回复: 输入



唉呀,小日本的iiimf居然可以实现gtk2程序的光标跟随啊
发表于 2004-3-17 21:55:02 | 显示全部楼层

回复: 回复: 输入

最初由 FKtPp 发表
唉呀,小日本的iiimf居然可以实现gtk2程序的光标跟随啊


没什么奇怪的。SCIM 如果用 gtk2 immodule 的话也可以。
发表于 2004-3-17 22:08:20 | 显示全部楼层

回复: 回复: 回复: 输入

最初由 james_su 发表
没什么奇怪的。SCIM 如果用 gtk2 immodule 的话也可以。


看来升级到gtk2的immodule很麻烦咯?
发表于 2004-3-17 22:21:01 | 显示全部楼层

回复: 回复: 回复: 回复: 输入

最初由 FKtPp 发表
看来升级到gtk2的immodule很麻烦咯?


这个不存在升级的问题呀。直接可以用的。看看 SCIM 的用户手册吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表