LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: ifree

关于UTF8的locale的问题?

[复制链接]
发表于 2006-2-23 11:53:40 | 显示全部楼层
Post by seerhut

unix linux 上有很多单字节的特殊字符,用固定长度的unicode编码会出乱子,UTF-8 这方面很完美

确切的说是为了兼容ascii字符集

Post by seerhut

windows 内部是unicode

似乎是ucs-2
unicode有好几种实现形式
有变长,有定长
定长的有2字节/4字节,大头端/小头端之分
最好指明

ucs-2是定长的,2字节
当这些信息要传递的到用户层的时候就不能在用定长的了
要用gbk或者utf8等等
所以加载vfat分区时可以随意改变iocharset
只要和使用的locale相符,就可以正确的显示字符
回复 支持 反对

使用道具 举报

发表于 2006-2-23 12:28:54 | 显示全部楼层
Post by zhllg
google "normalized locale code"
很多时候locale code都会被normalize,这时UTF-8会变成utf8
所以我一般在环境变量里直接写utf8


偶保守,还是遵守 glibc 的 locale -a 出来的信息,这样心理有保障。嘿嘿。
回复 支持 反对

使用道具 举报

发表于 2006-2-23 13:51:55 | 显示全部楼层
为什么linux下utf8环境作出来的文件到windows下会乱码呢?windows用什么locale的?:ask
回复 支持 反对

使用道具 举报

发表于 2006-2-23 13:55:55 | 显示全部楼层
windows内核使用ucs-2,内核以外视语言版本而定
中国大陆的简体中文版windows使用gb18030
因为这是中国政府的标准,所有在中国大陆境内买的软件产品都要使用gb18030
回复 支持 反对

使用道具 举报

 楼主| 发表于 2006-2-23 18:49:54 | 显示全部楼层
谢谢几位大哥的解答和提供的信息
去看看先
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表