LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 703|回复: 6

请教:一系列关于locale的问题

[复制链接]
发表于 2008-7-24 13:59:42 | 显示全部楼层 |阅读模式
1、windows下保存的文本文档在linux下用zh_CN.utf8可以正常查看,但是换成en_US.utf8中文就乱码,两者不都是utf8吗?怎么会一个看到一个看不到?

2、有些windows下的文档的内容可以看到,但是文件名却乱码,是两者的编码不同吗?比如文件名用gbk编码,内容用utf8

3、很多网页都会指明其编码格式,因此能在不同语言平台上正常显示,文本文档有没有这种指明自己所以编码格式的机制?

4、arch有没有一个变量可以指定多个locale,这样要看不同编码的文件就可以自动改变charmap,不用手动换来换去。具我所知以前redhat好像有个LANGUAGE变量有这个作用

5、是否utf系列和gb系列不兼容,要靠codepage互相转换?
发表于 2008-7-24 14:10:05 | 显示全部楼层
1.你用什么查看器,可能有自动编码检测,windows保存的应该是gbk而不是utf8
2.3.那得看是什么文档...
4./etc/locale.gen吧,但是不可能同时用多个,一般来说用zh_CN.UTF-8就可以了,必要的时候用iconv转换文件的编码
5.对
回复 支持 反对

使用道具 举报

发表于 2008-7-24 14:10:31 | 显示全部楼层
1.zh_CN的locale下,程序会自动检测"简体中文"的编码,en_US不行,它不知道该检测什么。。。ms是这样。
2.没遇到过这种情况。
3.有
4.不知道
5.据我所知是
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-24 14:29:57 | 显示全部楼层
感谢回答

2、我怀疑windows下的文档的内容用utf编码,文件名却用gbk

5、既然unicode包罗万象,直接全世界用unicode统一好了,为何又拖泥带水用个codepage?是历史包袱吗?
回复 支持 反对

使用道具 举报

发表于 2008-7-24 14:47:39 | 显示全部楼层
2.windows下的txt内容也是gbk的
5.转换是需要时间的...
回复 支持 反对

使用道具 举报

发表于 2008-7-24 15:59:03 | 显示全部楼层
1, windows 下拿啥保存的?linux 下又是拿啥打开的?一般情况下中文 windows 都是 gbk。gedit 似乎能自动检测 gbk(不确定,忘记了)。
2, 文件名是 gbk 的。文件名转码用 convmv。
3, 没有。windows 记事本存 utf-16 的文本倒是有可能在头两个字节指定一下大小序,不过这编码在 linux 下没市场,linux 下 utf-8 已经一统江湖了。猜文本文件的编码用 enca。
4, locale 不是用来改着玩的。一般情况下遇到编码不同的情况都是转码而不是换 locale。转文本内容用 iconv,转文件名用 convmv,转 mp3 id 用 mid3iconv。
5, http://www.bloggern.com/2945.html
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-7-25 12:17:17 | 显示全部楼层
基本了解。非常感谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表