LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 628|回复: 0

如何利用PHP来截取一段中文字符串而不出现乱码

[复制链接]
发表于 2003-11-25 14:29:13 | 显示全部楼层 |阅读模式
标题:如何利用PHP来截取一段中文字符串而不出现乱码

作者:吴伟(327wu@263.net)

[PHP]
/*
功能:截取全角和半角混合的字符串以避免乱码
参数:
        $str_cut        需要截断的字符串
        $length                允许字符串显示的最大长度

*/

function substr_cut($str_cut,$length = 30){

        if (strlen($str_cut) > $length){
                for($i=0; $i < $length; $i++)
                        if (ord($str_cut[$i]) > 128)        $i++;
                $str_cut = substr($str_cut,0,$i) . "...";
        }
        return $str_cut;
}

[/PHP]
说明:
        程序的关键语句是:
[PHP]
        for($i=0; $i < $length; $i++)
                if (ord($str_cut[$i]) > 128)        $i++;
       
        $str_cut = substr($str_cut,0,$i) . "...";

[/PHP]
        如果字符的ASCII码大于128,说明当前字符和下一个字符是属于一个汉字的。
        则,$i++ 跳过对下一个字符的判断。
        再结合循环中的 $i++ ,实际上,当遇到一个汉字时,$i 就会加 2 ,从而正确的跳过汉字。
        最终实现的效果是,$i 变量指向的要么是半角的字符,要么是全角汉字的首字符,不会指向
        全角汉字的第二个字符,所以,当$i >= $length时,循环结束,使用
        [PHP] $str_cut = substr($str_cut,0,$i) . "..."; [/PHP]截取字符时自然也就不会出现乱码了。


本人在写一个程序时需要利用PHP从一段字符串中截取指定长度的一段字符下来。以前在写ASP的时候,参考动网的程序写过类似的程序,不过,还没用PHP写过。

想偷懒,看有不有现成的代码可以用。于是,在GOOGLE中输入:PHP 截断字符 后查找到一段代码。

全文:http://www.yesky.com/SoftChannel ... 510/1610570_3.shtml

引用:
#########################################################################
  如何分别全角和半角以避免乱码?

  我们可以写这样一个函数来实现:

[PHP]

function ChgTitle($title)
{
$length = 46; //我们允许字符串显示的最大长度
if (strlen($title)>$length) {
$temp = 0;
for($i=0; $i<$length; $i++)
if (ord($title[$i]) > 128) $temp++;
if ($temp%2 == 0)
$title = substr($title,0,$length)."...";
else
$title = substr($title,0,$length+1)."...";
}
return $title;
}  

[/PHP]

  这个函数原理就是截断一个字符,看看其ascII码是不是大于128,如果是,说明截断的是一个全角汉字,那么就退后一个截断。用$length控制长度

  备注:循环判断字符串里面的 >128 的字符个数,如果半角字符为偶数,则表示位置刚好为整个汉字,如果为奇数,则为半个汉字,需要取下一个字符

#######################################################################

消化、测试这段代码后发现有问题。经过反复调试,查找出,这段代码基于的原理不正确。
它认为,汉字的两个字节其ASCII码都会大于128,其实不然,一个汉字的首个字节的ASCII码
必定是大于128的,但是第二个字节的ASCII码不一定大于128,例如:"祐",其两个字节的ASCII
码分别为:181 和 118。

经过仔细分析,最终,我利用上面的函数实现了对全角和半角字符串的截取。

一点点体会,写出来也是想和大家一起交流、学习。我不知道是不是有人已经写过上面的函数,不过,
我还没能读到,也就只能自己琢磨了,呵呵。

欢迎有兴趣的朋友来信交流。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表