发布网友 发布时间:2022-04-06 03:03
共2个回答
热心网友 时间:2022-04-06 04:32
1、首先新建一个php文件,命名为test.php。
2、在test.php文件内,定义两个字符串,一个纯英文字符串,另一个中英文混合的字符串。
3、使用strlen()方法统计长度,从执行程序结果可见,strlen()方法统计$Str1的字符串长度是正确的,统计第二个字符串$Str2的长度是错误的。
4、新建一个utf8_strlen()函数,定义其参数为$string,默认为null。
5、在utf8_strlen()函数内,使用preg_match_all()方法通过正则表达式拆分字符串,并保存在$match变量中,最后,通过count()方法统计得到的数组元素的个数,将结果返回。
6、使用utf8_strlen()方法分别统计$Str1,$Str2字符串的长度,并使用echo将结果输出到页面中。
7、在浏览器运行test.php文件,查看程序执行的结果,从两个结果可以看出成功实现了统计字符串的长度。
热心网友 时间:2022-04-06 05:50
PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:
PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:
$enStr = ‘Hello,China!’;
echo strlen($enStr); // 输出:12
而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。
gbk编码下每个中文字符所占字节为2,例:
$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:12
utf-8编码下每个中文字符所占字节为3,例:
$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:18
那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。
这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):
$zhStr = ‘您好,中国!’;
$str = ‘Hello,中国!’;
// 计算中文字符串长度
function utf8_strlen($string = null) {
// 将字符串分解为单元
preg_match_all(“/./us”, $string, $match);
// 返回单元个数
return count($match[0]);
}
echo utf8_strlen($zhStr); // 输出:6
echo utf8_strlen($str); // 输出:9 收起