PHP截取utf-8字符串的具体方法介绍

开发 后端
UTF-8编码的字符可能由1~3个字节组成,我们在这里将为大家具体讲解有关PHP截取utf-8字符串的方法,希望对大家有所帮助。

我们对PHP语言都已经不再陌生,它是一个很常用的语言。今天我们将向大家介绍的是有关PHP截取utf-8字符串的相关方法。为了支持多语言,数据库里的字符串可能保存为UTF-8编码,在网站开发中可能需要用php截取字符串的一部分。为了避免出现乱码现象,编写如下的UTF-8字符串截取函数。

#t#关于utf-8的原理请看 UTF-8 FAQ

UTF-8编码的字符可能由1~3个字节组成, 具体数目可以由第一个字节判断出来。(理论上可能更长,但这里假设不超过3个字节)
第一个字节大于224的,它与它之后的2个字节一起组成一个UTF-8字符
第一个字节大于192小于224的,它与它之后的1个字节组成一个UTF-8字符
否则第一个字节本身就是一个英文字符(包括数字和一小部分标点符号)。

以前为某网站设计的代码(也是现在用在首页的长度截取的函数)

PHP截取utf-8字符串的代码示例:

< ?php // Cut_Str;  
//$sourcestr 是要处理的字符串  
//$cutlength 为截取的长度(即字数)  
function cut_str($sourcestr,$cutlength)  
{  
$returnstr=”;  
$i=0;  
$n=0;  
$str_length=strlen($sourcestr);//字符串的字节数  
while (($n<$cutlength) and ($i<=$str_length))  
{  
$temp_str=substr($sourcestr,$i,1);  
$ascnum=Ord($temp_str);//得到字符串中第$i位字符的ascii码  
if ($ascnum>=224) //如果ASCII位高与224,  
{  
$returnstr=$returnstr.substr($sourcestr,$i,3); 
//根据UTF-8编码规范,将3个连续的字符计为单个字符  
$i=$i+3; //实际Byte计为3   $n++; //字串长度计1   }   elseif ($ascnum>=192) //如果ASCII位高与192,   {   $returnstr=$returnstr.substr($sourcestr,$i,2);
 //根据UTF-8编码规范,将2个连续的字符计为单个字符  
$i=$i+2; //实际Byte计为2   $n++; //字串长度计1   }   elseif ($ascnum>=65 && $ascnum<=90) 
//如果是大写字母,  
{   $returnstr=$returnstr.substr($sourcestr,$i,1);   $i=$i+1; //实际的Byte数仍计1个   $n++; //但考虑整体美观,大写字母计成一个高位字符   }   else //其他情况下,包括小写字母和半角标点符号,   {   $returnstr=$returnstr.substr($sourcestr,$i,1);   $i=$i+1; //实际的Byte数计1个   $n=$n+0.5; //小写字母和半角标点等与半个高位字符宽…   }   }   if ($str_length>$cutlength){   $returnstr = $returnstr . “…”;
//超过长度时在尾处加上省略号  
}   return $returnstr;  
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.

以上就是PHP截取utf-8字符串的相关方法总结,希望对大家有所帮助。

责任编辑:曹凯 来源: 百度博客
相关推荐

2009-12-01 09:52:40

PHP过滤字符串

2009-11-26 16:26:32

PHP字符串mbstr

2009-11-23 15:10:28

PHP获取当前url

2009-11-30 11:24:49

PHP将EXCEL导入

2010-03-11 09:56:57

Python字符串操作

2009-11-24 17:25:00

PHP二维数组排序

2009-11-30 18:26:06

PHP字符串替换

2016-12-13 10:13:18

PHPUTF-8实践

2009-11-26 16:43:11

PHP截取中文字符串

2009-12-31 14:12:40

Silverlight

2009-12-31 15:05:00

Silverlight

2009-12-16 15:04:26

Ruby实现strea

2009-12-03 18:23:23

2009-12-01 13:41:49

静态路由设置

2010-04-27 12:26:21

Unix字符串

2009-12-01 09:18:50

PHP分割字符串

2009-11-18 18:02:19

PHP字符串截取

2009-06-30 14:16:37

截取字符串

2009-11-25 17:14:45

PHP安装为Apach

2010-11-26 11:34:32

MySQL截取字符串函
点赞
收藏

51CTO技术栈公众号