« PHP 计算页面执行时间 珊瑚虫IP库PHP操作类 »

PHP 截取字符串专题

1. 截取GB2312中文字符串

<?php
< ?
php
//截取中文字符串
function mysubstr($str, $start, $len) {
    
$tmpstr = "";
    
$strlen = $start + $len;
    
for($i = 0; $i < $strlen; $i++) {
        
if(ord(substr($str, $i, 1)) > 0xa0) {
            
$tmpstr .= substr($str, $i, 2);
            
$i++;
        
} else
            
$tmpstr .= substr($str, $i, 1);
    
}
    
return $tmpstr;
}
?>

2. 截取utf8编码的多字节字符串

<?php
< ?
php
//截取utf8字符串
function utf8Substr($str, $from, $len)
{
    
return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'.
                      
'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s',
                      
'$1',$str);
}
?>

3. UTF-8、GB2312都支持的汉字截取函数

<?php
< ?
php
/*
Utf-8、gb2312都支持的汉字截取函数
cut_str(字符串, 截取长度, 开始长度, 编码);
编码默认为 utf-8
开始长度默认为 0
*/

 
function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')
{
    
if($code == 'UTF-8')
    
{
        
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
        
preg_match_all($pa, $string, $t_string);
 
        
if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."...";
        
return join('', array_slice($t_string[0], $start, $sublen));
    
}
    
else
    
{
        
$start = $start*2;
        
$sublen = $sublen*2;
        
$strlen = strlen($string);
        
$tmpstr = '';
 
        
for($i=0; $i< $strlen; $i++)
        
{
            
if($i>=$start && $i< ($start+$sublen))
            
{
                
if(ord(substr($string, $i, 1))>129)
                
{
                    
$tmpstr.= substr($string, $i, 2);
                
}
                
else
                
{
                    
$tmpstr.= substr($string, $i, 1);
                
}
            
}
            
if(ord(substr($string, $i, 1))>129) $i++;
        
}
        
if(strlen($tmpstr)< $strlen ) $tmpstr.= "...";
        
return $tmpstr;
    
}
}
 
$str = "abcd需要截取的字符串";
echo cut_str($str, 8, 0, 'gb2312');
?>

4. BugFree 的字符截取函数

<?php
< ?
php
/**
 *
@package     BugFree
 *
@version     $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $
 *
 *
 * Return part of a string(Enhance the function substr())
 *
 *
@author                  Chunsheng Wang <wwccss@263.net>
 *
@param string  $String  the string to cut.
 *
@param int     $Length  the length of returned string.
 *
@param booble  $Append  whether append "...": false|true
 *
@return string           the cutted string.
 */

function sysSubStr($String,$Length,$Append = false)
{
    
if (strlen($String) < = $Length )
    
{
        
return $String;
    
}
    
else
    
{
        
$I = 0;
        
while ($I < $Length)
        
{
            
$StringTMP = substr($String,$I,1);
            
if ( ord($StringTMP) >=224 )
            
{
                
$StringTMP = substr($String,$I,3);
                
$I = $I + 3;
            
}
            
elseif( ord($StringTMP) >=192 )
            
{
                
$StringTMP = substr($String,$I,2);
                
$I = $I + 2;
            
}
            
else
            
{
                
$I = $I + 1;
            
}
            
$StringLast[] = $StringTMP;
        
}
        
$StringLast = implode("",$StringLast);
        
if($Append)
        
{
            
$StringLast .= "...";
        
}
        
return $StringLast;
    
}
}
 
$String = "CodeBit.cn -- 简单、精彩、通用";
$Length = "18";
$Append = false;
echo sysSubStr($String,$Length,$Append);
?>

“PHP 截取字符串专题”

13条回复
  1. 很好,谢谢。。。

  2. 非常详细,谢谢!!!

  3. 我一定要来赞一下,你太神了啊,佩服哦

  4. 不错啊,很好啊!

  5. 不错哦…谢谢博主了!!!

  6. BugFree is good!

  7. 第一个字符串截取函数如果 $start参数不为0的话会出问题,不知道你有没有遇到过,截取的初始字符不会从规定的开始,正如函数中所示,是直接加载length上了

  8. 转载了。
    请问博主
    [\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+)这个是汉字的十六进制编码吧?

    还有个问题这些通用函数同样函数解决不了,就是,我给个字符串,有汉字和英文字母,
    比如:$string =”安检口abcdef”;
    echo sysSubStr($string,5);
    我希望输出的是五个字符,为”安检口ab”;
    而实际输出的为”安检”;
    还有就是有个mb_substr函数可以实现,为什么不直接用这个。可能有些php环境部支持吧。。

    @phpzxh, mb_substr不是所有的服务器都有,而且这里计算数字的时候是按照一个汉字两个直接来计算的。06年写的的呢,找时间更新一下。

  9. http://www.ccvita.com/27.html
    任意网址字符串截取 http://www.ccvita.com 这一部分或http://www.ccvita.com这一部分,找不到好的实现方法,不知道您有什么好的办法!!

    QQ:670608809

  10. 多谢了。我的截取一直都有问题,现在终于解决了,再次谢谢!

  11. [...] [...]

回复留言

*
To prove you're a person (not a spam script), type the security word shown in the picture.
Anti-Spam Image

你可以使用XHTML标签: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>