Wap用utf8中文字符截取和utf8按照字数分页函数
2007/02/06 18:22 ArthurXF
当一篇文章太长时,比如大于1000字,在手机中需要分页,这个时候分页是按字数多少来进行分页的,虽然手机可以显示超过200个汉字,但是实际情况中,根据手机屏幕的大小,我们一般采取每页200个汉字,即:400个字符。
通用按字数分页方法,适合中英文混排。
使用WordPage($str,200);调用就可以了。
通用按字数分页方法,适合中英文混排。
使用WordPage($str,200);调用就可以了。
<?php
//此文件UTF-8格式
/**
* 支持utf8中文字符截取
* @author 肖飞(arthurxf@gmail.com)
* @param string $text 待处理字符串
* @param int $start 从第几位截断
* @param int $sublen 截断几个字符
* @param string $code 字符串编码
* @param string $ellipsis 附加省略字符
* @return string
*/
function csubstr($string, $start = 0,$sublen=12, $code = 'UTF-8',$ellipsis='...'){
if($code == 'UTF-8'){
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa, $string, $t_string);
if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen)).$ellipsis;
return join('', array_slice($t_string[0], $start, $sublen));
}else{
$start = $start*2;
$sublen = $sublen*2;
$strlen = strlen($string);
$tmpstr = '';
for($i=0; $i<$strlen; $i++){
if($i>=$start && $i<($start+$sublen)){
if(ord(substr($string, $i, 1))>129) $tmpstr.= substr($string, $i, 2);
else $tmpstr.= substr($string, $i, 1);
}
if(ord(substr($string, $i, 1))>129) $i++;
}
if(strlen($tmpstr)<$strlen ) $tmpstr.= $ellipsis;
return $tmpstr;
}
}
/**
* 支持utf8按照字数分页
* @author 肖飞
* @param string $str 待处理字符串
* @param int $page 当前页面
* @param int $num 从第几页截断
* @param string $code 字符串编码
* @return string
*/
function WordPage($str,$num=200,$page,$code = 'UTF-8'){
/*下面这段对多字节字符计算不准,主要是strlen产生的误差,所以建议使用下面的程序
if($code == 'UTF-8') $PageAll = strlen($str)/($num*3);
else $PageAll = strlen($str)/($num*2);
*/
$PageAll = mb_strlen($str,$code)/$num;
$PageAll = ceil($PageAll);
if ($page==""){
$page = 1;
}
$start = ($page-1)*$num;
$str = csubstr($str, $start, $num,$code,'');
$arrData = array();
$arrData['centent'] = $str;
//echo $str.'<br />';
if( (1<=$page) && ($page<=$PageAll)){
if($page < $PageAll){
$arrData['pagedown'] = $page+1;
//echo '<a href="'.$_SERVER["PHP_SELF"].'?page='.($page+1).'&id='.$_GET['id'].'">下一页</a><br />';
}
if( $page>1 ){
$arrData['pageup'] = $page-1;
//echo '<a href="'.$_SERVER["PHP_SELF"].'?page='.($page-1).'&id='.$_GET['id'].'">上一页</a><br />';
}
}
$arrData['pagenav'] = '第'.$page.'页/共'.$PageAll.'页';
//echo '第'.$page.'页/共'.$PageAll.'页<br />';
return $arrData;
}
?>
//此文件UTF-8格式
/**
* 支持utf8中文字符截取
* @author 肖飞(arthurxf@gmail.com)
* @param string $text 待处理字符串
* @param int $start 从第几位截断
* @param int $sublen 截断几个字符
* @param string $code 字符串编码
* @param string $ellipsis 附加省略字符
* @return string
*/
function csubstr($string, $start = 0,$sublen=12, $code = 'UTF-8',$ellipsis='...'){
if($code == 'UTF-8'){
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa, $string, $t_string);
if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen)).$ellipsis;
return join('', array_slice($t_string[0], $start, $sublen));
}else{
$start = $start*2;
$sublen = $sublen*2;
$strlen = strlen($string);
$tmpstr = '';
for($i=0; $i<$strlen; $i++){
if($i>=$start && $i<($start+$sublen)){
if(ord(substr($string, $i, 1))>129) $tmpstr.= substr($string, $i, 2);
else $tmpstr.= substr($string, $i, 1);
}
if(ord(substr($string, $i, 1))>129) $i++;
}
if(strlen($tmpstr)<$strlen ) $tmpstr.= $ellipsis;
return $tmpstr;
}
}
/**
* 支持utf8按照字数分页
* @author 肖飞
* @param string $str 待处理字符串
* @param int $page 当前页面
* @param int $num 从第几页截断
* @param string $code 字符串编码
* @return string
*/
function WordPage($str,$num=200,$page,$code = 'UTF-8'){
/*下面这段对多字节字符计算不准,主要是strlen产生的误差,所以建议使用下面的程序
if($code == 'UTF-8') $PageAll = strlen($str)/($num*3);
else $PageAll = strlen($str)/($num*2);
*/
$PageAll = mb_strlen($str,$code)/$num;
$PageAll = ceil($PageAll);
if ($page==""){
$page = 1;
}
$start = ($page-1)*$num;
$str = csubstr($str, $start, $num,$code,'');
$arrData = array();
$arrData['centent'] = $str;
//echo $str.'<br />';
if( (1<=$page) && ($page<=$PageAll)){
if($page < $PageAll){
$arrData['pagedown'] = $page+1;
//echo '<a href="'.$_SERVER["PHP_SELF"].'?page='.($page+1).'&id='.$_GET['id'].'">下一页</a><br />';
}
if( $page>1 ){
$arrData['pageup'] = $page-1;
//echo '<a href="'.$_SERVER["PHP_SELF"].'?page='.($page-1).'&id='.$_GET['id'].'">上一页</a><br />';
}
}
$arrData['pagenav'] = '第'.$page.'页/共'.$PageAll.'页';
//echo '第'.$page.'页/共'.$PageAll.'页<br />';
return $arrData;
}
?>