-
- /**
- * 完全な単語インターセプト
- * bbs.it-home.org によって編集および整理
- * @param $str
- * @param $start
- * @param $length
- *
- * @return string
- */
- public static function usubstr($str, $start, $length = null)
- {
-
- // 最初に通常どおりインターセプトします。
- $res = substr ($str, $start, $length);
- $strlen = strlen($str);
-
- /* 次に、最初と最後の 6 バイトが完全である (不完全ではない) かどうかを判断します */
- // パラメーター start が正の数
- if ($start >= 0) {
- //約 6 バイト前を切り詰めます
- $next_start = $start + $length; //初期位置
- $next_len = $next_start + 6 <= $strlen ? 6: $strlen - $next_start;
- $next_segm = substr($str, $next_start, $next_len);
- // 最初のバイトが完全な文字の最初のバイトではない場合、約 6 バイトをインターセプトします
- $prev_start = $start - 6 > 0 ? $start - 6 : 0;
- $prev_segm = substr($str, $prev_start, $start - $prev_start);
- } // start は負の数
- else {
- // カット約6バイト前へ
- $next_start = $strlen + $start + $length; // 初期位置
- $next_len = $next_start + 6 <= $strlen ? 6 : $strlen - $next_start;
- $next_segm = substr($ str, $next_start, $next_len);
-
- // 最初のバイトが完全な文字の最初のバイトではない場合、約 6 バイト後をインターセプトします。
- $start = $strlen + $start
- $prev_start = $start; - 6 > 0 ? $start - 6 : 0;
- $prev_segm = substr($str, $prev_start, $start - $prev_start);
- }
- // 最初の 6 バイトが utf8 ルールに一致するかどうかを判定します
- if (preg_match ('@^([x80-xBF]{0,5})[xC0-xFD]?@', $next_segm, $bytes)) {
- if (!empty($bytes[1] )) {
- $bytes = $bytes[1];
- $res .= $bytes;
- }
- }
- // 最後の 6 バイトが utf8 ルールに準拠しているかどうかを判断します
- $ord0 = ord($res[0]); if (128 < ;= $ord0 && 191 >= $ord0) {
- // 後ろからインターセプトして res の前に追加します
- if (preg_match('@[xC0-xFD][x80-xBF]{ 0,5} $@', $prev_segm, $bytes)) {
- if (!empty($bytes[0])) {
- $bytes = $bytes[0];
- $res = $bytes
- }
- }
- }
- if (strlen($res) < $strlen) {
- $res = $res . '...';
- }
- return $res;
- }
-
コードをコピー
|