CI フレームワークのソース コードの読み取り----------Utf8.php
ファイル アドレス: ./system/core/Utf8.php
主な機能: utf-8 エンコーディングの環境サポートを提供します
1.__construct() コンストラクターは、utf8 がサポートされているかどうかを決定します
(1) ロギング Utf8 クラスが初期化されました
(2) CodeIgniter.php の $CFG を現在のクラスに呼び出します。
(3) 正規表現が utf8 をサポートしているかどうか、iconv ライブラリがインストールされているかどうか、マルチバイト文字列関数のオーバーロードが有効になっていないかどうか、およびアプリケーションの単語 を確認します。
シンボルセットは utf8 であり、
(a) ロギング: UTF-8 サポートが有効になりました。
(b) 定数 UTF8_ENABLED を値 true で定義します
(c) mbstring 拡張機能がロードされている場合、内部エンコーディングを設定します
(d) extension_loaded() 関数を複数回使用する必要がないようにフラグを設定します
(4) 正規表現が utf8 をサポートしていないか、iconv ライブラリがインストールされていないか、マルチバイト文字列関数のオーバーロードが有効になっているか、アプリケーションの文字セットが utf8 ではないかを確認し、
(a) ロギング: UTF-8 サポートが無効です
(b) 定数 UTF8_ENABLED を false に設定します
2.clean_string() utf8 でエンコードされた文字列をクリーンアップします
(1) 文字列が ASCII コードではないかを判定します
(2) iconv 関数を使用して文字列をトランスコードします (iconv 関数の詳細については、 を参照してください)
http://www.php.net/manual/zh/function.iconv.php)
(3) 戻り文字列
3.safe_ascii_for_xml() は、水平タブ、改行、復帰を除く、xml で問題を引き起こす可能性のあるすべての ASCII コード文字を削除します。
(1) Remove_invisible_characters()を直接呼び出して無効な文字を削除してリターンします。
注:remove_invisible_characters 関数は common.php で定義されています
4.convert_to_utf8() 文字列を utf8 エンコーディングに変換します
(1) iconv 関数が存在する場合は、iconv 変換を使用します
(2) mb_convert_encoding 関数が存在する場合は、mb_convert_encoding 関数を使用して
を変換します
(3) 上記 2 つの関数がどちらも存在しない場合、変換できず false を返します
(4) 変換が完了したら、変換された文字列を返します
5._is_ascii() 文字列が ASCII コードであるかどうかをテストします
(1) 通常のマッチングを使用してテスト結果を返します。
<?php if ( ! defined('BASEPATH')) exit('No direct script access allowed'); /** * CodeIgniter * * An open source application development framework for PHP 5.1.6 or newer * * @package CodeIgniter * @author ExpressionEngine Dev Team * @copyright Copyright (c) 2008 - 2011, EllisLab, Inc. * @license http://codeigniter.com/user_guide/license.html * @link http://codeigniter.com * @since Version 2.0 * @filesource */ // ------------------------------------ /** * Utf8 Class * * Provides support for UTF-8 environments * * @package CodeIgniter * @subpackage Libraries * @category UTF-8 * @author ExpressionEngine Dev Team * @link http://codeigniter.com/user_guide/libraries/utf8.html */ class CI_Utf8 { /** * Constructor * * Determines if UTF-8 support is to be enabled * */ function __construct() { log_message('debug', "Utf8 Class Initialized"); global $CFG; if ( preg_match('/./u', 'é') === 1 // PCRE must support UTF-8 AND function_exists('iconv') // iconv must be installed AND ini_get('mbstring.func_overload') != 1 // Multibyte string function overloading cannot be enabled AND $CFG->item('charset') == 'UTF-8' // Application charset must be UTF-8 ) { log_message('debug', "UTF-8 Support Enabled"); define('UTF8_ENABLED', TRUE); // set internal 内部 encoding for multibyte 多字节 string functions if necessary 必需的 // and set a flag so we don't have to repeatedly 多次 use extension_loaded() // or function_exists() if (extension_loaded('mbstring')) { define('MB_ENABLED', TRUE); mb_internal_encoding('UTF-8'); } else { define('MB_ENABLED', FALSE); } } else { log_message('debug', "UTF-8 Support Disabled"); define('UTF8_ENABLED', FALSE); } } // -------------------------------- /** * Clean UTF-8 strings * * Ensures 保证 strings are UTF-8 * * @access public * @param string * @return string */ function clean_string($str) { if ($this->_is_ascii($str) === FALSE) { $str = @iconv('UTF-8', 'UTF-8//IGNORE', $str); } return $str; } // -------------------------------- /** * Remove ASCII control characters * * Removes all ASCII control characters except horizontal tabs, * line feeds, and carriage returns, as all others can cause * problems in XML * * @access public * @param string * @return string */ function safe_ascii_for_xml($str) { return remove_invisible_characters($str, FALSE); } // -------------------------------- /** * Convert to UTF-8 * * Attempts 企图 to convert a string to UTF-8 * * @access public * @param string * @param string - input encoding * @return string */ function convert_to_utf8($str, $encoding) { if (function_exists('iconv')) { $str = @iconv($encoding, 'UTF-8', $str); } elseif (function_exists('mb_convert_encoding')) { $str = @mb_convert_encoding($str, 'UTF-8', $encoding); } else { return FALSE; } return $str; } // -------------------------------- /** * Is ASCII? * * Tests if a string is standard 7-bit ASCII or not * * @access public * @param string * @return bool */ function _is_ascii($str) { return (preg_match('/[^\x00-\x7F]/S', $str) == 0); } // -------------------------------- } // End Utf8 Class /* End of file Utf8.php */ /* Location: ./system/core/Utf8.php */