编程
在许多Web编程里,字符串总是会被大量地生成和处理的。正确地使用和处理字符串,对于PHP程 序员来说也同样越来越重要了。本文从最简单的字符串定义一直引导你到高层字符串处理技巧,希望 对大家有所帮助。
一、引号定义字符串
在PHP中,通常一个字符串被定义在一对引号中,如:
'I am a string in single quotes'
"I am a string in double quotes"
PHP语法分析器是用成对的引号来判断一个字符串的。因此,所有字符串必须使用同一种单或者双 引号来定义开始和结束。例如,下面的字串定义是不合法的:
"I am not a valid string since I have unmatching quote marks'
'Me neither!"
定义字符串时,只有一种引号被视为定义符,即单引号或双引号。于是,如果一个字符串由双引号开始,那么只有双引号被分析器解析。这样,你就可以在双引号串中包含任何其他字符,甚至单引号。下面的引号串都是合法的:
$s = "I am a 'single quote string' inside a double quote string";
$s = 'I am a "double quote string" inside a single quote string';
当PHP遇到与串的开头相对应的引号时,便认为已经到了字符串尾部,于是:
"Why doesn't "this" work?"
实际上被PHP语法分析器分成三个部分:
"Why doesn't "——包含一个单引号的双引号串
this——多余的字符,分析器无法处理" work?" ——普通字符串
上面的这个例子企图在双引号串中包含双引号,而分析器在遇到第二个双引号时便认为字符串结束了。要达到包含引号的目的, 必须分析器在遇到串内普通引号的时候忽略它的原意,我们在引号的前面加上一个反斜杠来告诉PHP:这个引号是字符串的一部分,正确的表示方法是这样:
"Why doesn't \"that\" work?"
在英文字符串中一个常见的问题是撇号'的使用,因为它就是一个单引号,而在英文串中十分常见 (英文所有格)。你必须小心处理这些字符:
'You\'d better escape your apostrophes'
可以看到反斜杠在字符串中有他的特殊含义,当我们需要在字符串中包含反斜杠本身时,需要在
该符号前面多加一个反斜杠。例如:
$file = "c:\windows\system.ini";
echo $file; // 打印结果为: c:windowssystem.ini
$file = "c:\\windows\\system.ini";
echo $file; // 打印结果为: c:\windows\system.ini
另一种字符串定义方式,能够消除特殊字符的烦恼,而且便于引用较长的文本。该字符串定义方法以<<<符号紧跟一个自定义字符串开头,最后一行以该自定义字符串结束,并且必须顶格。
二、字串的连接
字串可以使用字串连接符(.)来连接,如:
$first_name = 'Charlie';
$last_name = 'Brown';
$full_name = $first_name . ' ' . $last_name;
常见的用途是建立大块的HTML字串代码,赋值号 (=) 连接符 (.) 可以被简写合并为 (.=) 符号,如:
$html = '
number | square |
' . $i . ' | ' . $square . ' |
三、在字串中使用变量
这个功能让你无须使用连接符号来粘和大量的简单字符串。PHP允许我们在双引号串中直接包含字 串变量,我们可以发现下面的两个字串的处理结果是相同的。
$full_name = $first_name . ' ' . $last_name;
$full_name = "$first_name $last_name";
单引号串和双引号串在PHP中的处理是不相同的。双引号串中的内容可以被解释而且替换,而单引 号串中的内容总被认为是普通字符。例如:
$foo = 2;
echo "foo is $foo"; // 打印结果: foo is 2
echo 'foo is $foo'; // 打印结果: foo is $foo
echo "foo is $foo\n"; // 打印结果: foo is 2 (同时换行)
echo 'foo is $foo\n'; // 打印结果: foo is $foo\n
ご覧のとおり、一重引用符文字列内のバックスラッシュでさえ、その拡張された意味を失います (バックスラッシュ \ の挿入と一重引用符 ' の挿入を除く)。したがって、変数置換を実行し、文字列に n (改行) などのエスケープ シーケンスを含める場合は、二重引用符を使用する必要があります。一重引用符文字列は他のどこでも使用できます。スクリプト内で一重引用符文字列を使用すると、処理速度が速くなります。これは、PHP パーサーが一重引用符文字列を比較的単純な方法で処理する一方で、二重引用符の処理も内部で解析する必要があるためです。したがって、文字列はより複雑になり、処理が若干遅くなります。
文字列内の変数の複雑な組み合わせを参照する場合、いくつかの問題が発生する可能性があります。
echo "value = $foo";
echo "value = $a[ $i]";
しかし、次のコードでは望む結果を得ることができません:
echo "value = $a[$i][$j]"; / /出力したい2 次元配列 $a の要素。
文字列を使用する際のこれらの潜在的な問題を回避するには、通常、次のように複雑な変数を文字列から分離します。
echo 'value = '
もう 1 つの方法は、複雑な変数を中括弧で囲んで、パーサーがそれらを正しく識別できるようにすることです。
echo "value = { $a [$i][$j]}" //二次元配列 $a の要素を出力する
このようにして、新たな問題が発生します。文字列内で中括弧文字自体を引用したい場合は、エスケープ文字を忘れずに使用する必要があります。
$var = 3; print Result "value = 3"
Echo "value = { $var}"; // print result "value = { 3}"
3. スラッシュと SQL ステートメント
$sql = "select * from users where last_name = '" .addslashes($last_name) . "'";
この例では、last_name 文字列も一重引用符で囲む必要があります (SQL 構文)ここでは二重引用符文字列が使用されているため、一重引用符のペアをエスケープする必要はありません。次のステートメントは、単一引用符文字列を使用するのと同じです:
4. 二重引用符と HTML
SQL ステートメントとは異なり、標準 HTML 言語では二重引用符は文字列を表すためによく使用されます (多くのブラウザーには強力なフォールト トレランス機能が備わっており、文字列をHTML では一重引用符で表すことも、引用符なしで表すこともできます)。例:
$html = ''.$link.' a>';
$html = "$link";
HTML言語はバックスラッシュエスケープをサポートしていません。フォームの非表示の入力を使用してデータを送信します。非表示の入力の値を設定する最良の方法は、htmlspecialchars() 関数を使用してエンコードすることです。通常、次のステートメントは二重引用符を含む可能性のあるデータを送信できます: