PHP获取URL的方法【总结】-php手册-php.cn

服务器变量： $_SERVER 使用范例 Php 代码 1. $uri = $_SERVER [ 'REQUEST_URI' ]; 2. echo $uri ; 3. 输出： /snowing/products 4. 5. 6. $url = 'http://' . $_SERVER [ 'SERVER_NAME' ]. ':' . $_SERVER [ SERVER_PORT ]. $_SERVER [ REQUEST_URI ]; 7. e

服务器变量：$_SERVER

使用范例

Php代码

1. $uri = $_SERVER['REQUEST_URI'];

2. echo $uri;

3. 输出：/snowing/products

6. $url = 'http://'.$_SERVER['SERVER_NAME'].':'.$_SERVER["SERVER_PORT"].$_SERVER["REQUEST_URI"];

7. echo $url;

8. 输出：http://www.site.com:80/snowing/products

10.

11.$http = (isset($_SERVER['HTTPS'])&&$_SERVER['HTTPS']!='off')?'https://':'http://';

12.$port = $_SERVER["SERVER_PORT"]==80?'':':'$_SERVER["SERVER_PORT"];

13.$url = $http.$port.$_SERVER["REQUEST_URI"];

14.echo $url;

15.输出：http://www.site.com/snowing/products

注: 在 PHP 4.1.0 及以后版本使用。之前的版本，使用 $HTTP_SERVER_VARS。

$_SERVER 是一个包含诸如头部(headers)、路径(paths)和脚本位置(script locations)的数组。数组的实体由 web 服务器创建。不能保证所有的服务器都能产生所有的信息；服务器可能忽略了一些信息，或者产生了一些未在下面列出的新的信息。这意味着，大量的这些变量在 CGI 1.1 specification 中说明，所以您应该仔细研究它。

这是一个“superglobal”，或者可以描述为自动全局变量。这只不过意味这它在所有的脚本中都有效。在函数或方法中您不需要使用 global $_SERVER; 访问它，就如同使用 $HTTP_SERVER_VARS 一样。

$HTTP_SERVER_VARS 包含着同样的信息，但它不是一个自动全局变量。（注意：$HTTP_SERVER_VARS 和 $_SERVER 是不同的变量，PHP 处理它们的方式不同。）
如果设置了 register_globals 指令，这些变量也在所有脚本中可用；也就是，分离了 $_SERVER 和$HTTP_SERVER_VARS 数组。相关信息，请参阅安全的相关章节使用 Register Globals。这些单独的全局变量不是自动全局变量。

您或许会发现下面列出的某些 $_SERVER 元素并不可用。注意，如果以命令行方式运行 PHP，下面列出的元素几乎没有有效的（或是没有任何实际意义的）。

“PHP_SELF”
当前正在执行脚本的文件名，与 document root相关。举例来说，在URL地址为http://example.com/test.php/foo.bar 的脚本中使用 $_SERVER['PHP_SELF'] 将会得到 /test.php/foo.bar这个结果。如果 PHP 以命令行方式运行，该变量无效。

“argv”
传递给该脚本的参数。当脚本运行在命令行方式时，argv 变量传递给程序 C 语言样式的命令行参数。当调用 GET 方法时，该变量包含请求的数据。

“argc”
包含传递给程序的命令行参数的个数（如果运行在命令行模式）。

“GATEWAY_INTERFACE”
服务器使用的 CGI 规范的版本。例如，“CGI/1.1”。

'SERVER_NAME'
当前运行脚本所在服务器主机的名称。如果该脚本运行在一个虚拟主机上，该名称是由那个虚拟主机所设置的值决定。

'SERVER_SOFTWARE'
服务器标识的字串，在响应请求时的头部中给出。

“SERVER_PROTOCOL”
请求页面时通信协议的名称和版本。例如，“HTTP/1.0”。

“REQUEST_METHOD”
访问页面时的请求方法。例如：“GET”、“HEAD”，“POST”，“PUT”。

“QUERY_STRING”
查询(query)的字符串。

“DOCUMENT_ROOT”
当前运行脚本所在的文档根目录。在服务器配置文件中定义。

“HTTP_ACCEPT”
当前请求的 Accept: 头部的内容。

“HTTP_ACCEPT_CHARSET”
当前请求的 Accept-Charset: 头部的内容。例如：“iso-8859-1,*,utf-8”。

“HTTP_ACCEPT_ENCODING”
当前请求的 Accept-Encoding: 头部的内容。例如：“gzip”。

“HTTP_ACCEPT_LANGUAGE”
当前请求的 Accept-Language: 头部的内容。例如：“en”。

“HTTP_CONNECTION”
当前请求的 Connection: 头部的内容。例如：“Keep-Alive”。

“HTTP_HOST”
当前请求的 Host: 头部的内容。

“HTTP_REFERER”
链接到当前页面的前一页面的 URL 地址。不是所有的用户代理（浏览器）都会设置这个变量，而且有的还可以手工修改 HTTP_REFERER。因此，这个变量不总是正确真实的。

“HTTP_USER_AGENT”
当前请求的 User_Agent: 头部的内容。该字符串表明了访问该页面的用户代理的信息。一个典型的例子是：Mozilla/4.5 [en] (X11; U; Linux 2.2.9 i586)。您也可以使用 get_browser() 得到这个信息。

“REMOTE_ADDR”
正在浏览当前页面用户的 IP 地址。

'REMOTE_HOST'
正在浏览当前页面用户的主机名。反向域名解析基于该用户的 REMOTE_ADDR。

注: 必须配置 Web 服务器来建立此变量。例如 Apache 需要在 httpd.conf 中有 HostnameLookups On。参见 gethostbyaddr()。

“REMOTE_PORT”
用户连接到服务器时所使用的端口。

“SCRIPT_FILENAME”
当前执行脚本的绝对路径名。

“SERVER_ADMIN”
该值指明了 Apache 服务器配置文件中的 SERVER_ADMIN 参数。如果脚本运行在一个虚拟主机上，则该值是那个虚拟主机的值。

“SERVER_PORT”
服务器所使用的端口。默认为“80”。如果你使用 SSL 安全连接，则这个值为您所设置的 HTTP 端口。

“SERVER_SIGNATURE”
包含服务器版本和虚拟主机名的字符串。

“PATH_TRANSLATED”
当前脚本所在文件系统（不是文档根目录）的基本路径。这是在服务器进行虚拟到真实路径的映像后的结果。

“SCRIPT_NAME”
包含当前脚本的路径。这在页面需要指向自己时非常有用。

“REQUEST_URI”
访问此页面所需的 URI。例如，“/index.html”。

“PHP_AUTH_USER”
当 PHP 运行在 Apache 模块方式下，并且正在使用 HTTP 认证功能，这个变量便是用户输入的用户名。

“PHP_AUTH_PW”
当 PHP 运行在 Apache 模块方式下，并且正在使用 HTTP 认证功能，这个变量便是用户输入的密码。

“AUTH_TYPE”
当 PHP 运行在 Apache 模块方式下，并且正在使用 HTTP 认证功能，这个变量便是认证的类型。

? 获取访客来路URL地址信息

不少网站访问统计程序提供有“来路”信息，客户查阅统计资料时从中得知访问者从什么网站连接过来。所谓“来路”，其实就是别人从哪里点击了你网站的链接，即，从什么页面连接到你的网站。在PHP中，获取“来路”信息是非常简单的，我们只需用到referer。HTTP头携带的信息当中包含有一个变量$_SERVER['HTTP_REFERER']，它提供的就是“来路”完整URL地址。以下代码放入你的PHP页面脚本，它就能够打印出连接到该脚本所在页面的具体地址（即“来路”）：

$v_url=$HTTP_REFERER;

print $v_url;

比如，用户从本站的友情链接点击你的网站，你将得到类似”htttp://www.ilife8.com/code/773.html“的URL地址。就这么简单。

来路的URL地址可能是很长的。作为来路地址，很多情况下，我们可能只关心它属于哪个网站，即，网站的虚拟主机名叫什么。一个URL地址包含有诸多实体信息，主要有：

·方案（scheme）- HTTP

·主机（host） – www.ilife8.com

·路径（path） – /code/773.html

PHP提供一个截取这些实体信息的简便方案：parse_url()函数。

? parse_url()函数

array parse_url ( string url )；

parse_url()函数解析一个URL并返回一个关联数组，包含在URL 中出现的各种组成部分。本函数不是用来验证给定URL 的合法性的，只是将其分解为下面列出的部分。不完整的 URL 也被接受，parse_url() 会尝试尽量正确地将其解析。对严重不合格的 URL，parse_url() 可能会返回 FALSE 并发出 E_WARNING。否则会返回一个关联数组，其组成部分为（至少有一个）：

scheme - 如 http
host
port
user
pass
path
query - 在问号 ? 之后
fragment - 在散列符号 # 之后

Example #1 parse_url() 例子

<?php 
$url = 'http://username:password@hostname/path?arg=value#anchor';

print_r(parse_url($url));
?>

以上例程会输出：

<span>Array</span>

Copy after login

&lt;span&gt;(&lt;/span&gt;

Copy after login

<span> <wbr> <wbr> <wbr> [scheme] => http</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [host] => hostname</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [user] => username</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [pass] => password</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [path] => /path</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [query] => arg=value</wbr></wbr></wbr></span>

Copy after login

<span> <wbr> <wbr> <wbr> [fragment] => anchor</wbr></wbr></wbr></span>

Copy after login

<span>)</span>

Copy after login

<span> <wbr> <wbr> <wbr> </wbr></wbr></wbr></span>可以看到，可以很容易分解出一个<span>URL</span>的各个部，那如果要拿指定的部分出来的话也很容易，如：

Copy after login

<span>echo parse_url($url,PHP_URL_PATH);</span>

Copy after login

就是在第二个参数中，设定如下的参数：<span>PHP_URL_SCHEME, PHP_URL_HOST, PHP_URL_PORT, PHP_URL_USER, PHP_URL_PASS, PHP_URL_PATH, PHP_URL_QUERY or PHP_URL_FRAGMENT.</span>

Copy after login

parse_url() 是专门用来解析 URL 而不是 URI 的，也不能用于相对 URL。不过为遵从 PHP 向后兼容的需要有个例外，对file:// 协议允许三个斜线（file:///...）。其它任何协议都不能这样。

? pathinfo()函数

mixed pathinfo ( string $path [, int $options ] )

pathinfo() 返回一个关联数组包含有 path 的信息。包括以下的数组单元：dirname，basename 和extension。

可以通过参数 options 指定要返回哪些单元。它们包括：PATHINFO_DIRNAME，PATHINFO_BASENAME 和PATHINFO_EXTENSION。默认是返回全部的单元。如果不是要求取得所有单元，则本函数返回字符串。

Example #1 pathinfo() 例子

<?php 
$path_parts = pathinfo("/www/htdocs/index.html");
echo $path_parts["dirname"] . "\n";
echo $path_parts["basename"] . "\n";
echo $path_parts["extension"] . "\n";
?>