目录
1. 直接采用file函数来操作
2.直接调用Linux的 tail 命令来显示最后几行
3. 直接使用PHP的 fseek 来进行文件操作
首页 后端开发 php教程 PHP快速读取大文件方法

PHP快速读取大文件方法

Jun 20, 2016 pm 01:02 PM

在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file、file_get_contents之类的函数,简简单单的几行代码就能很漂亮的完成我们所需要的功能。

但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于PHP读取大文件时,常用的操作方法。

需求有一个800M的日志文件,大约有500多万行, 用PHP返回最后几行的内容。

实现方法

1. 直接采用file函数来操作

由于 file函数是一次性将所有内容读入内存,而PHP为了防止一些写的比较糟糕的程序占用太多的内存而导致系统内存不足,使服务器出现宕机,所以默认情况下限制只能最大使用内存16M,这是通过php.ini里的 memory_limit = 16M 来进行设置,这个值如果设置-1,则内存使用量不受限制。

下面是一段用file来取出这具文件最后一行的代码:

 

<!--?php</span--><br />
ini_set(&#39;memory_limit&#39;, &#39;-1&#39;);<br />
$file = &#39;access.log&#39;;<br />
$data = file($file);<br />
$line = $data[count($data) - 1];<br />
echo $line;</p>

<p>?>
登录后复制

整个代码执行完成耗时 116.9613 (s)。我机器是2个G的内存,当按下F5运行时,系统直接变灰,差不多20分钟后才恢复过来,可见将这么大的文件全部直接读入内存,后果是多少严重,所以不在万 不得以,memory_limit这东西不能调得太高,否则只有打电话给机房,让reset机器了。

2.直接调用Linux的 tail 命令来显示最后几行

在Linux命令行下,可以直接使用 tail -n 10 access.log 很轻易的显示日志文件最后几行,可以直接用PHP来调用tail命令,执行PHP代码如下:

<!--?php</span--><br />
$file = &#39;access.log&#39;;<br />
$file = escapeshellarg($file); // 对命令行参数进行安全转义<br />
$line = `tail -n 1 $file`;<br />
echo $line;</p>

<p> </p>

<p>?>
登录后复制

整个代码执行完成耗时 0.0034 (s)

3. 直接使用PHP的 fseek 来进行文件操作

这种方式是最为普遍的方式,它不需要将文件的内容全部读入内容,而是直接通过指针来操作,所以效率是相当高效的。

在使用fseek来对文件进行操作时,也有多种不同的方法,效率可能也是略有差别的,下面是常用的两种方法:

方法一

首先通过fseek找到文件的最后一位EOF,然后找最后一行的起始位置,取这一行的数据,再找次一行的起始位置, 再取这一行的位置,依次类推,直到找到了$num行。

#实现代码如下

<!--?php</span--><br />
$fp = fopen($file, "r");<br />
$line = 10;<br />
$pos = -2;<br />
$t = " ";<br />
$data = "";<br />
while ($line > 0)<br />
{<br />
while ($t != "\n")<br />
{<br />
fseek($fp, $pos, SEEK_END);<br />
$t = fgetc($fp);<br />
$pos--;<br />
}<br />
$t = " ";<br />
$data .= fgets($fp);<br />
$line--;<br />
}<br />
fclose($fp);<br />
echo $data</p>

<p> </p>

<p>?>
登录后复制

整个代码执行完成耗时 0.0095 (s)

方法二

还是采用fseek的方式从文件最后开始读,但这时不是一位一位的读,而是一块一块的读,每读一块数据时,就将读取后的数据放在一个buf里,然后通过换 行符(\n)的个数来判断是否已经读完最后$num行数据。

#实现代码如下

<!--?php</span--><br />
$fp = fopen($file, "r");<br />
$num = 10;<br />
$chunk = 4096;<br />
$fs = sprintf("%u", filesize($file));<br />
$max = (intval($fs) == PHP_INT_MAX) ? PHP_INT_MAX : filesize($file);<br />
for ($len = 0; $len < $max; $len += $chunk)<br />
{<br />
$seekSize = ($max - $len > $chunk) ? $chunk : $max - $len;<br />
fseek($fp, ($len + $seekSize) * -1, SEEK_END);<br />
$readData = fread($fp, $seekSize) . $readData;<br />
if (substr_count($readData, "\n") >= $num + 1)<br />
{<br />
preg_match("!(.*?\n){" . ($num) . "}$!", $readData, $match);<br />
$data = $match[0];<br />
break;<br />
}<br />
}<br />
fclose($fp);<br />
echo $data;</p>

<p> </p>

<p>?>
登录后复制

整个代码执行完成耗时 0.0009(s)。

方法三

<!--?php</span--><br />
function tail($fp, $n, $base = 5)<br />
{<br />
assert($n > 0);<br />
$pos = $n + 1;<br />
$lines = array();<br />
while (count($lines) <= $n)<br />
{<br />
try<br />
{<br />
fseek($fp, -$pos, SEEK_END);<br />
}<br />
catch (Exception $e)<br />
{<br />
fseek(0);<br />
break;<br />
}<br />
$pos *= $base;<br />
while (!feof($fp))<br />
{<br />
array_unshift($lines, fgets($fp));<br />
}<br />
}<br />
<br />
return array_slice($lines, 0, $n);<br />
}<br />
<br />
var_dump(tail(fopen("access.log", "r+"), 10));</p>

<p> </p>

<p>?>
登录后复制

 

整个代码执行完成耗时 0.0003(s)


本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

在Laravel中使用Flash会话数据 在Laravel中使用Flash会话数据 Mar 12, 2025 pm 05:08 PM

Laravel使用其直观的闪存方法简化了处理临时会话数据。这非常适合在您的应用程序中显示简短的消息,警报或通知。 默认情况下,数据仅针对后续请求: $请求 -

php中的卷曲:如何在REST API中使用PHP卷曲扩展 php中的卷曲:如何在REST API中使用PHP卷曲扩展 Mar 14, 2025 am 11:42 AM

PHP客户端URL(curl)扩展是开发人员的强大工具,可以与远程服务器和REST API无缝交互。通过利用Libcurl(备受尊敬的多协议文件传输库),PHP curl促进了有效的执行

简化的HTTP响应在Laravel测试中模拟了 简化的HTTP响应在Laravel测试中模拟了 Mar 12, 2025 pm 05:09 PM

Laravel 提供简洁的 HTTP 响应模拟语法,简化了 HTTP 交互测试。这种方法显着减少了代码冗余,同时使您的测试模拟更直观。 基本实现提供了多种响应类型快捷方式: use Illuminate\Support\Facades\Http; Http::fake([ 'google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>

在Codecanyon上的12个最佳PHP聊天脚本 在Codecanyon上的12个最佳PHP聊天脚本 Mar 13, 2025 pm 12:08 PM

您是否想为客户最紧迫的问题提供实时的即时解决方案? 实时聊天使您可以与客户进行实时对话,并立即解决他们的问题。它允许您为您的自定义提供更快的服务

解释PHP中晚期静态结合的概念。 解释PHP中晚期静态结合的概念。 Mar 21, 2025 pm 01:33 PM

文章讨论了PHP 5.3中引入的PHP中的晚期静态结合(LSB),从而允许静态方法的运行时分辨率调用以获得更灵活的继承。 LSB的实用应用和潜在的触摸

自定义/扩展框架:如何添加自定义功能。 自定义/扩展框架:如何添加自定义功能。 Mar 28, 2025 pm 05:12 PM

本文讨论了将自定义功能添加到框架上,专注于理解体系结构,识别扩展点以及集成和调试的最佳实践。

框架安全功能:防止漏洞。 框架安全功能:防止漏洞。 Mar 28, 2025 pm 05:11 PM

文章讨论了框架中的基本安全功能,以防止漏洞,包括输入验证,身份验证和常规更新。

See all articles