php读取大文件的一点疑问-PHP 튜토리얼-php.cn

回复讨论(解决方案)

집

백엔드 개발

PHP 튜토리얼

php读取大文件的一点疑问

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 23, 2016 pm 02:06 PM

我要分析一个6G的log文件，比对每行文件是否符合我的要求，程序如下

$file_path = 'd:\work\workplace\test\file\system.log';$file = fopen($file_path, 'r');$key = md5(0);$i = 1;while (!feof($file)) {    $buff = fgets($file);    if ($buff == $key . "\r\n")    {        echo "find 0 at Line {$i}\r\n";    }    $i ++;}fclose($file);

로그인 후 복사

我想问下这样性能怎么样吗，不会出现内存泄露或其他问题吧，还有进一步优化的方法吗？

回复讨论(解决方案)

你需要先将这个文件分割成若干个小文件
然后循环读取每个小文件即可！

linux 下 $ split -b
分割···

linux 下 $ split -b
分割···
为什么要分割啊，用fgets不是每次只去一行，并没有把文件都读取进内存啊

我建议你用fgets时最好制定读取的字符数，不要一行一行的读，6G的文件说不定某一行会很长！

现在可以肯定每一行不会很长，应为日志是按规定格式存取的

哦，那你看着办吧！呵呵，我只是建议！

哦，那你看着办吧！呵呵，我只是建议！
我的确也看到有的人像你那样做，但是如果不是一下子读入内存，应该不比那样吧，切割文件和删除临时文件还有消耗，这是我个人感觉，有不对的情指出

6G的文本文件……

你咋能整这么大的文件？
日志应该按天或者按周、按月来记，超过一定大小就新建一个文件

应该分成多个文件

6G的文本文件……

你咋能整这么大的文件？
日志应该按天或者按周、按月来记，超过一定大小就新建一个文件

应该分成多个文件
我们公司的行为日志，一天6G

可以，没有问题。就是很费时间

仅就代码而言，可以缩减一点
$file_path = 'd:\work\workplace\test\file\system.log';
$file = fopen($file_path, 'r');
$key = md5(0);
$i = 1;
while ($buff = fgets($file)) {
    if ($buff == $key . "\r\n")
    {
        echo "find 0 at Line {$i}\r\n";
    }
    $i ++;
}
fclose($file);

如果一次读取的多一点（比如1M）可能要快一点。不过算法要复杂些

做这种东西，不是php的长项

要不搞WEB的话，还是换其它程序搞吧。

引用 9 楼 baiyuxiong 的回复:

6G的文本文件……

你咋能整这么大的文件？
日志应该按天或者按周、按月来记，超过一定大小就新建一个文件

应该分成多个文件

我们公司的行为日志，一天6G

如果用shell怎么写啊，求达人，没有也很感谢大家

后来呢？怎么解决了嘛？？

我用的fgets读的文件，也不算大吧，150M的一个csv文件，18秒钟，用fgets按行读的话（已知不会出现很长的行），需不需要再用fseek来设定文件指针？可以提高效率吗？

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7480

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PHP의 컬 : REST API에서 PHP Curl Extension 사용 방법 Mar 14, 2025 am 11:42 AM

PHP 클라이언트 URL (CURL) 확장자는 개발자를위한 강력한 도구이며 원격 서버 및 REST API와의 원활한 상호 작용을 가능하게합니다. PHP CURL은 존경받는 다중 프로모토콜 파일 전송 라이브러리 인 Libcurl을 활용하여 효율적인 execu를 용이하게합니다.

ALIPAY PHP SDK 전송 오류 : '클래스 부호 데이터를 선언 할 수 없음'의 문제를 해결하는 방법은 무엇입니까? Apr 01, 2025 am 07:21 AM

Alipay PHP ...

Codecanyon에서 12 개의 최고의 PHP 채팅 스크립트 Mar 13, 2025 pm 12:08 PM

고객의 가장 긴급한 문제에 실시간 인스턴트 솔루션을 제공하고 싶습니까? 라이브 채팅을 통해 고객과 실시간 대화를 나누고 문제를 즉시 해결할 수 있습니다. 그것은 당신이 당신의 관습에 더 빠른 서비스를 제공 할 수 있도록합니다.

PHP에서 늦은 정적 결합의 개념을 설명하십시오. Mar 21, 2025 pm 01:33 PM

기사는 PHP 5.3에 도입 된 PHP의 LSB (Late STATIC BING)에 대해 논의하여 정적 방법의 런타임 해상도가보다 유연한 상속을 요구할 수있게한다. LSB의 실제 응용 프로그램 및 잠재적 성능

JWT (JSON Web Tokens) 및 PHP API의 사용 사례를 설명하십시오. Apr 05, 2025 am 12:04 AM

JWT는 주로 신분증 인증 및 정보 교환을 위해 당사자간에 정보를 안전하게 전송하는 데 사용되는 JSON을 기반으로 한 개방형 표준입니다. 1. JWT는 헤더, 페이로드 및 서명의 세 부분으로 구성됩니다. 2. JWT의 작업 원칙에는 세 가지 단계가 포함됩니다. JWT 생성, JWT 확인 및 Parsing Payload. 3. PHP에서 인증에 JWT를 사용하면 JWT를 생성하고 확인할 수 있으며 사용자 역할 및 권한 정보가 고급 사용에 포함될 수 있습니다. 4. 일반적인 오류에는 서명 검증 실패, 토큰 만료 및 대형 페이로드가 포함됩니다. 디버깅 기술에는 디버깅 도구 및 로깅 사용이 포함됩니다. 5. 성능 최적화 및 모범 사례에는 적절한 시그니처 알고리즘 사용, 타당성 기간 설정 합리적,