php读取大文件的一点疑问
我要分析一个6G的log文件,比对每行文件是否符合我的要求,程序如下
$file_path = 'd:\work\workplace\test\file\system.log';$file = fopen($file_path, 'r');$key = md5(0);$i = 1;while (!feof($file)) { $buff = fgets($file); if ($buff == $key . "\r\n") { echo "find 0 at Line {$i}\r\n"; } $i ++;}fclose($file);
我想问下这样性能怎么样吗,不会出现内存泄露或其他问题吧,还有进一步优化的方法吗?
回复讨论(解决方案)
你需要先将这个文件分割成若干个小文件
然后循环读取每个小文件即可!
linux 下 $ split -b
分割···
linux 下 $ split -b
分割···
为什么要分割啊,用fgets不是每次只去一行,并没有把文件都读取进内存啊
我建议你用fgets时最好制定读取的字符数,不要一行一行的读,6G的文件说不定某一行会很长!
现在可以肯定每一行不会很长,应为日志是按规定格式存取的
哦,那你看着办吧!呵呵,我只是建议!
哦,那你看着办吧!呵呵,我只是建议!
我的确也看到有的人像你那样做,但是如果不是一下子读入内存,应该不比那样吧,切割文件和删除临时文件还有消耗,这是我个人感觉,有不对的情指出
6G的文本文件……
你咋能整这么大的文件?
日志应该按天或者按周、按月来记,超过一定大小就新建一个文件
应该分成多个文件
6G的文本文件……
你咋能整这么大的文件?
日志应该按天或者按周、按月来记,超过一定大小就新建一个文件
应该分成多个文件
我们公司的行为日志,一天6G
可以,没有问题。就是很费时间
仅就代码而言,可以缩减一点
$file_path = 'd:\work\workplace\test\file\system.log';
$file = fopen($file_path, 'r');
$key = md5(0);
$i = 1;
while ($buff = fgets($file)) {
if ($buff == $key . "\r\n")
{
echo "find 0 at Line {$i}\r\n";
}
$i ++;
}
fclose($file);
如果一次读取的多一点(比如1M)可能要快一点。不过算法要复杂些
做这种东西,不是php的长项
要不搞WEB的话,还是换其它程序搞吧。
引用 9 楼 baiyuxiong 的回复:
6G的文本文件……
你咋能整这么大的文件?
日志应该按天或者按周、按月来记,超过一定大小就新建一个文件
应该分成多个文件
我们公司的行为日志,一天6G
如果用shell怎么写啊,求达人,没有也很感谢大家
后来呢?怎么解决了嘛??
我用的fgets读的文件,也不算大吧,150M的一个csv文件,18秒钟,用fgets按行读的话(已知不会出现很长的行),需不需要再用fseek来设定文件指针?可以提高效率吗?

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

La journalisation PHP est essentielle pour surveiller et déboguer les applications Web, ainsi que pour capturer des événements critiques, des erreurs et un comportement d'exécution. Il fournit des informations précieuses sur les performances du système, aide à identifier les problèmes et prend en charge le dépannage plus rapide

Laravel simplifie la gestion des données de session temporaires à l'aide de ses méthodes de flash intuitives. Ceci est parfait pour afficher de brefs messages, alertes ou notifications dans votre application. Les données ne persistent que pour la demande ultérieure par défaut: $ demande-

L'extension PHP Client URL (CURL) est un outil puissant pour les développeurs, permettant une interaction transparente avec des serveurs distants et des API REST. En tirant parti de Libcurl, une bibliothèque de transfert de fichiers multi-protocol très respectée, PHP Curl facilite Efficient Execu

Laravel fournit une syntaxe de simulation de réponse HTTP concise, simplifiant les tests d'interaction HTTP. Cette approche réduit considérablement la redondance du code tout en rendant votre simulation de test plus intuitive. L'implémentation de base fournit une variété de raccourcis de type de réponse: Utiliser illuminate \ support \ faades \ http; Http :: faux ([[ 'google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>

Voulez-vous fournir des solutions instantanées en temps réel aux problèmes les plus pressants de vos clients? Le chat en direct vous permet d'avoir des conversations en temps réel avec les clients et de résoudre leurs problèmes instantanément. Il vous permet de fournir un service plus rapide à votre personnalité

Alipay Php ...

L'article traite de la liaison statique tardive (LSB) dans PHP, introduite dans PHP 5.3, permettant une résolution d'exécution de la méthode statique nécessite un héritage plus flexible. Problème main: LSB vs polymorphisme traditionnel; Applications pratiques de LSB et perfo potentiel

L'article examine l'ajout de fonctionnalités personnalisées aux cadres, en se concentrant sur la compréhension de l'architecture, l'identification des points d'extension et les meilleures pratiques pour l'intégration et le débogage.
