怎么统计一个2G大小文件里每个单词的出现频率
初学新手菜鸡 遇到一个问题,统计一个2G大小文件中每个单词的出现频率,修改memory limit后还是总报错 Allowed memory size of xxxx bytes exhausted ,光测总行数或者字符数可以出结果,怎样优化呢
ini_set("memory_limit", "-1");function calcWordFrequence($sFilePatch){ $aWordsInFile = array(); $aOneLineWords = array(); $sOneLineWords = ""; $fp = fopen($sFilePatch,"r"); while(!feof($fp)){ $sOneLineWords = fgets($fp); $aOneLineWords = str_word_count($sOneLineWords,1); foreach($aOneLineWords as $v){ array_push($aWordsInFile, $v); } } fclose($fp); $aRes = array_count_values($aWordsInFile); arsort($aRes); return $aRes;}echo calcWordFrequence("2013.mp4");
回复讨论(解决方案)
这个问题没法解决,2G大小的文件硬件差点的电脑打开就耗光内存了。在存储上做分布式设计。
这个问题没法解决,2G大小的文件硬件差点的电脑打开就耗光内存了。在存储上做分布式设计。
那有办法从代码里将这个文件分离成几部分分批统计吗或者只输出频率最大的那个单词也行
使用split命令把文件切割成小文件再统计吧
只有文本文件才有行的概念
你测试的 2013.mp4 显然不是文本文件
如果文件中没有出现 \n,或出现的靠后,你的 $sOneLineWords = fgets($fp); 就会把内存消耗光了
如果你是日志之类的文本文件,可以用php的SplFileObject()类,专门用于操作大文件,以前用过这个分析nginx的访问日志,5个多G。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

长URL(通常用关键字和跟踪参数都混乱)可以阻止访问者。 URL缩短脚本提供了解决方案,创建了简洁的链接,非常适合社交媒体和其他平台。 这些脚本对于单个网站很有价值

在Facebook在2012年通过Facebook备受瞩目的收购之后,Instagram采用了两套API供第三方使用。这些是Instagram Graph API和Instagram Basic Display API。作为开发人员建立一个需要信息的应用程序

Laravel使用其直观的闪存方法简化了处理临时会话数据。这非常适合在您的应用程序中显示简短的消息,警报或通知。 默认情况下,数据仅针对后续请求: $请求 -

这是有关用Laravel后端构建React应用程序的系列的第二个也是最后一部分。在该系列的第一部分中,我们使用Laravel为基本的产品上市应用程序创建了一个RESTFUL API。在本教程中,我们将成为开发人员

Laravel 提供简洁的 HTTP 响应模拟语法,简化了 HTTP 交互测试。这种方法显着减少了代码冗余,同时使您的测试模拟更直观。 基本实现提供了多种响应类型快捷方式: use Illuminate\Support\Facades\Http; Http::fake([ 'google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>

PHP客户端URL(curl)扩展是开发人员的强大工具,可以与远程服务器和REST API无缝交互。通过利用Libcurl(备受尊敬的多协议文件传输库),PHP curl促进了有效的执行

您是否想为客户最紧迫的问题提供实时的即时解决方案? 实时聊天使您可以与客户进行实时对话,并立即解决他们的问题。它允许您为您的自定义提供更快的服务

2025年的PHP景观调查调查了当前的PHP发展趋势。 它探讨了框架用法,部署方法和挑战,旨在为开发人员和企业提供见解。 该调查预计现代PHP Versio的增长
