数十万行のデータを含むファイルがあります。 。 。繰り返し方。 。 。大文字と小文字が同じ数字は 1 つだけ数えられます。 。
行の概念とは何ですか?
1 行あたり 100 文字ある場合、200,000 行はわずか 20~60M です
array_unique
でファイルを読み込んで書き戻します
十分なスペースがないと思われる場合は
一行ずつ読み込んで、MD5 を見つけて、保存します (平均行長が 32 未満の場合、より多くのメモリを占有します)
同時にファイルを書き込みます
特定の行の MD5 が既に存在する場合、この行は書き込まれません
これは php を必要とせず、Linux シェル ツールを使用した方が速いと思います
たとえば
cat file | sort -u > file
cat file | sort -u -f >