重複排除-PHPチュートリアル-php.cn

ディスカッションへの返信(解決策)

ホームページ

バックエンド開発

PHPチュートリアル

重複排除

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 23, 2016 pm 02:18 PM

数十万行のデータを含むファイルがあります。。。繰り返し方。。。大文字と小文字が同じ数字は 1 つだけ数えられます。。

ディスカッションへの返信(解決策)

行の概念とは何ですか?
1 行あたり 100 文字ある場合、200,000 行はわずか 20~60M です

array_unique
でファイルを読み込んで書き戻します

十分なスペースがないと思われる場合は
一行ずつ読み込んで、MD5 を見つけて、保存します (平均行長が 32 未満の場合、より多くのメモリを占有します)
同時にファイルを書き込みます
特定の行の MD5 が既に存在する場合、この行は書き込まれません

ファイル構造はどのようなものですか?段落を投稿してください。Buzhu が問題の解決に役立つと思います。

これは php を必要とせず、Linux シェルツールを使用した方が速いと思います

たとえば

cat file | sort -u > file

もしまだ case の問題を考慮する必要がある場合は、 add - 上記のコマンドに直接 - f は大文字と小文字を無視します

cat file | sort -u -f >

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7489

CakePHP チュートリアル

1377

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

PHPのカール：REST APIでPHPカール拡張機能を使用する方法 Mar 14, 2025 am 11:42 AM

PHPクライアントURL（CURL）拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Alipay PHP SDK転送エラー：「クラスの看板を宣言できない」という問題を解決する方法は？ Apr 01, 2025 am 07:21 AM

Alipay Php ...

PHPにおける後期静的結合の概念を説明します。 Mar 21, 2025 pm 01:33 PM

記事では、PHP 5.3で導入されたPHPの後期静的結合（LSB）について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

JSON Web Tokens（JWT）とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。