リバーストライを使用して使い捨て電子メールドメインを高速に検出する方法-jsチュートリアル-php.cn

ホームページ

ウェブフロントエンド

jsチュートリアル

リバーストライを使用して使い捨て電子メールドメインを高速に検出する方法

DDD

Dec 14, 2024 am 03:42 AM

How to Use a Reverse Trie for Fast Disposable Email Domain Detection

逆トライを使用して使い捨て電子メールドメインを効率的に検出する方法を学びます。高速で正確な結果を得るために調整された、スケーラブルでメモリ効率の高いソリューションを使用してドメイン検索を最適化します。

私のウェブサイトで記事を読む
無料の使い捨て電子メールドメイン検出ツールを使用する

使い捨てメールは、偽のサインアップやスパムなどの問題を引き起こす可能性があります。ユーザーは、何千もの一時的な電子メールジェネレーターの 1 つからアドレスを取得し、それを渡します。電子メール正規表現の GOAT でも、ここからは救われません。

個人的には、すべての使い捨て電子メールドメインの大きなリストを作成することが、最も簡単で効果的な解決策だと思います。ただし、そのリストを組み立てて for ... of ループを開始してそれをチェックする前に、O(n) の複雑さについて考えてください!

それらを識別する優れた方法は、高速検索のための効率的なデータ構造である逆トライを使用することです。

リバーストライとは何ですか?

まず、トライとは何かを理解しましょう。これは、文字列が次のようなデータ構造です:

みじん切り、チャーごと
ツリー構造で組み立てられています

例として、ボア、ブロ、ブリーに餌を与える場合、Map を使用して次のように組み立てられます。

b
 ├── o ── a
 └── r ── o  
     └─── i ── e

ログイン後にコピー

このアプローチにより、リスト全体を循環することなく直接検索が可能になります。それぞれのキャラクターが探索をさらに深く導きます。

効率性のためにメモリを犠牲にします。文字列の検索にかかる時間は、リストのサイズではなく、文字列の長さに依存します!

リバーストライは、文字列を逆の順序で保存します。これはドメインに最適です。

mailinator.com が moc.rotanliam になります
trashmail.com が moc.liambhsart になります

この実装に関する注意事項

ドメインを反転すると、多くのドメイン間で共有される TLD (例: .com) から検索が開始されます。さらに最適化するために、TLD を文字に分割するのではなく、単一のキー (com) として保存します。ドメインの残りの部分は、標準の Trie 構造に従います。

リバーストライドメインの実装

これはツリー構造であるため、各ノードはその子を参照します。

type TrieNode = Map<string, TrieNode>;

ログイン後にコピー

まず、ドメインの残りの部分から TLD を分割するユーティリティ関数:

private splitTLDFromRest(input: string) {
    const dot = input.lastIndexOf('.');
    const TLD = input.substring(dot + 1);
    const rest = input.substring(0, dot);
    return [TLD, rest];
}

ログイン後にコピー

lastIndexOf を使用すると、foo.bar.baz.com などのサブドメインが正しく処理されます。

次に、コンストラクターはトライをアセンブルします。

export class ReverseTrieDomains {
    private root: TrieNode = new Map();

    // ...

    constructor(...domains: string[]) {
        for (const domain of domains) {
            // For "didof.dev"
            const [TLD, rest] = this.splitTLDFromRest(domain);
            // dev, didof

            // Keep the refence to the TLD node for final set
            let node = this.root.get(TLD);
            if (!node) node = new Map();

            // Start from TLD node, walk along the string in reverse
            let currentNode: TrieNode = node;
            for (let i = rest.length - 1; i >= 0; i--) {
                const char = rest[i];
                let childNode = currentNode.get(char);
                if (!childNode) {
                    childNode = new Map();
                    currentNode.set(char, childNode);
                }
                currentNode = childNode;
            }

            this.root.set(TLD, node);
        }
    }
}

ログイン後にコピー

ドメインが使い捨てかどうかを確認するには、トライを走査します。

export class ReverseTrieDomains {
    // ...

    public has(domain: string) {
        const [TLD, rest] = this.splitTLDFromRest(domain)

        const node = this.root.get(TLD)
        if (!node) return false

        let currentNode: TrieNode = node
        let isFullDomainFound = false
        for (let i = rest.length - 1; i >= 0; i--) {
            const char = rest[i]
            const childNode = currentNode.get(char)
            if (!childNode) return false
            currentNode = childNode
            if (i === 0) {
                isFullDomainFound = currentNode.size === 0;
            }
        }

        return isFullDomainFound
    }
}

ログイン後にコピー

結論

リバーストライを使用すると、次のような利点があります。

高速検索: 文字を段階的にたどって、迅速な結果を得ることができます。
メモリ効率: .com などの一般的なサフィックスは 1 回だけ保存されます。
スケーラビリティ: 大規模なドメインリストを簡単に処理します。

使い捨てメールを扱っている場合、これはスマートでスケーラブルなソリューションです。

以上がリバーストライを使用して使い捨て電子メールドメインを高速に検出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1669

CakePHP チュートリアル

1428

Laravel チュートリアル

1329

PHP チュートリアル

1273

C# チュートリアル

1256

Related knowledge

Python vs. JavaScript：学習曲線と使いやすさ Apr 16, 2025 am 12:12 AM

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

C/CからJavaScriptへ：すべてがどのように機能するか Apr 14, 2025 am 12:05 AM

C/CからJavaScriptへのシフトには、動的なタイピング、ゴミ収集、非同期プログラミングへの適応が必要です。 1）C/Cは、手動メモリ管理を必要とする静的に型付けられた言語であり、JavaScriptは動的に型付けされ、ごみ収集が自動的に処理されます。 2）C/Cはマシンコードにコンパイルする必要がありますが、JavaScriptは解釈言語です。 3）JavaScriptは、閉鎖、プロトタイプチェーン、約束などの概念を導入します。これにより、柔軟性と非同期プログラミング機能が向上します。

JavaScriptとWeb：コア機能とユースケース Apr 18, 2025 am 12:19 AM

Web開発におけるJavaScriptの主な用途には、クライアントの相互作用、フォーム検証、非同期通信が含まれます。 1）DOM操作による動的なコンテンツの更新とユーザーインタラクション。 2）ユーザーエクスペリエンスを改善するためにデータを提出する前に、クライアントの検証が実行されます。 3）サーバーとのリフレッシュレス通信は、AJAXテクノロジーを通じて達成されます。

JavaScript in Action：実際の例とプロジェクト Apr 19, 2025 am 12:13 AM

現実世界でのJavaScriptのアプリケーションには、フロントエンドとバックエンドの開発が含まれます。 1）DOM操作とイベント処理を含むTODOリストアプリケーションを構築して、フロントエンドアプリケーションを表示します。 2）node.jsを介してRestfulapiを構築し、バックエンドアプリケーションをデモンストレーションします。

JavaScriptエンジンの理解：実装の詳細 Apr 17, 2025 am 12:05 AM

JavaScriptエンジンが内部的にどのように機能するかを理解することは、開発者にとってより効率的なコードの作成とパフォーマンスのボトルネックと最適化戦略の理解に役立つためです。 1）エンジンのワークフローには、3つの段階が含まれます。解析、コンパイル、実行。 2）実行プロセス中、エンジンはインラインキャッシュや非表示クラスなどの動的最適化を実行します。 3）ベストプラクティスには、グローバル変数の避け、ループの最適化、constとletsの使用、閉鎖の過度の使用の回避が含まれます。

Python vs. JavaScript：コミュニティ、ライブラリ、リソース Apr 15, 2025 am 12:16 AM

PythonとJavaScriptには、コミュニティ、ライブラリ、リソースの観点から、独自の利点と短所があります。 1）Pythonコミュニティはフレンドリーで初心者に適していますが、フロントエンドの開発リソースはJavaScriptほど豊富ではありません。 2）Pythonはデータサイエンスおよび機械学習ライブラリで強力ですが、JavaScriptはフロントエンド開発ライブラリとフレームワークで優れています。 3）どちらも豊富な学習リソースを持っていますが、Pythonは公式文書から始めるのに適していますが、JavaScriptはMDNWebDocsにより優れています。選択は、プロジェクトのニーズと個人的な関心に基づいている必要があります。

Python vs. JavaScript：開発環境とツール Apr 26, 2025 am 12:09 AM

開発環境におけるPythonとJavaScriptの両方の選択が重要です。 1）Pythonの開発環境には、Pycharm、Jupyternotebook、Anacondaが含まれます。これらは、データサイエンスと迅速なプロトタイピングに適しています。 2）JavaScriptの開発環境には、フロントエンドおよびバックエンド開発に適したnode.js、vscode、およびwebpackが含まれます。プロジェクトのニーズに応じて適切なツールを選択すると、開発効率とプロジェクトの成功率が向上する可能性があります。

JavaScript通訳者とコンパイラにおけるC/Cの役割 Apr 20, 2025 am 12:01 AM

CとCは、主に通訳者とJITコンパイラを実装するために使用されるJavaScriptエンジンで重要な役割を果たします。 1）cは、JavaScriptソースコードを解析し、抽象的な構文ツリーを生成するために使用されます。 2）Cは、Bytecodeの生成と実行を担当します。 3）Cは、JITコンパイラを実装し、実行時にホットスポットコードを最適化およびコンパイルし、JavaScriptの実行効率を大幅に改善します。

See all articles

リバーストライを使用して使い捨て電子メールドメインを高速に検出する方法

リバーストライとは何ですか?

この実装に関する注意事項

リバーストライドメインの実装

結論

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック