0.0.0.0: 21 | OK |
|
この表は、socketA が表内の対応するアドレスに正常にバインドされ、次にソケット B が初期化され、その SO_REUSEADDR 設定が表の最初の列に示されているとおりであることを前提としています。その後、socketB が表内の対応するアドレスのバインドを試みます。 Result 列は、そのバインディングの結果です。最初の列の値が ON/OFF の場合、SO_REUSEADDR が設定されているかどうかは結果に関係ありません。
ワイルドカード IP アドレスに対する SO_REUSEADDR の役割については上で説明しましたが、この役割だけではありません。もう 1 つの役割は、サーバー側プログラミングを行うときに誰もが SO_REUSEADDR オプションを使用する理由です。その他の役割とその重要な用途を理解するには、まず TCP プロトコルがどのように機能するかについてより深く議論する必要があります。
各ソケットには対応する送信バッファがあります。 send() メソッドが正常に呼び出された場合、実際には、送信する必要があるデータは必ずしもすぐに送信されるわけではなく、送信バッファーに追加されます。 UDP ソケットの場合、データはすぐに送信されない場合でも、通常はすぐに送信されます。ただし、TCP ソケットの場合、送信バッファにデータを追加した後、データが実際に送信されるまでに比較的長い時間がかかることがあります。したがって、TCP ソケットを閉じると、実際には送信バッファ内に送信を待っているデータがまだ存在する可能性があります。ただし、この時点では、send() が成功を返すため、コードはデータが実際に正常に送信されたとみなします。 close() を呼び出した直後に TCP ソケットが閉じられた場合、このデータはすべて失われ、コードはそれを認識することはありません。ただし、TCP は信頼性の高いトランスポート層プロトコルであり、送信されるデータを直接破棄することは明らかに推奨されません。実際、送信バッファに送信するデータがまだあるときにソケットの close() メソッドが呼び出される場合、いわゆる TIME_WAIT 状態に入ります。この状態では、ソケットはすべてのデータが正常に送信されるまで、またはタイムアウトが発生するとソケットが強制的に閉じられるまで、バッファ内のデータの送信を試行し続けます。
ソケットを強制的に閉じるまでのオペレーティング システムのカーネルの最大待機時間は、リンガー タイムと呼ばれます。遅延時間はほとんどのシステムでグローバルに設定されており、比較的長くなります (ほとんどのシステムでは 2 分に設定されています)。ソケットを初期化するときに SO_LINGER オプションを使用して、各ソケットの遅延時間を具体的に設定することもできます。遅延待機を完全にオフにすることもできます。ただし、遅延時間を 0 に設定する (遅延待機を完全にオフにする) ことは、良いプログラミング方法ではないことに注意してください。 TCP ソケットを正常に閉じることは、リモート ホストとの複数のデータ パケットの交換 (パケット損失の場合の損失再送信を含む) を含む比較的複雑なプロセスであり、このデータ パケット交換プロセスに必要な時間も遅延時間に含まれるためです。 。遅延待機を無効にすると、ソケットは閉じられるときに送信されるすべてのデータを破棄するだけでなく、常に強制的に閉じられます (TCP は接続指向のプロトコルであるため、閉じているパケットをリモート ポートと交換しないと、リモート ポートは長い待機状態にあります)。したがって、通常、実際のプログラミングでこれを行うことはお勧めしません。 TCP 切断のプロセスはこの記事の範囲外です。興味がある場合は、このページを参照してください。実際、遅延待機を無効にし、明示的にソケットを閉じずにプログラムが終了した場合、BSD (および場合によっては他のシステム) は設定を無視して遅延待機を実行します。たとえば、プログラムが exit() メソッドを呼び出した場合、またはそのプロセスがシグナルを使用して終了された場合 (不正なメモリ アクセスなどによるプロセスのクラッシュを含む)。したがって、あらゆる状況において、遅延待ち時間に関係なくソケットが終了することを 100% 保証することはできません。
ここでの問題は、オペレーティング システムが TIME_WAIT ステージでソケットをどのように扱うかです。 SO_REUSEADDR オプションが設定されていない場合、TIME_WAIT フェーズのソケットは依然として元のアドレスとポートにバインドされているとみなされます。ソケットが完全に閉じられる (TIME_WAIT フェーズが終了する) まで、新しいソケットをこのアドレスとポートのペアにバインドしようとする他の試みは成功しません。この待機は、遅延された待機と同じ長さになる場合があります。したがって、閉じられたばかりのソケットに対応するアドレスとポートのペアに新しいソケットをすぐにバインドすることはできません。ほとんどの場合、この操作は失敗します。
ただし、新しいソケットに SO_REUSEADDR オプションを設定した場合、現在のアドレス ポート ペアにバインドされている別のソケットがあり、TIME_WAIT ステージにある場合、この既存のバインド関係は無視されます。実際、TIME_WAIT ステージのソケットはすでにセミクローズされており、新しいソケットをこのアドレスとポートのペアにバインドしても問題はありません。この場合、このポートにバインドされている元のソケットは通常、新しいソケットに影響を与えません。ただし、ある時点で、TIME_WAIT ステージにあるもののまだ動作しているソケットに対応するアドレス ポート ペアに新しいソケットをバインドすると、意図しない予測できない悪影響が生じる可能性があることに注意してください。しかし、この問題はこの記事の範囲を超えています。そして幸いなことに、これらの悪影響は実際にはほとんど見られません。
最後に、SO_REUSEADDR について注意する必要があるのは、新しいソケットに SO_REUSEADDR を設定している限り、上記のすべてが当てはまるということです。現在のアドレスとポートのペアにバインドされている元のソケットに関しては、TIME_WAIT ステージのソケットに SO_REUSEADDR が設定されているかどうかは影響しません。バインド操作が成功したかどうかを判断するコードは、bind() メソッドに渡された新しいソケットの SO_REUSEADDR オプションをチェックするだけです。関連する他のソケットの SO_REUSEADDR オプションはチェックされません。
SO_REUSEPORT
多くの人が SO_REUSEADDR を SO_REUSEPORT と間違えています。基本的に、SO_REUSEPORT を使用すると、以前にバインドされたすべてのソケットに SO_REUSEPORT オプションが設定されている限り、任意の数のソケットをまったく同じソース アドレスとポートのペアにバインドできます。アドレスとポートのペアにバインドされた最初のソケットに SO_REUSEPORT が設定されていない場合、後続のソケットが SO_REUSEPORT を設定しているかどうかに関係なく、このアドレス ポートとまったく同じアドレスにバインドすることはできません。このアドレスとポートのペアにバインドされた最初のソケットがバインド関係を解放しない限り。 SO_REUSEADDR とは異なり、SO_REUSEPORT を処理するコードは、現在バインドしようとしているソケットの SO_REUSEPORT をチェックするだけでなく、現在バインドしようとしているアドレス ポート ペアに以前にバインドされていたソケットの SO_REUSEPORT オプションもチェックします。
SO_REUSEPORT は SO_REUSEADDR と等しくありません。これが意味するのは、すでにバインドされたアドレスを持つソケットに SO_REUSEPORT が設定されておらず、別の新しいソケットに SO_REUSEPORT が設定されていて、現在のソケットとまったく同じポート アドレスのペアにバインドしようとした場合、バインドの試行は失敗するということです。同時に、現在のソケットがすでに TIME_WAIT ステージにあり、SO_REUSEPORT オプションが設定された新しいソケットが現在のアドレスにバインドしようとすると、バインド操作も失敗します。現在 TIME_WAIT フェーズにあるソケットに対応するアドレス ポート ペアに新しいソケットをバインドするには、バインドする前に新しいソケットの SO_REUSEADDR オプションを設定するか、バインドする前に両方のソケットに SO_REUSEADDR オプションを設定する必要があります。オプション。もちろん、ソケットの SO_REUSEADDR オプションと SO_REUSEPORT オプションを同時に設定することも可能です。
SO_REUSEPORT は、SO_REUSEADDR の後に BSD システムに追加されました。これが、現在一部のシステムのソケット実装に SO_REUSEPORT オプションがない理由です。このオプションが BSD システムに追加される前に、BSD ソケット実装を参照していたためです。このオプションが追加される前は、BSD システムでは 2 つのソケットをまったく同じアドレスとポートのペアにバインドする方法はありませんでした。
Connect() は EADDRINUSE を返しますか?
bind() 操作が EADDRINUSE エラーを返す場合があります。しかし、奇妙なことに、connect() オペレーションを呼び出すと、EADDRINUSE エラーも発生する可能性があります。どうしてこれなの?現在のポートで接続を確立しようとしているリモート アドレスも占有されているのはなぜですか?複数のソケットを同じリモート アドレスに接続する場合に問題は発生しますか?
以前この記事でも触れましたが、接続関係は5倍で決まります。あらゆる接続関係において、この 5 つ組は一意である必要があります。そうしないと、システムは 2 つの接続を区別できなくなります。アドレスの再利用を使用すると、同じプロトコルを使用して 2 つのソケットを同じアドレスとポートのペアにバインドできます。これは、これら 2 つのソケットについて、5 つのタプル {, , } がすでに同じであることを意味します。この場合、両方を同じリモート アドレス ポートに接続しようとすると、2 つの接続関係の 5 タプルはまったく同じになります。つまり、2 つの同一の接続が生成されます。これは TCP プロトコルでは許可されません (UDP はコネクションレスです)。これら 2 つの同一の接続のいずれかがデータを受信した場合、システムはデータがどの接続に属しているかを判断できません。したがって、この場合、少なくとも 2 つのソケットが接続しようとしているリモート ホストのアドレスとポートは同じであってはなりません。この方法でのみ、システムは 2 つの接続関係を区別し続けることができます。
同じプロトコルを使用して 2 つのソケットを同じローカル アドレスとポートのペアにバインドし、それらを同じ宛先アドレスとポートのペアに接続しようとすると、2 番目のソケットは connect() メソッドを呼び出そうとします。 EADDRINUSE エラーが報告されます。これは、まったく同じ 5 タプルを持つソケットがすでに存在していることを意味します。
マルチキャストアドレス
1対1の通信に使用されるユニキャストアドレスに対して、マルチキャストアドレスは1対多の通信に使用されます。 IPv4 と IPv6 の両方にマルチキャスト アドレスがあります。ただし、IPv4 のマルチキャストがパブリック ネットワークで使用されることはほとんどありません。
マルチキャストアドレスの場合、SO_REUSEADDRの意味がこれまでとは異なります。この場合、SO_REUSEADDR を使用すると、複数のソケットをまったく同じソース ブロードキャスト アドレスとポートのペアにバインドできます。つまり、マルチキャスト アドレスの場合、SO_REUSEADDR はユニキャスト通信の SO_REUSEPORT に相当します。実際、マルチキャストの場合、SO_REUSEADDR と SO_REUSEPORT はまったく同じ効果があります。
FreeBSD/OpenBSD/NetBSD
これらのシステムはすべて、新しいネイティブ BSD システム コードを参照しています。したがって、これら 3 つのシステムは BSD とまったく同じソケット オプションを提供し、これらのオプションの意味はネイティブ BSD とまったく同じです。
MacOS X
MacOSのコアコードの実装は同じです。
iOS
iOS は実際には MacOS X にわずかに変更を加えたものなので、MacOS X で動作するものは iOS でも動作します。
Linux
Linux3.9 より前には、SO_REUSEADDR オプションのみが存在しました。このオプションの機能は基本的に BSD システムでの機能と同じです。しかし、まだ 2 つの重要な違いがあります。
最初の違いは、リスニング (サーバー) 状態の TCP ソケットがワイルドカード IP アドレスと特定のポートにバインドされている場合、これら 2 つのソケットに SO_REUSEADDR オプションが設定されているかどうかに関係なく、他の TCP ソケットをバインドできることです。同じポートにバインドされなくなります。これは、他のソケットが (BSD システムで許可されている) 特定の IP アドレスを使用している場合でも機能しません。非リッスン (クライアント) TCP ソケットにはこの制限はありません。
2 番目の違いは、UDP ソケットの場合、SO_REUSEADDR が BSD の SO_REUSEPORT と同じ機能を持つことです。したがって、2 つの UDP ソケットに SO_REUSEADDR が設定されている場合、それらはまったく同じアドレスとポートのペアのセットにバインドできます。
Linux3.9 では SO_REUSEPORT オプションが追加されています。ポートの下でアドレスをバインドする前に、すべてのソケット (最初のソケットを含む) にこのオプションが設定されている限り、2 つ以上の TCP または UDP、リスニング (サーバー) または非リスニング (クライアント) ソケットをまったく同じアドレスにバインドできます。組み合わせ。同時に、ポートのハイジャックを防ぐために、同じアドレスとポートの組み合わせにバインドしようとするすべてのソケットは、同じユーザー ID を持つプロセスに属している必要があるという特別な制限があります。したがって、あるユーザーが別のユーザーからポートを「盗む」ことはできません。
さらに、SO_REUSEPORT オプションが設定されたソケットの場合、Linux カーネルは、他のシステムにはないいくつかの特別な操作も実行します。同じアドレスとポートの組み合わせにバインドされている UDP ソケットの場合、カーネルはそれらの間で接続を試みます。受信したデータ パケット。同じアドレスとポートの組み合わせにバインドされている TCP リスニング ソケットの場合、カーネルは受信した接続要求 (accept() メソッドを呼び出して取得した要求) をそれらの間で均等に分散しようとします。これは、アドレスの再利用を許可しながら、受信したパケットまたは接続リクエストを同じアドレスとポートの組み合わせに接続されたソケットにランダムに割り当てる他のシステムと比較して、Linux はトラフィック分散の最適化を試みることを意味します。たとえば、単純なサーバー プロセスのいくつかの異なるインスタンスは、SO_REUSEPORT を簡単に使用して単純な負荷分散を実装できます。カーネルはこの負荷分散を担当し、プログラムにとっては完全に無料です。
Android
Android のコア部分は少し変更された Linux カーネルであるため、Linux で動作するものはすべて Android でも動作します。
Windows
Windows には SO_REUSEADDR オプションのみがあります。 Windows でソケットに SO_REUSEADDR を設定すると、BSD でソケットに SO_REUSEPORT と SO_REUSEADDR を同時に設定するのと同じ効果があります。ただし、違いは、バインドされたアドレスを持つ別のソケットに SO_REUSEADDR が設定されていない場合でも、SO_REUSEADDR が設定されているソケットは、別のバインドされたソケットとまったく同じアドレスとポートの組み合わせに常にバインドできることです。この行為はある意味危険であると言えます。それは、あるアプリケーションが、接続されたポートへの別の参照からデータを盗むことができるからです。 Microsoft はこの問題を認識しており、別のソケット オプション SO_EXCLUSIVEADDRUSE を追加しました。ソケットに SO_EXCLUSIVEADDRUSE を設定すると、ソケットがアドレスとポートの組み合わせにバインドされると、SO_REUSEADDR が設定されているかどうかに関係なく、他のソケットは現在のアドレスとポートの組み合わせにバインドできなくなります。
Solaris
Solaris は SunOS の後継です。 SunOS は、ある程度、BSD の以前のバージョンから派生したものでもあります。したがって、Solaris は SO_REUSEADDR のみを提供しており、そのパフォーマンスは基本的に BSD システムと同じです。私の知る限り、SO_REUSEPORT と同じ機能は Solaris システムでは実装できません。これは、Solaris では、2 つのソケットをまったく同じアドレスとポートの組み合わせにバインドできないことを意味します。
Windows と同様に、Solaris もソケットの排他的バインディング オプション SO_EXCLBIND を提供します。ソケットがアドレスをバインドする前にこのオプションを設定すると、他のソケットは、たとえ SO_REUSEADDR が設定されていたとしても、同じアドレスにバインドできなくなります。たとえば、socketA がワイルドカード IP アドレスにバインドされ、socketB が SO_REUSEADDR に設定され、特定の IP アドレスとソケット A と同じポートの組み合わせにバインドされている場合、socketA が SO_EXCLBIND に設定されていない場合、この操作は成功します。それ以外の場合は、この操作は成功します。失敗。
参照:
http://stackoverflow.com/a/14388707/6037083