完全畳み込みニューラル ネットワーク (FCN) では、基本的に層ごとにランダムな重みの初期化が行われます。注意すべき点が 2 つあります。
完全畳み込みニューラル ネットワーク (FCN) は、バックプロパゲーション中に重みとして 0 を使用しません。これは、中間層の勾配 dL/dX を計算する際、重みを 0 に設定すると勾配が 0 になり、ネットワークの更新に失敗するためです。したがって、FCN は通常、勾配の効率的な計算と更新を保証するためにゼロ以外の重みを使用します。
完全畳み込みニューラル ネットワーク (FCN) のすべての重みを初期化するために単一の定数を使用することを避けるために、いくつかのより複雑なメソッドを使用できます。一般的なアプローチは、重みをランダムな 10 進数値に初期化するランダム初期化を使用することです。このようにして、各ニューロンはトレーニング プロセス中に異なる初期値を持つことになり、ネットワークの重みがより豊富な構造になります。もう 1 つの方法は、事前にトレーニングされた重みを使用することです。つまり、他のタスクでトレーニングされた重みを初期値として使用します。これにより、以前の知識を活用してネットワークのトレーニング プロセスを高速化できます。これらの方法を組み合わせて使用することで、入力データの複雑な分布をより深く理解し、ネットワークのパフォーマンスを向上させることができます。
tanh を例とした損失関数もありますが、活性化関数として Tanh を使用する場合は、重みの初期化に注意する必要があります。重みの初期化が大きすぎる場合、ネットワークの各層の出力は徐々に 1 または -1 に近づきます。ただし、重みの初期化が小さすぎる場合、各層の出力は徐々に 0 に近づきます。どちらの状況でも、勾配消失の問題が発生する可能性があります。したがって、この問題を解決するには、適切な重み初期化方法が必要です。
この問題を解決するために、各レイヤーの重みを初期化して変更を維持する方法があればと考えています。簡単に言うと、各レイヤーの入力の変更が出力の変更と一致するようにしたいのです。
以上が完全畳み込みニューラル ネットワークにおける重み初期化の適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。