この記事は WeChat 公開アカウント「情報時代に生きる」から転載したものであり、著者は情報時代に生きています。この記事を転載するには、情報時代の暮らしの公開アカウントまでご連絡ください。
畳み込みニューラル ネットワーク (CNN) は特別なディープ フィードフォワード ネットワークであり、通常、データ入力層、畳み込み層、活性化層、ダウンサンプリング層が含まれます。接続されたレイヤー。
#畳み込み層は畳み込みニューラル ネットワークの重要な単位であり、一連のフィルタリング データで構成されます。コンボリューションカーネルの重み付けは、画像の局所領域とコンボリューションカーネルの重み付けの重み付け和の線形重ね合わせ処理です。画像 I が入力として使用され、2 次元コンボリューション カーネル K がコンボリューションに使用されます。コンボリューション プロセスは次のように表現できます:
このうち、I(i,j) は位置 (i,j) の画像の値、S(i,j) は畳み込み演算後に得られる特徴マップです。
アクティベーション畳み込み演算は線形であり、線形マッピングのみを実行でき、表現能力は限られています。したがって、非線形写像問題に対処するには、非線形活性化関数を導入する必要があります。さまざまな非線形問題に対処するために、導入される活性化関数も異なります。一般的に使用されるのは、sigmoid、tanh、relu などです。
#シグモイド関数の式は次のとおりです:
全結合層は通常、畳み込みニューラル ネットワークの最後に配置され、層間のすべてのニューロンには重み付けされた接続があります。目的は、ネットワークで学習されたすべての特徴をサンプルのラベル空間にマッピングしてカテゴリを判断することです。 Softmax 関数は通常、分類器の出力としてニューラル ネットワークの最後の層で使用され、softmax 関数によって出力される各値の範囲は (0, 1) です。
VGGNet、ResNet、AlexNet など、画像認識の分野で広く使用されている古典的で効率的な CNN モデルがいくつかあります。
以上が画像認識: 畳み込みニューラル ネットワークの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。