Gated Recurrent Unit (GRU) ialah struktur penting dalam Recurrent Neural Network (RNN). Berbanding dengan RNN tradisional, GRU memperkenalkan mekanisme gating untuk menyelesaikan masalah kehilangan kecerunan dan letupan kecerunan dalam latihan dengan berkesan dengan mengawal aliran dan pengekalan maklumat. Ini memberikan GRU keupayaan yang lebih baik dalam memodelkan kebergantungan jangka panjang.
Struktur asas GRU mengandungi get kemas kini (z) dan get set semula (r), serta keadaan tersembunyi (h) dan unit memori (c). Gerbang kemas kini digunakan untuk mengawal tahap percampuran antara input baharu dan keadaan tersembunyi momen sebelumnya, dan get set semula digunakan untuk mengawal tahap pengaruh keadaan tersembunyi momen sebelumnya pada momen semasa. Melalui kawalan dinamik kedua-dua get ini, GRU merealisasikan pelarasan fleksibel aliran maklumat untuk menyesuaikan diri dengan urutan input dalam senario yang berbeza. GRU (Unit Berulang Berpagar) ialah varian rangkaian saraf berulang yang digunakan secara meluas dalam pemprosesan bahasa semula jadi dan tugas pemodelan jujukan. Berbanding dengan rangkaian neural berulang tradisional, GRU meningkatkan keupayaan pemodelan jujukan panjang dan mengurangkan masalah kecerunan lenyap dengan memperkenalkan get kemas kini dan get set semula. Gerbang kemas kini menentukan tahap percampuran antara input baharu dan keadaan tersembunyi momen sebelumnya Dengan mengawal aliran masuk dan keluar maklumat, ia boleh menangkap kebergantungan jangka panjang dalam jujukan dengan berkesan. Gerbang set semula mengawal kesan keadaan tersembunyi pada saat sebelumnya pada saat semasa Dengan melupakan sebahagian maklumat sejarah secara selektif, model lebih mudah disesuaikan
Secara khusus, proses pengiraan GRU boleh dibahagikan kepada yang berikut. langkah-langkah :
1 Kira get set semula: r_t=sigma(W_rcdot[h_{t-1},x_t]), dengan W_r ialah matriks parameter, sigma ialah fungsi sigmoid, dan h_{t-1} ialah saat sebelumnya Keadaan tersembunyi , x_t ialah input pada saat semasa.
2 Kira get kemas kini: z_t=sigma(W_zcdot[h_{t-1},x_t]), dengan W_z ialah matriks parameter.
3 Kira unit memori calon: tilde{c}_t=tanh(Wcdot[r_todot h_{t-1},x_t]), dengan odot ialah operasi pendaraban mengikut unsur dan W ialah matriks parameter.
4 Kemas kini unit memori: c_t=z_tcdot c_{t-1}+(1-z_t)cdottilde{c}_t, dengan c_{t-1} ialah unit memori pada saat sebelumnya, tilde{c } _t ialah unit memori calon.
5. Kemas kini status tersembunyi: h_t=tanh(c_t).
Selain struktur asas, GRU mempunyai beberapa penambahbaikan dan variasi. Antaranya, yang biasa termasuk:
1. LSTM-GRU: Gabungkan GRU dengan rangkaian ingatan jangka pendek panjang (LSTM), dan seterusnya mengawal pengekalan dan melupakan maklumat dengan menambah "gerbang lupa".
2.Zoneout-GRU: Memperkenalkan mekanisme "penyahaktifan wilayah" untuk mengekalkan secara rawak keadaan tersembunyi pada detik sebelumnya untuk meningkatkan keteguhan dan prestasi generalisasi model.
3.Variational-GRU: Dengan memperkenalkan hingar Gaussian, GRU ditukar menjadi pengekod auto variasi (VAE), dengan itu mencapai pengekodan dan penyahkodan automatik data serta dapat menjana sampel baharu.
4.Convolutional-GRU: Gabungkan GRU dengan rangkaian neural convolutional (CNN) untuk mengekstrak ciri tempatan jujukan input melalui operasi konvolusi, dan meningkatkan lagi prestasi dan kecekapan model.
Ringkasnya, GRU, sebagai struktur rangkaian saraf berulang berpagar, telah digunakan secara meluas dalam pemprosesan bahasa semula jadi, pengecaman pertuturan, pemprosesan imej dan bidang lain, dan sentiasa diperbaiki dan dioptimumkan untuk menyesuaikan diri dengan tugas dan data yang berbeza dengan lebih baik. .
Atas ialah kandungan terperinci Bincangkan unit gelung berpagar dan kaedah penambahbaikannya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!