npu fait référence à un « processeur de réseau neuronal intégré », qui adopte une architecture de « calcul parallèle basé sur les données » et est particulièrement efficace pour traiter des données multimédia massives telles que des vidéos et des images. Le processeur NPU est spécialement conçu pour l'intelligence artificielle IoT afin d'accélérer le fonctionnement des réseaux neuronaux et de résoudre le problème de la faible efficacité des puces traditionnelles dans les opérations des réseaux neuronaux.
Le processeur de réseau neuronal (NPU) intégré adopte une architecture de « calcul parallèle basé sur les données » et est particulièrement efficace pour traiter des données multimédia massives telles que des vidéos et des images. .
Le processeur NPU est spécialement conçu pour l'intelligence artificielle IoT. Il est utilisé pour accélérer le fonctionnement des réseaux neuronaux et résoudre le problème de la faible efficacité des puces traditionnelles dans les opérations des réseaux neuronaux. Dans le GX8010, le CPU et le MCU ont chacun un NPU. Le NPU du MCU est relativement petit et est habituellement appelé SNPU.
Le processeur NPU comprend des modules tels que la multiplication et l'addition, la fonction d'activation, l'opération de données bidimensionnelles et la décompression.
Le module de multiplication et d'addition est utilisé pour calculer la multiplication et l'addition matricielles, la convolution, la multiplication de points et d'autres fonctions. Il y a 64 MAC à l'intérieur du NPU et 32 dans le SNPU.
Le module de fonction d'activation utilise la méthode d'ajustement des paramètres d'ordre 12 la plus élevée pour implémenter la fonction d'activation dans le réseau neuronal. Il y a 6 MAC dans le NPU et 3 dans le SNPU.
Le module d'opération de données bidimensionnelles est utilisé pour mettre en œuvre des opérations sur un plan, telles que le sous-échantillonnage, la copie de données planes, etc. Il y a 1 MAC à l'intérieur du NPU et 1 à l'intérieur du SNPU .
Le module de décompression est utilisé pour décompresser les données de poids. Afin de résoudre le problème de la petite bande passante mémoire dans les appareils IoT, les poids du réseau neuronal sont compressés dans le compilateur NPU, ce qui peut obtenir un effet de compression de 6 à 10 fois sans affecter la précision.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!