Maison développement back-end C++ Pourquoi BLAS est-il tellement plus rapide que ma mise en œuvre de multiplication matricielle ?

Pourquoi BLAS est-il tellement plus rapide que ma mise en œuvre de multiplication matricielle ?

Nov 02, 2024 pm 12:15 PM

Why is BLAS so much faster than my matrix multiplication implementation?

Performances supérieures de BLAS en matière de multiplication matricielle

Vous avez constaté une différence frappante dans les performances de votre propre fonction de multiplication matricielle par rapport à celle de BLAS. Cela soulève deux questions :

1. Comment BLAS atteint-il des performances extrêmes ?

BLAS est divisé en trois niveaux basés sur des techniques de complexité et d'optimisation :

  • Niveau 1 : Fonctionne sur des vecteurs et bénéficie de la vectorisation.
  • Niveau 2 : Gère les opérations matrice-vecteur et exploite les architectures multiprocesseurs.
  • Niveau 3 : Effectue les opérations matrice-matrice. et optimise la hiérarchie du cache. Cette optimisation est cruciale pour l'amélioration significative des performances des fonctions de niveau 3.

2. Pourquoi votre implémentation est-elle plus lente ?

Votre implémentation ne dispose pas de l'optimisation du cache utilisée par BLAS. Les opérations O(N^3) de multiplication matrice-matrice entraînent un mouvement de données important entre la mémoire et le cache. En mettant en œuvre des algorithmes dédiés qui minimisent les conflits de cache, BLAS accélère considérablement ce processus.

Bien que les compilateurs modernes aident à optimiser le code, ils ne peuvent pas compenser entièrement les techniques spécialisées utilisées dans les implémentations de BLAS comme ATLAS, GotoBLAS et OpenBLAS.

Algorithmes utilisés par BLAS

BLAS n'utilise pas d'algorithmes complexes comme Coppersmith-Winograd ou Strassen en raison de :

  • Difficultés potentielles à fournir du cache- implémentations optimisées.
  • Manque de stabilité numérique, ce qui interdit leur utilisation dans le noyau de calcul de LAPACK.
  • Facteur constant élevé dans leur complexité temporelle, ce qui les rend uniquement bénéfiques pour des matrices exceptionnellement grandes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article chaud

Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD
Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Article chaud

Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD
Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Tags d'article chaud

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

C Fonction Langue Format de lettre ÉTAPES DE CONVERSION DE CAS C Fonction Langue Format de lettre ÉTAPES DE CONVERSION DE CAS Mar 03, 2025 pm 05:53 PM

C Fonction Langue Format de lettre ÉTAPES DE CONVERSION DE CAS

Quels sont les types de valeurs renvoyées par les fonctions du langage C? Qu'est-ce qui détermine la valeur de retour? Quels sont les types de valeurs renvoyées par les fonctions du langage C? Qu'est-ce qui détermine la valeur de retour? Mar 03, 2025 pm 05:52 PM

Quels sont les types de valeurs renvoyées par les fonctions du langage C? Qu'est-ce qui détermine la valeur de retour?

Gulc: Cibliothèque C construite à partir de zéro Gulc: Cibliothèque C construite à partir de zéro Mar 03, 2025 pm 05:46 PM

Gulc: Cibliothèque C construite à partir de zéro

Quelles sont les définitions et les règles d'appel des fonctions du langage C et quelles sont les Quelles sont les définitions et les règles d'appel des fonctions du langage C et quelles sont les Mar 03, 2025 pm 05:53 PM

Quelles sont les définitions et les règles d'appel des fonctions du langage C et quelles sont les

Comment fonctionne la bibliothèque de modèle standard C (STL)? Comment fonctionne la bibliothèque de modèle standard C (STL)? Mar 12, 2025 pm 04:50 PM

Comment fonctionne la bibliothèque de modèle standard C (STL)?

Où est la valeur de retour de la fonction de langue C stockée en mémoire? Où est la valeur de retour de la fonction de langue C stockée en mémoire? Mar 03, 2025 pm 05:51 PM

Où est la valeur de retour de la fonction de langue C stockée en mémoire?

Utilisation distincte et partage de phrases Utilisation distincte et partage de phrases Mar 03, 2025 pm 05:51 PM

Utilisation distincte et partage de phrases

Comment utiliser efficacement les algorithmes du STL (trier, trouver, transformer, etc.)? Comment utiliser efficacement les algorithmes du STL (trier, trouver, transformer, etc.)? Mar 12, 2025 pm 04:52 PM

Comment utiliser efficacement les algorithmes du STL (trier, trouver, transformer, etc.)?

See all articles