Explication graphique détaillée de l'algorithme de compression LZ77 codant le principe de mise en œuvre de Python-Tutoriel Python-php.cn

Table des matières

Avant-propos

Exemple :

Maison

développement back-end

Tutoriel Python

Explication graphique détaillée de l'algorithme de compression LZ77 codant le principe de mise en œuvre de Python

高洛峰

Mar 23, 2017 pm 04:05 PM

Avant-propos

L'algorithme LZ77 est un algorithme de compression sans perte publié par l'Israélien Abraham Lempel en 1977. LZ77 est un algorithme de compression typique basé sur un dictionnaire, et de nombreuses technologies de compression actuelles sont basées sur LZ77. Compte tenu de son statut dans le domaine de la compression de données, cet article présentera ses principes en détail avec des images et le code source.

Introduction du principe :

Introduisez d'abord quelques termes professionnels.

1.lookahead buffer (je ne sais pas comment l'exprimer en chinois, appelé temporairement la zone à encoder) :

Zone en attente d'encodage

2. tampon de recherche :

Zone déjà codée, tampon de recherche

3. Fenêtre coulissante :

Une fenêtre de taille spécifiée, comprenant "tampon de recherche" (à gauche) + "zone à laquelle être encodé" (à droite)

Ensuite, le processus d'encodage spécifique est introduit :

Afin d'encoder la zone à encoder, l'encodeur recherche dans le tampon de recherche de la fenêtre coulissante jusqu'à ce qu'elle trouve la chaîne correspondante. La distance entre la chaîne de départ de la chaîne correspondante et le tampon à coder est appelée « valeur de décalage », et la longueur de la chaîne correspondante est appelée « longueur correspondante ». Lors de l'encodage, l'encodeur continuera à chercher dans la zone de recherche jusqu'à ce qu'il trouve la chaîne correspondante maximale et génère (o, l), où o est la valeur de décalage et l est la longueur correspondante. Ensuite, la fenêtre glisse l et continue le codage. Si aucune chaîne correspondante n'est trouvée, (0, 0, c) est affiché, c est le prochain caractère en attente d'être encodé dans la zone à encoder et la fenêtre fait glisser "1". La mise en œuvre de l'algorithme sera similaire à la suivante :

while( lookAheadBuffer not empty )
 {
 get a pointer (position, match) to the longest match
 in the window for the lookAheadBuffer;
output a (position, length, char());
 shift the window length+1 characters along;
 }

Copier après la connexion

Les principales étapes sont :

1 Définissez la position d'encodage au début du flux d'entrée

2. . Dans la fenêtre coulissante à encoder Recherche de zone Recherchez la chaîne correspondante maximale dans la zone de recherche

3. Si la chaîne est trouvée, affichez (valeur de décalage, longueur correspondante), faites glisser la fenêtre vers l'avant "longueur correspondante".

4. Si s'il n'est pas trouvé, affichez (0, 0, le premier caractère de la zone à encoder), et la fenêtre avance d'une unité

5. encoded n'est pas vide, revenez à l'étape 2

La description est trop compliquée, expliquons-la avec des exemples