Garantir l'intégrité des fichiers PDF contenant uniquement des images avec les sommes de contrôle MD5
Extraire du texte à partir de PDF contenant beaucoup d'images peut être difficile. Pour vérifier de manière fiable si un PDF contenant uniquement une image a été modifié, le calcul de sa somme de contrôle MD5 est une solution robuste.
MD5 (Message Digest Algorithm 5) est une fonction de hachage cryptographique générant une signature unique de taille fixe pour toute donnée donnée. Même une modification mineure du fichier produit une somme de contrôle MD5 complètement différente.
Voici comment calculer une somme de contrôle MD5 dans .NET à l'aide de la classe System.Security.Cryptography.MD5
:
<code class="language-csharp">using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { return md5.ComputeHash(stream); } }</code>
Le hachage résultant est un tableau d'octets. Pour une comparaison plus facile, convertissez-le en chaîne en utilisant une représentation hexadécimale :
<code class="language-csharp">static string CalculateMD5(string filename) { using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { var hash = md5.ComputeHash(stream); return BitConverter.ToString(hash).Replace("-", "").ToLowerInvariant(); } } }</code>
En comparant les sommes de contrôle MD5 de deux PDF, vous pouvez détecter instantanément toute altération. Ceci est particulièrement utile lorsque vous téléchargez régulièrement des PDF et que vous devez confirmer leur intégrité sans recourir à une vérification textuelle.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!