Exploiter MD5 pour la détection des modifications PDF avec iTextSharp
Extraire du texte à partir de PDF contenant beaucoup d'images à l'aide d'iTextSharp peut être problématique. Cependant, les sommes de contrôle MD5 offrent une solution robuste pour vérifier si un PDF a été modifié.
Génération du hachage MD5
La classe System.Security.Cryptography.MD5
fournit la fonctionnalité permettant de calculer un hachage MD5. Voici comment :
<code class="language-csharp">using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { return md5.ComputeHash(stream); } }</code>
Comparaison des hachages MD5
Le hachage MD5 est un tableau d'octets. Pour une comparaison facile, convertissez-la en chaîne Base64 :
<code class="language-csharp">var hash1 = Convert.ToBase64String(md5.ComputeHash(stream1)); var hash2 = Convert.ToBase64String(md5.ComputeHash(stream2)); if (hash1 == hash2) { // Files are identical }</code>
Hachage MD5 sous forme de chaîne hexadécimale
Pour représenter le hachage sous forme de chaîne hexadécimale, utilisez BitConverter
:
<code class="language-csharp">string CalculateMD5(string filename) { using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { var hash = md5.ComputeHash(stream); return BitConverter.ToString(hash).Replace("-", "").ToLowerInvariant(); } } }</code>
Cette technique de hachage MD5 garantit une détection fiable des modifications PDF, même lorsque d'autres méthodes d'extraction s'avèrent peu fiables.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!