MD5 チェックサムを使用して PDF ファイルの整合性を検証する: テキストフリーのアプローチ
画像のみを含む PDF を扱う場合、またはテキスト抽出が不可能な場合、ファイルの整合性を検証することが最も重要になります。 MD5 チェックサムは、不正な変更を検出するための堅牢なソリューションを提供します。
C# での MD5 計算
C# System.Security.Cryptography.MD5
クラスは、MD5 チェックサムの生成を簡素化します。 簡潔なコード例を次に示します:
<code class="language-csharp">using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { return md5.ComputeHash(stream); } }</code>
変更検出のためのチェックサム比較
異なるファイル バージョンの MD5 チェックサムを比較すると、変更があればすぐにわかります。 バイト配列は、比較を容易にするために Base64 文字列に変換することも、バイトごとの直接比較を使用することもできます。
16 進文字列としての MD5
ストレージまたは文字列ベースの比較の場合、MD5 ハッシュを 16 進表現に変換します。
<code class="language-csharp">static string CalculateMD5(string filename) { using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { var hash = md5.ComputeHash(stream); return BitConverter.ToString(hash).Replace("-", "").ToLowerInvariant(); } } }</code>
MD5 チェックサムは、従来のテキストベースの検証方法が効果的でない状況でも、PDF ファイルの整合性を維持するための信頼できる方法を提供します。
以上がMD5チェックサムは、テキスト抽出が不可能な場合、どのようにしてPDFファイルの整合性を検証できますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。