如何尋找並刪除 UTF-8 檔案中的位元組順序標記 (BOM)?

Mary-Kate Olsen
發布: 2024-11-04 10:29:02
原創
476 人瀏覽過

How to Find and Remove Byte Order Marks (BOM) in UTF-8 Files?

巧妙的方法:在UTF-8 檔案中定位BOM

在目錄中搜尋帶有位元組順序的UTF-8 檔案的必要性標記(BOM) 的出現是為了調試目的。雖然 shell 腳本提供了一個簡單的解決方案,但它們可能會遇到一些缺陷,例如不可讀的單行或對檔案名稱中的換行符敏感。

精緻的解決方案

尋求更多優雅的方法,考慮這個簡潔的命令:

此命令利用“查找”實用程式來遍歷指定的目錄。然後過濾“f”類型的文件(常規文件)。對於每個合格的文件,都會呼叫“sed”編輯器,在第一行執行替換。字串 ^xEFxBBxBF 以表示行開始的控制序列開始,並匹配構成 BOM 的三個字元:EF BB BF。透過將其替換為空字串,可以有效地刪除 BOM。

注意事項

請使用者註意此操作具有破壞性。包含這些字元的二進位檔案將會被修改。為了防止意外更改,請改用此命令:

此修改後的命令仍然忠實於 'grep 的模式匹配使命。它保留了識別包含 BOM 的檔案而不造成損害的能力。

以上是如何尋找並刪除 UTF-8 檔案中的位元組順序標記 (BOM)?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!