巧妙的方法:在UTF-8 檔案中定位BOM
在目錄中搜尋帶有位元組順序的UTF-8 檔案的必要性標記(BOM) 的出現是為了調試目的。雖然 shell 腳本提供了一個簡單的解決方案,但它們可能會遇到一些缺陷,例如不可讀的單行或對檔案名稱中的換行符敏感。
精緻的解決方案
尋求更多優雅的方法,考慮這個簡潔的命令:
此命令利用“查找”實用程式來遍歷指定的目錄。然後過濾“f”類型的文件(常規文件)。對於每個合格的文件,都會呼叫“sed”編輯器,在第一行執行替換。字串 ^xEFxBBxBF 以表示行開始的控制序列開始,並匹配構成 BOM 的三個字元:EF BB BF。透過將其替換為空字串,可以有效地刪除 BOM。
注意事項
請使用者註意此操作具有破壞性。包含這些字元的二進位檔案將會被修改。為了防止意外更改,請改用此命令:
此修改後的命令仍然忠實於 'grep 的模式匹配使命。它保留了識別包含 BOM 的檔案而不造成損害的能力。
以上是如何尋找並刪除 UTF-8 檔案中的位元組順序標記 (BOM)?的詳細內容。更多資訊請關注PHP中文網其他相關文章!