使用 io.Copy() 复制时稀疏文件仍然很大
使用 io.Copy() 复制稀疏文件时,它们意外地变成目的地较大。可以采取什么措施来防止这种情况?
背景
io.Copy() 传输原始字节,不知道稀疏文件属性。稀疏文件可以有效存储,但数据中存在漏洞。 io.Copy() 无法传达此洞信息,导致复制过程中稀疏性丢失。
解决方案
要解决此问题,需要绕过io.Copy() 并直接使用系统调用包。具体方法如下:
-
检测空洞:使用 lseek(2) 中的 SEEK_HOLE 和 SEEK_DATA 特殊值来定位稀疏文件中的空洞和数据区域。
- 自定义查找值:特定于平台的 SEEK_HOLE 和 SEEK_DATA 值是必需的。确定支持平台的这些值。
-
修改读取模式:识别包含数据的区域并从中读取数据。
-
考虑文件打孔: 在 Linux 上,您可以尝试使用 Fallocate(2) 在目标文件的末尾打一个洞。如果不支持,请写入归零块来模拟空洞。
其他注意事项
-
文件系统支持:并非所有文件系统都支持孔,例如 FAT32。检查目标文件系统是否支持漏洞。
-
源和目标差异:验证源和目标文件是否驻留在同一文件系统上。如果是这样,请考虑使用 syscall.Rename() 或 os.Rename() 来移动文件而不进行复制。
有关更多见解,请参阅有关在 tar 存档中写入稀疏文件的 Go 问题 #13548 .
以上是## 为什么稀疏文件用 io.Copy() 复制时会变大?的详细内容。更多信息请关注PHP中文网其他相关文章!