主要功能在copyFiles()函数里实现,如下:
这里我首先使用os.listdir()函数来遍历源文件夹src和目标文件夹dst,得到两个文件列表,但由于我需要判重操作,因此需要在dst文件列表中进行查询操作。由于列表的查询效率不高,而字典是一个哈希表,查询效率较高,因此我将目标文件列表转换成一个只有键没有值的字典:
然后我遍历源文件列表,若该路径是一个文件夹,先判断该文件夹在目标路径中是否存在,若不存在,则先创建一个新路径。然后递归调用本函数。其实不存在的时候更高效的方法是调用shutil.copytree()函数,但由于此处需要计算拷贝的文件数量,因此就没有调用该函数。
若该路径是一个文件,则首先判断该文件在目标文件夹中是否存在。若不存在,则拷贝。
由于写这个脚本主要是为了同步手机相册到PC,因此只简单地判断一下文件名。若要判断不同名但相同的文件,则可以继续判断一下md5值,这里就不再赘述。
完整代码如下:
# 输入两个文件夹a和b路径,将a中的文件拷进b,并计算拷贝的文件数。重复的不作处理。
import os
import shutil
def copyFiles(src, dst):
srcFiles = os.listdir(src)
dstFiles = dict(map(lambda x:[x, ''], os.listdir(dst)))
filesCopiedNum = 0
# srcFiles 内のファイルの宛先フォルダー
に存在しない場合は、ソース フォルダー内の各ファイルをコピーします:
src_path = os.path.join(src , file )
dst_path = os.path.join(dst, file)
# ソース パスがフォルダーの場合、ターゲット フォルダーに存在する場合は、この関数を再帰的に呼び出します。それ以外の場合は、最初に作成してから再帰します。
os.path.isdir(src_path) の場合:
os.path.isdir(dst_path) でない場合:
os.makedirs(dst_path)
filesCopiedNum += Files(src_path, dst_path)
# ソースパスがファイルの場合、繰り返されない場合はコピーします。それ以外の場合は操作は行われません。
elif os.path.isfile(src_path):
dstFiles.has_key(file) でない場合:
shutil.copyfile(src_path, dst_path)
filesCopiedNum += 1
return filesCopiedNum
def test():
src_dir = os.path.abspath(raw_input('ソースパスを入力してください: '))
そうでない場合は os.path.isdir(src_dir):
print 'エラー: ソース フォルダーが存在しません! '
' return 0
dst_dir = os.path.abspath('宛先パスを入力してください: '))
if os.path.isdir ( dst_dir):
num = copyFiles(src_dir, dst_dir)
else:
print '宛先フォルダーが存在しないため、新しいフォルダーが作成されます。'
os.makedirs(dst_dir)
num = copyFiles(src_dir, dst_dir)
print 'コピーが完了しました:', num, 'ファイルがコピーされました。'
if __name__ == '__main__':
test()