詳解Python判斷上傳檔案類型

高洛峰
發布: 2017-03-19 15:11:19
原創
2142 人瀏覽過

在開發上傳服務時,經常需要對上傳的檔案進行過濾。

本文為大家提供了python透過文件頭判斷文件類型的方法,非常實用。

程式碼如下

import struct 
# 支持文件类型 
# 用16进制字符串的目的是可以知道文件头是多少字节 
# 各种文件头的长度不一样,少半2字符,长则8字符 
def typeList(): 
  return { 
    "52617221": EXT_RAR, 
    "504B0304": EXT_ZIP} 
 
# 字节码转16进制字符串 
def bytes2hex(bytes): 
  num = len(bytes) 
  hexstr = u"" 
  for i in range(num): 
    t = u"%x" % bytes[i] 
    if len(t) % 2: 
      hexstr += u"0" 
    hexstr += t 
  return hexstr.upper() 
 
# 获取文件类型 
def filetype(filename): 
  binfile = open(filename, 'rb') # 必需二制字读取 
  tl = typeList() 
  ftype = 'unknown' 
  for hcode in tl.keys(): 
    numOfBytes = len(hcode) / 2 # 需要读多少字节 
    binfile.seek(0) # 每次读取都要回到文件头,不然会一直往后读取 
    hbytes = struct.unpack_from("B"*numOfBytes, binfile.read(numOfBytes)) # 一个 "B"表示一个字节 
    f_hcode = bytes2hex(hbytes) 
    if f_hcode == hcode: 
      ftype = tl[hcode] 
      break
  #不要忘记关闭打开的文件,避免出现异常
  binfile.close() 
  return ftype
 
if __name__ == '__main__': 
  print filetype('pythontab.jpg')
登入後複製

常見檔案格式的檔案頭

檔案格式檔案頭(十六進位)

JPEG (jpg) FFD8FF

PNG (png) 89504E47

GIF (gif) 47494638

TIFF (tif) 49492A00

Windows Bitmap (bmp) 424D

# 她(dwg) 41433130

Adobe Photoshop (psd) 38425053

Rich Text Format (rtf) 7B5C727466

XML (xml) 3C3F786D6CML

#HT

XML (xml) 3C3F786D6CML

#HT (1CML#html) 68746D6C3E

Email [thorough only] (eml) 44656C69766572792D646174653A

Outlook Express (#dbx) CFAD12FEC5FD746F

Outlook## xls.or.doc) D0CF11E0

###MS Access (mdb) 5374616E64617264204A###

以上是詳解Python判斷上傳檔案類型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板