如何實現 Python 的惰性導入-lazy import

王林
發布: 2023-04-20 11:04:06
轉載
1254 人瀏覽過

如果你的 Python 程式程式有大量的 import,而且啟動非常慢,那麼你應該嘗試懶導入,本文分享一種實現惰性導入的一種方法。雖然 PEP0690[1] 已經提案讓 Python 編譯器(-L) 或標準函式庫加入這個功能,但目前的 Python 版本還未實現。

眾所周知,Python 應用程式在執行使用者的實際操作之前,會執行import 操作,不同的模組可能來自不同的位置,某些模組的運作可能非常耗時,某些模組可能根本不會被用戶調用,因此許多模組的導入純粹是浪費時間。

因此我們需要惰性導入,當應用惰性導入時,執行import foo 只會把名字foo 加到全域的全名空間(globals())中當一個懶引用(lazy reference),編譯器遇到任何存取foo 的程式碼時才會執行真正的import 操作。類似的,from foo import bar 會把 bar 加到命名空間,當遇到呼叫 bar 的程式碼時,就把 foo 導入。

寫程式碼實作

那怎麼寫程式碼實作呢?其實不必寫程式碼實現,已經有專案實現了懶導入功能,那就是TensorFlow,它的程式碼並沒有任何三方庫依賴,我把它放到這裡,以後大家需要懶導入的時候直接把 LazyLoader[2] 類複製到自己的專案中去即可。

原始程式碼如下:

# Code copied from https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/util/lazy_loader.py
"""A LazyLoader class."""

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import importlib
import types


class LazyLoader(types.ModuleType):
"""Lazily import a module, mainly to avoid pulling in large dependencies.

`contrib`, and `ffmpeg` are examples of modules that are large and not always
needed, and this allows them to only be loaded when they are used.
"""

# The lint error here is incorrect.
def __init__(self, local_name, parent_module_globals, name):# pylint: disable=super-on-old-class
self._local_name = local_name
self._parent_module_globals = parent_module_globals

super(LazyLoader, self).__init__(name)

def _load(self):
# Import the target module and insert it into the parent's namespace
module = importlib.import_module(self.__name__)
self._parent_module_globals[self._local_name] = module

# Update this object's dict so that if someone keeps a reference to the
# LazyLoader, lookups are efficient (__getattr__ is only called on lookups
# that fail).
self.__dict__.update(module.__dict__)

return module

def __getattr__(self, item):
module = self._load()
return getattr(module, item)

def __dir__(self):
module = self._load()
return dir(module)
登入後複製

程式碼說明:

類別LazyLoader 繼承自types.ModuleType,初始化函數確保惰性模組將會像真正的模組同樣正確地加入到全域變數中,只要真正用到模組的時候,也就是執行__getattr__ 或__dir__ 時,才會真正的import 實際模組,更新全域變數以指向實際模組,並且將其所有狀態(__dict__)更新為實際模組的狀態,以便對延遲載入的引用,載入模組不需要每次存取都經過載入過程。

程式碼使用:

正常情況下我們這樣導入模組:

import tensorflow.contrib as contrib
登入後複製

其對應的惰性導入版本如下:

contrib = LazyLoader('contrib', globals(), 'tensorflow.contrib')
登入後複製

PEP0690 建議的做法

PEP0690 的提案是在編譯器( C 程式碼)層面實現,這樣效能會更好。其使用方法有兩種。

其一

一種方式是執行Python 腳本時加入-L 參數,例如有兩個檔案spam.py 內容如下:

import time
time.sleep(10)
print("spam loaded")
登入後複製

egg.py 內容如下:

import spam
print("imports done")
登入後複製

#正常導入情況下,會等10 秒後先列印"spam loaded",然後列印"imports done",執行 python -L eggs.py 時,spam 模組永遠不會導入,應用spam 模組壓根就沒有用到。如果 egg.py 內容如下:

import spam
print("imports done")
spam
登入後複製

當執行 python -L eggs.py 時會先列印 "imports done",10 秒之後列印 "spam loaded")。

其二

另一種方式是呼叫標準函式庫importlib 的方法:

import importlib 
importlib.set_lazy_imports(True)
登入後複製

如果某些模組不能懶加載,需要排除,可以這樣

import importlib 
importlib.set_lazy_imports(True,excluding=["one.mod", "another"])
登入後複製

還可以這樣:

from importlib import eager_imports

with eager_imports():
import foo
import bar
登入後複製

最後的話

經過專業人士在在真實的Python 命令列程式上做測試,應用惰性導入後,可以讓啟動時間提高70%,記憶體使用減少40%,非常可觀了。

參考資料

[1]PEP0690: https://github.com/python/peps/blob/main/pep-0690.rst

[2]LazyLoader : https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/util/lazy_loader.py

以上是如何實現 Python 的惰性導入-lazy import的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板