改變 Python 物件規則的黑魔法 Metaclass

WBOY
發布: 2023-04-14 11:43:03
轉載
1250 人瀏覽過

改變 Python 物件規則的黑魔法 Metaclass

今天小明哥要分享的主題是:改變類別定義的神器-metaclass

看到標題,你可能會想改變類別的定義有什麼用呢?什麼時候才需要使用metaclass呢?

今天我將帶大家設計一個簡單的orm框架,並且簡單剖析YAML這個序列化工具的原理。

Python類別的上帝-type

說到metaclass,我們首先必須清楚一個最基礎的概念就是物件是類別的實例,而類別是type的實例,重複一遍:

  1. 物件是類別的實例
  2. 類別是type的實例

在物件導向的程式設計模型中,類別就相當於一個房子的設計圖紙,而對象則是根據這個設計圖建出來的房子。

下圖中,玩具模型就可以代表一個類,而具體生產出來的玩具就可以代表一個物件:

改變 Python 物件規則的黑魔法 Metaclass

總之,類別就是創建物件的模板。

而type又是創建類別的模板,那麼我們就可以透過type創建自己想要的類別。

例如定義一個Hello 的class:

class Hello(object):
def hello(self, name='world'):
 print('Hello, %s.' % name)
登入後複製

當Python 解釋器載入hello 模組時,就會依序執行該模組的所有語句,執行結果就是動態建立出一個Hello 的class對象。

type()函數既可以查看一個類型或變數的類型,也可以根據參數建立新的類型,例如上面那段類別的定義本質上就是:

def hello(self, name='world'):
print('Hello, %s.' % name)
Hello = type('Hello', (object,), dict(hello=hello))
登入後複製

type( )函數建立class 對象,依序傳入3 個參數:

  • class 類別的名稱;
  • 繼承的父類別集合,注意Python 支援多重繼承,如果只有一個父類,別忘了tuple 的單一元素寫法;
  • class 的方法名稱與函數綁定以及欄位名稱與對應的值,這裡我們把函數fn 綁定到方法名稱hello 上。

透過type() 函數建立的類別和直接寫class 是完全一樣的,因為Python 解釋器遇到class 定義時,只是掃描一下class 定義的語法,然後呼叫type()函數創建出class。

正常情況下,我們肯定都是用class Xxx... 來定義類,但是type() 函數允許我們動態創建出類來,這意味著Python這門動態語言支援運行期動態創建類。你可能感受不到這有多強大,要知道想在靜態語言運行期創建類,必須構造源代碼字符串再調用編譯器,或者藉助一些工俱生成字節碼實現,本質上都是動態編譯,會非常複雜。

metaclass到底是什麼

那type和metaclass有什麼關係呢? metaclass到底是什麼呢?

我認為metaclass 其實就是type或type的子類,透過繼承type,重載__call__運算符,便可以在class類物件建立時做一些修改。

對於類別MyClass:

class MyClass():
 pass
登入後複製

其實相當於:

class MyClass(metaclass = type):
 pass
登入後複製

一旦我們把它的metaclass 設定成MyMeta:

class MyClass(metaclass = MyMeta):
 pass
登入後複製

MyClass 就不再由原生的type 創建,而是會呼叫MyMeta 的__call__運算子重載。

class = type(classname, superclasses, attributedict)
## 变为了
class = MyMeta(classname, superclasses, attributedict)
登入後複製

對於具有繼承關係的類別:

class Foo(Bar):
 pass
登入後複製

Python做瞭如下的操作:

  • Foo中有__metaclass__這個屬性嗎?如果是,Python會透過__metaclass__建立一個名字為Foo的類別(物件)
  • 如果Python沒有找到__metaclass__,它會繼續在Bar(父類別)中尋找__metaclass__屬性,並嘗試做和前面同樣的操作。
  • 如果Python在任何父類別中都找不到__metaclass__,它就會在模組層次中去尋找__metaclass__,並嘗試做同樣的操作。
  • 如果還是找不到__metaclass__,Python就會用內建的type來建立這個類別物件。

假想一個很愚蠢的例子,你決定在你的模組裡所有的類別的屬性都應該是大寫形式。有好幾種方法可以辦到,但其中一種就是透過在模組層級設定__metaclass__:

class UpperAttrMetaClass(type):
## __new__ 是在__init__之前被调用的特殊方法
## __new__是用来创建对象并返回之的方法
## 而__init__只是用来将传入的参数初始化给对象
## 你很少用到__new__,除非你希望能够控制对象的创建
## 这里,创建的对象是类,我们希望能够自定义它,所以我们这里改写__new__
## 如果你希望的话,你也可以在__init__中做些事情
## 还有一些高级的用法会涉及到改写__call__特殊方法,但是我们这里不用
def __new__(cls, future_class_name, future_class_parents, future_class_attr):
##遍历属性字典,把不是__开头的属性名字变为大写
newAttr = {}
for name,value in future_class_attr.items():
if not name.startswith("__"):
newAttr[name.upper()] = value
## 方法1:通过'type'来做类对象的创建
## return type(future_class_name, future_class_parents, newAttr)
## 方法2:复用type.__new__方法,这就是基本的OOP编程
## return type.__new__(cls, future_class_name, future_class_parents, newAttr)
## 方法3:使用super方法
return super(UpperAttrMetaClass, cls).__new__(cls, future_class_name, future_class_parents, newAttr)
class Foo(object, metaclass = UpperAttrMetaClass):
bar = 'bip'
print(hasattr(Foo, 'bar'))
## 输出: False
print(hasattr(Foo, 'BAR'))
## 输出:True
f = Foo()
print(f.BAR)
## 输出:'bip'
登入後複製

簡易ORM框架的設計

ORM全名為“Object Relational Mapping”,即對象-關係映射,就是把關聯式資料庫的一行映射為一個對象,也就是一個類別對應一個表,這樣,寫程式碼更簡單,不用直接操作SQL語句。

現在設計一下ORM框架的呼叫接口,例如使用者想透過User類別來操作對應的資料庫表格User,我們期待他寫出這樣的程式碼:

class User(Model):
## 定义类的属性到列的映射:
id = IntegerField('id')
name = StringField('username')
email = StringField('email')
password = StringField('password')
## 创建一个实例:
u = User(id=12345, name='xiaoxiaoming', email='test@orm.org', password='my-pwd')
## 保存到数据库:
u.save()
登入後複製

上面的介面透過常規方法很難或幾乎很難實現,但透過metaclass就會相對比較簡單。核心思想就是透過metaclass修改類別的定義,將類別的所有Field類型的屬性,用一個額外的字典去保存,然後從原定義中刪除。對於User建立物件時傳入的參數(id=12345, name='xiaoxiaoming'等)可以模仿字典的實作或直接繼承dict類別儲存起來。

其中,父类Model和属性类型StringField、IntegerField是由ORM框架提供的,剩下的魔术方法比如save()全部由metaclass自动完成。虽然metaclass的编写会比较复杂,但ORM的使用者用起来却异常简单。

首先定义Field类,它负责保存数据库表的字段名和字段类型:

class Field(object):
def __init__(self, name, column_type):
self.name = name
self.column_type = column_type
def __str__(self):
return '<%s:%s>' % (self.__class__.__name__, self.name)
登入後複製

在Field的基础上,进一步定义各种类型的Field,比如StringField,IntegerField等等:

class StringField(Field):
def __init__(self, name):
super(StringField, self).__init__(name, 'varchar(100)')
class IntegerField(Field):
def __init__(self, name):
super(IntegerField, self).__init__(name, 'bigint')
登入後複製

下一步,编写ModelMetaclass:

class ModelMetaclass(type):
def __new__(cls, name, bases, attrs):
if name == 'Model':
return type.__new__(cls, name, bases, attrs)
print('Found model: %s' % name)
mappings = dict()
for k, v in attrs.items():
if isinstance(v, Field):
print('Found mapping: %s ==> %s' % (k, v))
mappings[k] = v
for k in mappings.keys():
attrs.pop(k)
attrs['__mappings__'] = mappings## 保存属性和列的映射关系
attrs.setdefault('__table__', name) ## 当未定义__table__属性时,表名直接使用类名
return type.__new__(cls, name, bases, attrs)
登入後複製

以及基类Model:

class Model(dict, metaclass=ModelMetaclass):
def __init__(self, **kw):
super(Model, self).__init__(**kw)
def __getattr__(self, key):
try:
return self[key]
except KeyError:
raise AttributeError(r"'Model' object has no attribute '%s'" % key)
def __setattr__(self, key, value):
self[key] = value
def save(self):
fields = []
params = []
args = []
for k, v in self.__mappings__.items():
fields.append(v.name)
params.append('?')
args.append(getattr(self, k, None))
sql = 'insert into %s (%s) values (%s)' % (self.__table__, ','.join(fields), ','.join(params))
print('SQL: %s' % sql)
print('ARGS: %s' % str(args))
登入後複製

在ModelMetaclass中,一共做了几件事情:

  1. 在当前类(比如User)中查找定义的类的所有属性,如果找到一个Field属性,就把它保存到一个__mappings__的dict中,同时从类属性中删除该Field属性(避免实例的属性遮盖类的同名属性);
  2. 当类中未定义__table__字段时,直接将类名保存到__table__字段中作为表名。

在Model类中,就可以定义各种操作数据库的方法,比如save(),delete(),find(),update等等。

我们实现了save()方法,把一个实例保存到数据库中。因为有表名,属性到字段的映射和属性值的集合,就可以构造出INSERT语句。

测试:

u = User(id=12345, name='xiaoxiaoming', email='test@orm.org', password='my-pwd')
u.save()
登入後複製

输出如下:

Found model: User
Found mapping: id ==> <IntegerField:id>
Found mapping: name ==> <StringField:username>
Found mapping: email ==> <StringField:email>
Found mapping: password ==> <StringField:password>
SQL: insert into User (id,username,email,password) values (?,?,?,?)
ARGS: [12345, 'xiaoxiaoming', 'test@orm.org', 'my-pwd']
登入後複製

测试2:

class Blog(Model):
__table__ = 'blogs'
id = IntegerField('id')
user_id = StringField('user_id')
user_name = StringField('user_name')
name = StringField('user_name')
summary = StringField('summary')
content = StringField('content')
b = Blog(id=12345, user_, user_name='xxm', name='orm框架的基本运行机制', summary="简单讲述一下orm框架的基本运行机制",
 content="此处省略一万字...")
b.save()
登入後複製

输出:

Found model: Blog
Found mapping: id ==> <IntegerField:id>
Found mapping: user_id ==> <StringField:user_id>
Found mapping: user_name ==> <StringField:user_name>
Found mapping: name ==> <StringField:user_name>
Found mapping: summary ==> <StringField:summary>
Found mapping: content ==> <StringField:content>
SQL: insert into blogs (id,user_id,user_name,user_name,summary,content) values (?,?,?,?,?,?)
ARGS: [12345, 'user_id1', 'xxm', 'orm框架的基本运行机制', '简单讲述一下orm框架的基本运行机制', '此处省略一万字...']
登入後複製

可以看到,save()方法已经打印出了可执行的SQL语句,以及参数列表,只需要真正连接到数据库,执行该SQL语句,就可以完成真正的功能。

YAML序列化工具的实现原理浅析

YAML是一个家喻户晓的 Python 工具,可以方便地序列化 / 逆序列化结构数据。

官方文档:https://pyyaml.org/wiki/PyYAMLDocumentation

安装:

pip install pyyaml
登入後複製

YAMLObject 的任意子类支持序列化和反序列化(serialization & deserialization)。比如说下面这段代码:

import yaml
class Monster(yaml.YAMLObject):
yaml_tag = '!Monster'
def __init__(self, name, hp, ac, attacks):
self.name = name
self.hp = hp
self.ac = ac
self.attacks = attacks
def __repr__(self):
return f"{self.__class__.__name__}(name={self.name}, hp={self.hp}, ac={self.ac}, attacks={self.attacks})"
monster1 = yaml.load("""
--- !Monster
name: Cave spider
hp: [2,6]
ac: 16
attacks: [BITE, HURT]
""")
print(monster1, type(monster1))
monster2 = Monster(name='Cave lizard', hp=[3, 6], ac=16, attacks=['BITE', 'HURT'])
print(yaml.dump(monster2))
登入後複製

运行结果:

Monster(name=Cave spider, hp=[2, 6], ac=16, attacks=['BITE', 'HURT']) <class '__main__.Monster'>
!Monster
ac: 16
attacks: [BITE, HURT]
hp: [3, 6]
name: Cave lizard
登入後複製

这里面调用统一的 yaml.load(),就能把任意一个 yaml 序列载入成一个 Python Object;而调用统一的 yaml.dump(),就能把一个 YAMLObject 子类序列化。

对于 load() 和 dump() 的使用者来说,他们完全不需要提前知道任何类型信息,这让超动态配置编程成了可能。比方说,在一个智能语音助手的大型项目中,我们有 1 万个语音对话场景,每一个场景都是不同团队开发的。作为智能语音助手的核心团队成员,我不可能去了解每个子场景的实现细节。

在动态配置实验不同场景时,经常是今天我要实验场景 A 和 B 的配置,明天实验 B 和 C 的配置,光配置文件就有几万行量级,工作量不可谓不小。而应用这样的动态配置理念,就可以让引擎根据配置文件,动态加载所需要的 Python 类。

对于 YAML 的使用者也很方便,只要简单地继承 yaml.YAMLObject,就能让你的 Python Object 具有序列化和逆序列化能力。

据说即使是在大厂 Google 的 Python 开发者,发现能深入解释 YAML 这种设计模式优点的人,大概只有 10%。而能知道类似 YAML 的这种动态序列化 / 逆序列化功能正是用 metaclass 实现的人,可能只有 1% 了。而能够将YAML 怎样用 metaclass 实现动态序列化 / 逆序列化功能讲出一二的可能只有 0.1%了。

对于YAMLObject 的 load和dump() 功能,简单来说,我们需要一个全局的注册器,让 YAML 知道,序列化文本中的 !Monster 需要载入成 Monster 这个 Python 类型,Monster 这个 Python 类型需要被序列化为!Monster 标签开头的字符串。

一个很自然的想法就是,那我们建立一个全局变量叫 registry,把所有需要逆序列化的 YAMLObject,都注册进去。比如下面这样:

registry = {}
def add_constructor(target_class):
registry[target_class.yaml_tag] = target_class
登入後複製

然后,在 Monster 类定义后面加上下面这行代码:

add_constructor(Monster)
登入後複製

这样的缺点很明显,对于 YAML 的使用者来说,每一个 YAML 的可逆序列化的类 Foo 定义后,都需要加上一句话add_constructor(Foo)。这无疑给开发者增加了麻烦,也更容易出错,毕竟开发者很容易忘了这一点。

更优雅的实现方式自然是通过metaclass 解决了这个问题,YAML 的源码正是这样实现的:

class YAMLObjectMetaclass(type):
def __init__(cls, name, bases, kwds):
super(YAMLObjectMetaclass, cls).__init__(name, bases, kwds)
if 'yaml_tag' in kwds and kwds['yaml_tag'] is not None:
cls.yaml_loader.add_constructor(cls.yaml_tag, cls.from_yaml)
cls.yaml_dumper.add_representer(cls, cls.to_yaml)
## 省略其余定义
class YAMLObject(metaclass=YAMLObjectMetaclass):
yaml_loader = Loader
yaml_dumper = Dumper
## 省略其余定义
登入後複製

可以看到,YAMLObject 把 metaclass 声明成了 YAMLObjectMetaclass,YAMLObjectMetaclass则会改变YAMLObject类和其子类的定义,就是下面这行代码将YAMLObject 的子类加入到了yaml的两个全局注册表中:

cls.yaml_loader.add_constructor(cls.yaml_tag, cls.from_yaml)
cls.yaml_dumper.add_representer(cls, cls.to_yaml)
登入後複製

YAML 应用 metaclass,拦截了所有 YAMLObject 子类的定义。也就是说,在你定义任何 YAMLObject 子类时,Python 会强行插入运行上面这段代码,把我们之前想要的add_constructor(Foo)和add_representer(Foo)给自动加上。所以 YAML 的使用者,无需自己去手写add_constructor(Foo)和add_representer(Foo)。

總結

這次分享主要是簡單的淺析了 metaclass 的實作機制。透過實作一個orm框架並解讀 YAML 的源碼,相信你已經對metaclass 有了不錯的理解。

metaclass 是 Python 黑魔法等級的語言特性,它可以改變類別創建時的行為,這種強大的功能使用起來務必小心。

看完本文,你覺得裝飾器跟 metaclass 有什麼差別呢?歡迎下方留言和我討論。記得一鍵三連呦,筆芯!

以上是改變 Python 物件規則的黑魔法 Metaclass的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板