Einführung
Python stellt uns 4 grundlegende Datenstrukturen zur Verfügung: Liste, Tupel, Diktat, festgelegt, aber beim Umgang mit großen Datenmengen sind diese vier Datenstrukturen offensichtlich zu einfach. Beispielsweise ist die Einfügungseffizienz einer Liste als einseitig verknüpfte Liste in manchen Situationen relativ gering Ein angeordnetes Diktat. Daher müssen wir zu diesem Zeitpunkt das von der Python-Standardbibliothek bereitgestellte Sammlungspaket verwenden. Durch die Beherrschung dieser Sammlungsklassen können wir nicht nur den von uns geschriebenen Code pythonischer gestalten, sondern auch die Effizienz verbessern Unsere Programme laufen.
Verwendung von defaultdict
defaultdict (default_factory) fügt default_factory über dem gewöhnlichen Diktat (Wörterbuch) hinzu, sodass der entsprechende Schlüssel (Schlüssel) automatisch generiert wird, wenn Es existiert kein Typwert (Wert). Der Parameter default_factory kann als Liste angegeben werden. Set, int und andere zulässige Typen.
Beispiel1
>>> from collections import defaultdict >>> s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
Wir haben jetzt eine Reihe von Listen (Listen) wie die obige, obwohl wir nach sorgfältiger Beobachtung 6 Datensätze haben Tatsächlich gibt es nur zwei Datensätze. Es gibt mehrere Farben, aber jede Farbe entspricht mehreren Werten. Jetzt wollen wir diese Liste in ein Diktat (Wörterbuch) umwandeln. Der Schlüssel (Schlüssel) dieses Diktats entspricht einer Farbe, und der Wert (Wert) des Diktats wird auf eine Liste gesetzt, um mehrere entsprechende Werte zu speichern zur Farbe. Wir können defaultdict(list) verwenden, um dieses Problem zu lösen.
# d可以看作一个dict(字典),dict的value是一个list(列表) >>> d = defaultdict(list) >>> for k, v in s: ... d[k].append(v) ... >>> d defaultdict(<class 'list'>, {'blue': [2, 4, 4], 'red': [1, 3, 1]})
Beispiel2
Im obigen Beispiel gibt es einige Unvollkommenheiten, wie zum Beispiel {'blue': [2, 4, 4], 'red': [1, 3, 1]} In diesem Standarddikt enthält die blaue Farbe zwei 4er und die rote Farbe zwei 1er. Wir möchten jedoch keine doppelten Elemente enthalten. Zu diesem Zeitpunkt können wir die Verwendung von defaultdict(set) in Betracht ziehen, um dieses Problem zu lösen. Der Unterschied zwischen Set (Sammlung) und Liste (Liste) besteht darin, dass dieselben Elemente nicht in Set vorhanden sein dürfen.
>>> d = defaultdict(set) >>> for k, v in s: ... d[k].add(v) ... >>> d defaultdict(<class 'set'>, {'blue': {2, 4}, 'red': {1, 3}})
Beispiel3
>>> s = 'hello world'
Durch die Verwendung der defaultdict(int)-Form zählen wir die Anzahl der Vorkommen jedes Zeichens in einer Zeichenfolge.
>>> d = defaultdict(int) >>> for k in s: ... d[k] += 1 ... >>> d defaultdict(<class 'int'>, {'o': 2, 'h': 1, 'w': 1, 'l': 3, ' ': 1, 'd': 1, 'e': 1, 'r': 1})
Verwendung von OrderedDict
Wir wissen, dass das Standarddikt (Wörterbuch) ungeordnet ist, aber in einigen Fällen müssen wir die Ordnung des Diktats beibehalten Zu diesem Zeitpunkt können Sie OrderedDict verwenden, eine Unterklasse von dict, die jedoch den geordneten Typ von dict auf der Grundlage von dict beibehält. Schauen wir uns an, wie man es verwendet.
Beispiel1
>>> from collections import OrderedDict # 无序的dict >>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}
Dies ist ein ungeordnetes Diktat (Wörterbuch). Jetzt können wir OrderedDict verwenden, um dieses Diktat zu ordnen.
# 将d按照key来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: t[0])) OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)]) # 将d按照value来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: t[1])) OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)]) # 将d按照key的长度来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: len(t[0]))) OrderedDict([('pear', 1), ('apple', 4), ('orange', 2), ('banana', 3)])
Beispiel2
Mit der Methode popitem(last=True) können wir die Schlüssel im Diktat in LIFO löschen (first in, last). out) order -value, d. h. das zuletzt eingefügte Schlüssel-Wert-Paar löschen. Wenn last=False, wird der Schlüsselwert im Diktat gemäß FIFO (First In, First Out) gelöscht.
>>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2} # 将d按照key来排序 >>> d = OrderedDict(sorted(d.items(), key=lambda t: t[0])) >>> d OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)]) # 使用popitem()方法来移除最后一个key-value对 >>> d.popitem() ('pear', 1) # 使用popitem(last=False)来移除第一个key-value对 >>> d.popitem(last=False) ('apple', 4)
Beispiel3
Verwenden Sie move_to_end(key, last=True), um die Schlüsselwertreihenfolge des geordneten OrderedDict-Objekts zu ändern. Mit dieser Methode können wir jeden Schlüsselwert im geordneten OrderedDict-Objekt am Anfang oder Ende des Wörterbuchs einfügen.
>>> d = OrderedDict.fromkeys('abcde') >>> d OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)]) # 将key为b的key-value对移动到dict的最后 >>> d.move_to_end('b') >>> d OrderedDict([('a', None), ('c', None), ('d', None), ('e', None), ('b', None)]) >>> ''.join(d.keys()) 'acdeb' # 将key为b的key-value对移动到dict的最前面 >>> d.move_to_end('b', last=False) >>> ''.join(d.keys()) 'bacde'
Verwendung von deque
Der Vorteil der Listenspeicherung von Daten besteht darin, dass das Auffinden von Elementen anhand des Index schnell geht, das Einfügen und Löschen von Elementen jedoch sehr langsam. Ja, da es sich um eine einfach verknüpfte Listendatenstruktur handelt. Deque ist eine bidirektionale Liste zur effizienten Implementierung von Einfüge- und Löschvorgängen. Sie eignet sich für Warteschlangen und Stapel und ist threadsicher.
List bietet nur die Append- und Pop-Methoden zum Einfügen/Löschen von Elementen am Ende der Liste, aber deque fügt appendleft/popleft hinzu, damit wir Elemente am Anfang des Elements effizient einfügen/löschen können. Darüber hinaus beträgt die Algorithmuskomplexität bei der Verwendung von deque zum Hinzufügen (Anhängen) oder Entfernen (Pop) von Elementen an beiden Enden der Warteschlange etwa O(1), aber für die Operation des Listenobjekts zum Ändern der Listenlänge und der Datenposition, z Beispiel Die Komplexität der Operationen pop(0) und insert(0, v) ist so hoch wie O(n). Da die Operation von deque grundsätzlich mit der von list identisch ist, wird sie hier nicht wiederholt.
Verwendung von ChainMap
ChainMap wird verwendet, um mehrere Diktate (Wörterbücher) in einer Liste (nur eine Metapher) zusammenzufassen, was als Zusammenführung mehrerer Wörter verstanden werden kann Wörterbücher sind jedoch anders als aktualisiert und effizienter.
>>> from collections import ChainMap >>> a = {'a': 'A', 'c': 'C'} >>> b = {'b': 'B', 'c': 'D'} >>> m = ChainMap(a, b) # 构造一个ChainMap对象 >>> m ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}) >>> m['a'] 'A' >>> m['b'] 'B' # 将m变成一个list >>> m.maps [{'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}] # 更新a中的值也会对ChainMap对象造成影响 >>> a['c'] = 'E' >>> m['c'] 'E' # 从m复制一个ChainMap对象,更新这个复制的对象并不会对m造成影响 >>> m2 = m.new_child() >>> m2['c'] = 'f' >>> m['c'] 'E' >>> a['c'] 'E' >>> m2.parents ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})
Verwendung von Counter
Beispiel1
Counter ist ebenfalls eine Unterklasse von dict Es ist ein ungeordneter Container und kann als Zähler betrachtet werden, der zum Zählen der Anzahl verwandter Elemente verwendet wird.
>>> from collections import Counter >>> cnt = Counter() # 统计列表中元素出现的个数 >>> for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']: ... cnt[word] += 1 ... >>> cnt Counter({'blue': 3, 'red': 2, 'green': 1}) # 统计字符串中元素出现的个数 >>> cnt = Counter() >>> for ch in 'hello': ... cnt[ch] = cnt[ch] + 1 ... >>> cnt Counter({'l': 2, 'o': 1, 'h': 1, 'e': 1})
Beispiel2
Verwenden Sie die Methode elements(), um einen Iterator (Iterator) entsprechend der Anzahl der Vorkommen der Elemente zurückzugeben Beliebige Reihenfolge. Wenn die Anzahl der Elemente kleiner als 1 ist, wird sie ignoriert.
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> c Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2}) >>> c.elements() <itertools.chain object at 0x7fb0a069ccf8> >>> next(c) 'a' # 排序 >>> sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
Verwenden Sie most_common(n), um eine Liste zurückzugeben, die die ersten n Elemente enthält, die im Counter-Objekt erscheinen.
>>> c = Counter('abracadabra') >>> c Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1}) >>> c.most_common(3) [('a', 5), ('b', 2), ('r', 2)]
Verwendung von „namedtuple“
Verwenden Sie „namedtuple(typename, field_names)“, um die Elemente im Tupel zu benennen und das Programm besser lesbar zu machen.
>>> from collections import namedtuple >>> Point = namedtuple('PointExtension', ['x', 'y']) >>> p = Point(1, 2) >>> p.__class__.__name__ 'PointExtension' >>> p.x 1 >>> p.y 2
Das Obige ist der Inhalt des Sammlungsnutzungs-Tutorials der Python-Standardbibliothek. Weitere verwandte Inhalte finden Sie auf der chinesischen PHP-Website (www.php.cn)!