소개
Python은 4가지 기본 데이터 구조(리스트, 튜플, 딕셔너리, 그러나 많은 양의 데이터를 처리할 때 이 네 가지 데이터 구조는 명백히 너무 단순합니다. 예를 들어 단방향 연결 목록인 목록의 삽입 효율성은 때로는 일부 상황에서 상대적으로 낮습니다. 주문된 딕셔너리. 따라서 현재 우리는 Python 표준 라이브러리에서 제공하는 컬렉션 패키지를 사용해야 합니다. 이 패키지는 여러 가지 유용한 컬렉션 클래스를 제공합니다. 이러한 컬렉션 클래스에 능숙해지면 우리가 작성하는 코드를 더욱 Pythonic하게 만들 수 있을 뿐만 아니라 효율성도 향상할 수 있습니다. 우리 프로그램이 실행됩니다.
defaultdict 사용법
defaultdict(default_factory)는 일반 dict(딕셔너리) 위에 default_factory를 추가하므로 키(key)가 존재하지 않을 때 해당 응답이 자동으로 생성됩니다. 유형 값(value), default_factory 매개변수를 목록으로 지정할 수 있습니다. Set, int 및 기타 법적 유형.
example1
>>> from collections import defaultdict >>> s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
이제 위와 같은 목록이 생겼습니다. 비록 6개의 데이터 세트가 있지만 주의 깊게 관찰한 결과 실제로는 2개만 있다는 것을 알게 되었습니다. 색상.(색상)이지만 각 색상은 여러 값에 해당합니다. 이제 이 목록을 dict(사전)로 변환하려고 합니다. 이 dict의 키(key)는 색상에 해당하고 dict의 값(value)은 해당하는 여러 값을 저장하는 목록으로 설정됩니다. 색상에. 이 문제를 해결하기 위해 defaultdict(list)를 사용할 수 있습니다.
# d可以看作一个dict(字典),dict的value是一个list(列表) >>> d = defaultdict(list) >>> for k, v in s: ... d[k].append(v) ... >>> d defaultdict(<class 'list'>, {'blue': [2, 4, 4], 'red': [1, 3, 1]})
example2
위의 예에는 {'blue': [2, 4, 4], 'red': [1과 같은 몇 가지 불완전성이 있습니다. , 3, 1]} 이 defaultdict에서는 파란색에 4가 두 개 포함되어 있고, 빨간색에 1이 두 개 포함되어 있습니다. 그러나 이 문제를 해결하기 위해 defaultdict(set)를 사용하는 것을 고려할 수 있습니다. 세트(컬렉션)와 리스트(리스트)의 차이점은 세트에 동일한 요소가 존재할 수 없다는 점입니다.
>>> d = defaultdict(set) >>> for k, v in s: ... d[k].add(v) ... >>> d defaultdict(<class 'set'>, {'blue': {2, 4}, 'red': {1, 3}})
example3
>>> s = 'hello world'
defaultdict(int) 형식을 사용하여 문자열에서 각 문자의 발생 횟수를 계산합니다.
>>> d = defaultdict(int) >>> for k in s: ... d[k] += 1 ... >>> d defaultdict(<class 'int'>, {'o': 2, 'h': 1, 'w': 1, 'l': 3, ' ': 1, 'd': 1, 'e': 1, 'r': 1})
OrderedDict 사용
기본 dict(사전)가 순서가 지정되어 있지 않다는 것을 알고 있지만 어떤 경우에는 dict를 순서대로 유지해야 합니다. 시간이 지나면 dict의 하위 클래스인 OrderedDict를 사용할 수 있지만 dict를 기반으로 dict의 정렬된 유형을 유지하므로 이를 사용하는 방법을 살펴보겠습니다.
example1
>>> from collections import OrderedDict # 无序的dict >>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}
이것은 정렬되지 않은 dict(사전)입니다. 이제 OrderedDict를 사용하여 이 dict를 정렬할 수 있습니다.
# 将d按照key来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: t[0])) OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)]) # 将d按照value来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: t[1])) OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)]) # 将d按照key的长度来排序 >>> OrderedDict(sorted(d.items(), key=lambda t: len(t[0]))) OrderedDict([('pear', 1), ('apple', 4), ('orange', 2), ('banana', 3)])
example2
popitem(last=True) 메서드를 사용하면 LIFO의 딕셔너리에서 키-값을 삭제할 수 있습니다(첫 번째 , last out) order, 즉 마지막으로 삽입된 키-값 쌍을 삭제합니다. last=False인 경우 FIFO(선입선출)에 따라 dict의 키-값을 삭제합니다.
>>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2} # 将d按照key来排序 >>> d = OrderedDict(sorted(d.items(), key=lambda t: t[0])) >>> d OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)]) # 使用popitem()方法来移除最后一个key-value对 >>> d.popitem() ('pear', 1) # 使用popitem(last=False)来移除第一个key-value对 >>> d.popitem(last=False) ('apple', 4)
example3
move_to_end(key, last=True) 순서가 지정된 OrderedDict 개체의 키-값 순서를 변경하려면 이 방법을 통해 순서가 지정된 OrderedDict 개체의 키-값을 사전의 시작이나 끝 부분에 삽입할 수 있습니다.
>>> d = OrderedDict.fromkeys('abcde') >>> d OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)]) # 将key为b的key-value对移动到dict的最后 >>> d.move_to_end('b') >>> d OrderedDict([('a', None), ('c', None), ('d', None), ('e', None), ('b', None)]) >>> ''.join(d.keys()) 'acdeb' # 将key为b的key-value对移动到dict的最前面 >>> d.move_to_end('b', last=False) >>> ''.join(d.keys()) 'bacde'
deque 사용
데이터를 저장하는 리스트의 장점은 인덱스로 요소를 찾는 것이 매우 빠르다는 점이지만, 요소를 삽입하고 삭제하는 것은 단일 연결 리스트 데이터 구조이기 때문에 매우 느립니다. Deque는 삽입 및 삭제 작업을 효율적으로 구현하기 위한 양방향 목록이며 대기열 및 스택에 적합하며 스레드로부터 안전합니다.
List는 목록 끝에서 요소를 삽입/삭제할 수 있는 추가 및 팝 메소드만 제공하지만, deque는 요소 시작 부분에 요소를 효율적으로 삽입/삭제할 수 있도록appendleft/popleft를 추가합니다. 게다가 deque를 사용하여 큐의 양쪽 끝에서 요소를 추가(append) 또는 팝(pop)하는 알고리즘 복잡도는 약 O(1)이지만 목록 객체의 작업으로 인해 목록 길이와 데이터 위치가 변경됩니다. 예 pop(0) 및 insert(0, v) 작업의 복잡성은 O(n)만큼 높습니다. deque의 동작은 기본적으로 list의 동작과 동일하므로 여기서는 반복하지 않겠습니다.
ChainMap 사용
ChainMap은 여러 dict(사전)를 목록(은유일 뿐)으로 결합하는 데 사용됩니다. 이는 여러 단어를 병합하는 것으로 이해될 수 있습니다. 그러나 업데이트와는 다르며 더 효율적입니다.
>>> from collections import ChainMap >>> a = {'a': 'A', 'c': 'C'} >>> b = {'b': 'B', 'c': 'D'} >>> m = ChainMap(a, b) # 构造一个ChainMap对象 >>> m ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}) >>> m['a'] 'A' >>> m['b'] 'B' # 将m变成一个list >>> m.maps [{'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}] # 更新a中的值也会对ChainMap对象造成影响 >>> a['c'] = 'E' >>> m['c'] 'E' # 从m复制一个ChainMap对象,更新这个复制的对象并不会对m造成影响 >>> m2 = m.new_child() >>> m2['c'] = 'f' >>> m['c'] 'E' >>> a['c'] 'E' >>> m2.parents ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})
Counter 사용
example1
Counter는 dict의 하위 클래스이기도 합니다. 순서가 지정되지 않은 컨테이너는 관련 요소의 수를 계산하는 데 사용되는 카운터로 간주될 수 있습니다.
>>> from collections import Counter >>> cnt = Counter() # 统计列表中元素出现的个数 >>> for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']: ... cnt[word] += 1 ... >>> cnt Counter({'blue': 3, 'red': 2, 'green': 1}) # 统计字符串中元素出现的个数 >>> cnt = Counter() >>> for ch in 'hello': ... cnt[ch] = cnt[ch] + 1 ... >>> cnt Counter({'l': 2, 'o': 1, 'h': 1, 'e': 1})
example2
elements() 메서드를 사용하여 요소의 발생 횟수에 따라 반복자(iterator)를 반환합니다. 요소는 순서에 관계없이 반환됩니다. . 요소 수가 1보다 작으면 무시됩니다.
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> c Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2}) >>> c.elements() <itertools.chain object at 0x7fb0a069ccf8> >>> next(c) 'a' # 排序 >>> sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
Counter 개체에 나타나는 상위 n개 요소가 포함된 목록을 반환하려면 Most_common(n)을 사용하세요.
>>> c = Counter('abracadabra') >>> c Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1}) >>> c.most_common(3) [('a', 5), ('b', 2), ('r', 2)]
namedtuple 사용
namedtuple(typename, field_names)을 사용하여 튜플의 요소 이름을 지정하면 프로그램을 더 쉽게 읽을 수 있습니다.
>>> from collections import namedtuple >>> Point = namedtuple('PointExtension', ['x', 'y']) >>> p = Point(1, 2) >>> p.__class__.__name__ 'PointExtension' >>> p.x 1 >>> p.y 2
위 내용은 Python 표준 라이브러리의 컬렉션 사용법 튜토리얼 내용입니다. 더 많은 관련 내용은 PHP 중국어 홈페이지(www.php.cn)를 참고해주세요!