면책 조항: 이 기사는 CC BY-NC-ND 4.0에 따라 라이센스가 부여됩니다.
PHP에는 컬렉션을 나타내는 데이터 유형이 하나뿐입니다: 배열. 나는 PHP를 처음 접하는 모든 사람들이 이에 대해 혼란스러워할 것이라고 믿습니다. 이것은 다른 언어에서는 배열이나 리스트처럼 보이지만 PHP에서는 리스트와 맵 모두가 전부입니다.
<?php $a = array(1, 2, 3); $b = array('key1' => 1, 'key2' => 2);
어쨌든 모두가 동일한 데이터 구조를 사용하므로 가끔 성능 문제가 발생할 수 있습니다. 또한, PHP7로 업그레이드한 후 Array의 성능도 향상되었습니다. 하지만 더 편리한 데이터 구조를 도입하여 성능을 최적화할 수 있고 동시에 코드 작성이 더 편리해질 수 있다면
추천 튜토리얼: "PHP Tutorial"
배열의 단점
때때로 필요합니다. 하지만 Array는 요소의 고유성을 보장하지 않으며, array_unique는 성능 저하를 피할 수 없습니다. 절충안은 고유 배열의 기능을 달성하기 위해 요소를 키로 사용하고 값을 true로 사용하는 것입니다.
<?php $users = User::find($ids); $res = []; foreach ($users as $user) { $res[$user->id] = true; }
PHP의 배열은 존재하지 않는 키에 액세스할 때 null을 얻을 수 있으며 치명적인 오류를 생성하지는 않지만 E_NOTICE가 발생합니다. 이 E_NOTICE는 set_error_handler에 의해 등록된 함수에 의해 차단됩니다. 분명히 이런 종류의 불결한 코드와 불필요한 성능 오버헤드는 완전히 피할 수 있습니다.
아아아아 array_key_exists와 else를 사용하여 코드를 더 깔끔하게 만들 수 있지만 이렇게 하면 장황해 보일 것입니다.
array_map, array_walk 등과 같은 배열의 일부 함수형 메서드는 사용하기 어렵고 작성하기에도 불편합니다. 물론, 기본 PHP에서는 이를 수행할 수 있는 좋은 방법이 없습니다. 결국 PHP의 객체 지향 유전자는 그리 강력하지 않습니다.
rreeerree다음 코드와 같이 Array 사용 성능이 매우 떨어지는 경우도 있습니다1:
<?php $req = []; $req['user_id']; // PHP Notice: Undefined offset
아무것도 아닌 것처럼 보일 수도 있지만 배열은 본질적으로 맵입니다. 요소를 이동하지 않으면 각 요소의 키가 변경됩니다. 이는 $O(n)$ 작업입니다. 또한 PHP의 배열은 해당 값(확장 키 및 해시 포함)을 버킷에 저장하므로 각 버킷을 확인하고 해시를 업데이트해야 합니다. 내부적으로 PHP는 실제로 새로운 배열을 생성하여 array_unshift 작업을 수행하는데, 성능 문제는 상상할 수 있습니다2.
그 외에도 단점이 많습니다.
PHP 데이터 구조 플러그인
Array가 비판을 받았으며 대안이 나타날 것입니다. PHP5에는 spl이 있지만 일부 시나리오에서는 성능이 매우 낮고 디자인도 매우 좋지 않습니다1. Laravel의 Collection은 더욱 유용한 Map을 제공하지만 결국 이는 단일 데이터 구조일 뿐이며 ORM 작업을 위한 고유한 인터페이스를 많이 설계했으며 그 사용이 제한되어 있습니다.
PHP7의 새로운 데이터 구조 플러그인(줄여서 ds)은 편의성, 보안 및 깔끔함의 요구 사항을 완전히 고려한 PHP의 차세대 추가 기능입니다. 아래 그림과 같습니다.
Collection, Sequence, Hashable의 3가지 인터페이스 클래스와 Vector, Deque, Map, Set, Stack, Queue, PriorityQueue의 7가지 구현 클래스(최종 클래스)를 제공합니다.
Interface
Collection은 foreach, json_encode, var_dump 등과 같은 데이터 컬렉션(여기서 컬렉션은 Set이 아니라 Collection을 의미함)의 기본 작업을 정의하는 기본 인터페이스입니다.
아아아아Sequence는 배열과 같은 데이터 구조의 기본 인터페이스이며 포함, 매핑, 필터링, 축소, 찾기, 첫 번째, 마지막 등과 같은 중요하고 편리한 여러 메서드를 정의합니다. 그림에서 볼 수 있듯이 Vector, Deque, Stack, Queue는 모두 이 인터페이스를 직간접적으로 구현합니다.
아아아아해시 가능은 다이어그램에서 분리되어 보이지만 Map 및 Set에서는 중요합니다. Object가 Hashable을 구현하면 Map의 키와 Set의 요소로 사용될 수 있습니다. 이런 식으로 Map과 Set을 Java만큼 편리하게 사용할 수 있습니다.
구현 클래스
Vector는 가장 일반적으로 사용되는 데이터 구조 중 하나여야 합니다. Ruby의 배열 또는 Python의 목록이라고 생각하면 됩니다. 해당 요소 값의 인덱스는 버퍼의 인덱스이므로 매우 효율적입니다. 배열을 사용해야 하고 삽입, 제거, 이동 및 이동 해제가 필요하지 않은 한 이를 사용할 수 있습니다.
Deque([dek])는 Vector에 헤드 포인터를 추가하는 양방향 큐이므로 Shift 및 Unshift도 $O(1)$ 복잡합니다. 하지만 성능 손실이 크지 않아서 Deque 하나만 있으면 충분하고 벡터는 필요하지 않다는 논의도 있습니다(논의) 3.
Stack 栈,嗯没什么好说的,它继承自 Collection,但内部使用 Vector 实现。这样做的好处是实现方便,且同时可以屏蔽不需要的和不应该出现的方法。
Queue 队列,内部使用 Deque 实现。
PriorityQueue,最大堆实现。
Map。以前使用 Array 来实现 map 的地方,改用 Map 更好。二者性能几乎一致,但 Map 对内存的管理更好。而且,Map 的语法要更加友好。
<?php $req = []; $req['user_id']; // PHP Notice: Undefined offset $req = new \Ds\Map(["a" => 1, "b" => 2, "c" => 3]); $req->get('user_id');// OutOfBoundsException $req->get('user_id', 0); // 0 是默认值 // 即可以方便的指定默认值,也可以选择抛出异常。不用 array,不会产生 E_NOTICE $req->keys(); $req->map(function($key, $value) { return $value * 2; });
不仅如此,只要 object 继承了 Hashable,Map 还允许使用 object 作为 key。
<?php class Photo implements \Ds\Hashable { public function __construct($id) { $this->id = $id; } public function hash() { return $this->id; } public function equals($obj): bool { return $this->id === $obj->id; } } $p1 = new Photo(1); $p2 = new Photo(2); $map = new Ds\Map(); $map->put($p1, 1); $map->put($p2, 2);
Set 集合是一种元素唯一的数据结构。和 array_unique 相比性能有很大提升,而且用法也更加优雅1。
<?php $set = new Ds\Set(); $set->add($p1); $set->add($p2);
php ds 插件性能测试 ↩ ↩2 ↩3
当然,这一点可能稍嫌牵强,毕竟即使是数据量很大的情况下,array_unshift 的耗时也没有那么大 ↩
github 上还在讨论可以增加一个不可变类型 Tuple,以及取消 Vector 直接使用 Deque,讨论地址和 2.0API 计划 ↩