목차
PHP中array_keys和array_unique函数源码的分析,arraykeys
您可能感兴趣的文章:
백엔드 개발 PHP 튜토리얼 PHP中array_keys和array_unique函数源码的分析,arraykeys_PHP教程

PHP中array_keys和array_unique函数源码的分析,arraykeys_PHP教程

Jul 12, 2016 am 08:58 AM
array keys unique

PHP中array_keys和array_unique函数源码的分析,arraykeys

性能分析

从运行性能上分析,看看下面的测试代码:

$test=array();
for($run=0; $run<10000; $run++)
$test[]=rand(0,100);

$time=microtime(true);

$out = array_unique($test);

$time=microtime(true)-$time;
echo 'Array Unique: '.$time."\n";

$time=microtime(true);

$out=array_keys(array_flip($test));

$time=microtime(true)-$time;
echo 'Keys Flip: '.$time."\n";

$time=microtime(true);

$out=array_flip(array_flip($test));

$time=microtime(true)-$time;
echo 'Flip Flip: '.$time."\n";

로그인 후 복사

运行结果如下:

从上图可以看到,使用array_unique函数需要0.069s;使用array_flip后再使用array_keys函数需要0.00152s;使用两次array_flip函数需要0.00146s。

测试结果表明,使用array_flip后再调用array_keys函数比array_unique函数快。那么,具体原因是什么呢?让我们看看在PHP底层,这两个函数是怎么实现的。

源码分析

/* {{{ proto array array_keys(array input [, mixed search_value[, bool strict]])
  Return just the keys from the input array, optionally only for the specified       search_value */
PHP_FUNCTION(array_keys)
{
  //变量定义
  zval *input,        /* Input array */
     *search_value = NULL,  /* Value to search for */
     **entry,        /* An entry in the input array */
      res,          /* Result of comparison */
     *new_val;        /* New value */
  int  add_key;        /* Flag to indicate whether a key should be added */
  char *string_key;      /* String key */
  uint  string_key_len;
  ulong num_key;        /* Numeric key */
  zend_bool strict = 0;    /* do strict comparison */
  HashPosition pos;
  int (*is_equal_func)(zval *, zval *, zval * TSRMLS_DC) = is_equal_function;

  //程序解析参数
  if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "a|zb", &input, &search_value, &strict) == FAILURE) {
    return;
  }

  // 如果strict是true,则设置is_equal_func为is_identical_function,即全等比较
  if (strict) {
    is_equal_func = is_identical_function;
  }

  /* 根据search_vale初始化返回的数组大小 */
  if (search_value != NULL) {
    array_init(return_value);
  } else {
    array_init_size(return_value, zend_hash_num_elements(Z_ARRVAL_P(input)));
  }
  add_key = 1;

  /* 遍历输入的数组参数,然后添加键值到返回的数组 */
  zend_hash_internal_pointer_reset_ex(Z_ARRVAL_P(input), &pos);//重置指针
  //循环遍历数组
  while (zend_hash_get_current_data_ex(Z_ARRVAL_P(input), (void **)&entry, &pos) == SUCCESS) {
    // 如果search_value不为空
    if (search_value != NULL) {
      // 判断search_value与当前的值是否相同,并将比较结果保存到add_key变量
      is_equal_func(&res, search_value, *entry TSRMLS_CC);
      add_key = zval_is_true(&res);
    }

    if (add_key) {
      // 创建一个zval结构体
      MAKE_STD_ZVAL(new_val);

      // 根据键值是字符串还是整型数字将值插入到return_value中
      switch (zend_hash_get_current_key_ex(Z_ARRVAL_P(input), &string_key, &string_key_len, &num_key, 1, &pos)) {
        case HASH_KEY_IS_STRING:
          ZVAL_STRINGL(new_val, string_key, string_key_len - 1, 0);
          // 此函数负责将值插入到return_value中,如果键值已存在,则使用新值更新对应的值,否则直接插入
          zend_hash_next_index_insert(Z_ARRVAL_P(return_value), &new_val, sizeof(zval *), NULL);
          break;

        case HASH_KEY_IS_LONG:
          Z_TYPE_P(new_val) = IS_LONG;
          Z_LVAL_P(new_val) = num_key;
          zend_hash_next_index_insert(Z_ARRVAL_P(return_value), &new_val, sizeof(zval *), NULL);
          break;
      }
    }

    // 移动到下一个
    zend_hash_move_forward_ex(Z_ARRVAL_P(input), &pos);
  }
}
/* }}} */

로그인 후 복사

以上是array_keys函数底层的源码。为方便理解,笔者添加了一些中文注释。如果需要查看原始代码,可以点击查看。这个函数的功能就是新建一个临时数组,然后将键值对重新复制到新的数组,如果复制过程中有重复的键值出现,那么就用新的值替换。这个函数的主要步骤是地57和63行调用的zend_hash_next_index_insert函数。该函数将元素插入到数组中,如果出现重复的值,则使用新的值更新原键值指向的值,否则直接插入,时间复杂度是O(n)。

/* {{{ proto array array_flip(array input)
  Return array with key <-> value flipped */
PHP_FUNCTION(array_flip)
{
  // 定义变量
  zval *array, **entry, *data;
  char *string_key;
  uint str_key_len;
  ulong num_key;
  HashPosition pos;

  // 解析数组参数
  if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "a", &array) == FAILURE) {
    return;
  }

  // 初始化返回数组
  array_init_size(return_value, zend_hash_num_elements(Z_ARRVAL_P(array)));

  // 重置指针
  zend_hash_internal_pointer_reset_ex(Z_ARRVAL_P(array), &pos);
  // 遍历每个元素,并执行键<->值交换操作
  while (zend_hash_get_current_data_ex(Z_ARRVAL_P(array), (void **)&entry, &pos) == SUCCESS) {
    // 初始化一个结构体
    MAKE_STD_ZVAL(data);
    // 将原数组的值赋值为新数组的键
    switch (zend_hash_get_current_key_ex(Z_ARRVAL_P(array), &string_key, &str_key_len, &num_key, 1, &pos)) {
      case HASH_KEY_IS_STRING:
        ZVAL_STRINGL(data, string_key, str_key_len - 1, 0);
        break;
      case HASH_KEY_IS_LONG:
        Z_TYPE_P(data) = IS_LONG;
        Z_LVAL_P(data) = num_key;
        break;
    }

    // 将原数组的键赋值为新数组的值,如果有重复的,则使用新值覆盖旧值
    if (Z_TYPE_PP(entry) == IS_LONG) {
      zend_hash_index_update(Z_ARRVAL_P(return_value), Z_LVAL_PP(entry), &data, sizeof(data), NULL);
    } else if (Z_TYPE_PP(entry) == IS_STRING) {
      zend_symtable_update(Z_ARRVAL_P(return_value), Z_STRVAL_PP(entry), Z_STRLEN_PP(entry) + 1, &data, sizeof(data), NULL);
    } else {
      zval_ptr_dtor(&data); /* will free also zval structure */
      php_error_docref(NULL TSRMLS_CC, E_WARNING, "Can only flip STRING and INTEGER values!");
    }

    // 下一个
    zend_hash_move_forward_ex(Z_ARRVAL_P(array), &pos);
  }
}
/* }}} */

로그인 후 복사

上面就是是array_flip函数的源码。点击链接查看原始代码。这个函数主要的做的事情就是创建一个新的数组,遍历原数组。在26行开始将原数组的值赋值为新数组的键,然后在37行开始将原数组的键赋值为新数组的值,如果有重复的,则使用新值覆盖旧值。整个函数的时间复杂度也是O(n)。因此,使用了array_flip之后再使用array_keys的时间复杂度是O(n)。

接下来,我们看看array_unique函数的源码。点击链接查看原始代码。

/* {{{ proto array array_unique(array input [, int sort_flags])
  Removes duplicate values from array */
PHP_FUNCTION(array_unique)
{
  // 定义变量
  zval *array, *tmp;
  Bucket *p;
  struct bucketindex {
    Bucket *b;
    unsigned int i;
  };
  struct bucketindex *arTmp, *cmpdata, *lastkept;
  unsigned int i;
  long sort_type = PHP_SORT_STRING;

  // 解析参数
  if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "a|l", &array, &sort_type) == FAILURE) {
    return;
  }

  // 设置比较函数
  php_set_compare_func(sort_type TSRMLS_CC);

  // 初始化返回数组
  array_init_size(return_value, zend_hash_num_elements(Z_ARRVAL_P(array)));
  // 将值拷贝到新数组
  zend_hash_copy(Z_ARRVAL_P(return_value), Z_ARRVAL_P(array), (copy_ctor_func_t) zval_add_ref, (void *)&tmp, sizeof(zval*));

  if (Z_ARRVAL_P(array)->nNumOfElements <= 1) {  /* 什么都不做 */
    return;
  }

  /* 根据target_hash buckets的指针创建数组并排序 */
  arTmp = (struct bucketindex *) pemalloc((Z_ARRVAL_P(array)->nNumOfElements + 1) * sizeof(struct bucketindex), Z_ARRVAL_P(array)->persistent);
  if (!arTmp) {
    zval_dtor(return_value);
    RETURN_FALSE;
  }
  for (i = 0, p = Z_ARRVAL_P(array)->pListHead; p; i++, p = p->pListNext) {
    arTmp[i].b = p;
    arTmp[i].i = i;
  }
  arTmp[i].b = NULL;
  // 排序
  zend_qsort((void *) arTmp, i, sizeof(struct bucketindex), php_array_data_compare TSRMLS_CC);

  /* 遍历排序好的数组,然后删除重复的元素 */
  lastkept = arTmp;
  for (cmpdata = arTmp + 1; cmpdata->b; cmpdata++) {
    if (php_array_data_compare(lastkept, cmpdata TSRMLS_CC)) {
      lastkept = cmpdata;
    } else {
      if (lastkept->i > cmpdata->i) {
        p = lastkept->b;
        lastkept = cmpdata;
      } else {
        p = cmpdata->b;
      }
      if (p->nKeyLength == 0) {
        zend_hash_index_del(Z_ARRVAL_P(return_value), p->h);
      } else {
        if (Z_ARRVAL_P(return_value) == &EG(symbol_table)) {
          zend_delete_global_variable(p->arKey, p->nKeyLength - 1 TSRMLS_CC);
        } else {
          zend_hash_quick_del(Z_ARRVAL_P(return_value), p->arKey, p->nKeyLength, p->h);
        }
      }
    }
  }
  pefree(arTmp, Z_ARRVAL_P(array)->persistent);
}
/* }}} */

로그인 후 복사

可以看到,这个函数初始化一个新的数组,然后将值拷贝到新数组,然后在45行调用排序函数对数组进行排序,排序的算法是zend引擎的块树排序算法。接着遍历排序好的数组,删除重复的元素。整个函数开销最大的地方就在调用排序函数上,而快排的时间复杂度是O(nlogn),因此,该函数的时间复杂度是O(nlogn)。

结论

因为array_unique底层调用了快排算法,加大了函数运行的时间开销,导致整个函数的运行较慢。这就是为什么array_keys比array_unique函数更快的原因。

您可能感兴趣的文章:

  • php下判断数组中是否存在相同的值array_unique
  • php array_unique之后json_encode需要注意
  • php数组函数序列之array_unique() - 去除数组中重复的元素值
  • php数组函数序列之array_keys() - 获取数组键名
  • PHP获取数组中某元素的位置及array_keys函数应用

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/1104337.htmlTechArticlePHP中array_keys和array_unique函数源码的分析,arraykeys 性能分析 从运行性能上分析,看看下面的测试代码: $test=array();for($run=0; $run10000; $run++)...
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

C#에서 Array.Sort 함수를 사용하여 배열 정렬 C#에서 Array.Sort 함수를 사용하여 배열 정렬 Nov 18, 2023 am 10:37 AM

제목: Array.Sort 함수를 사용하여 C#에서 배열을 정렬하는 예 텍스트: C#에서는 배열이 일반적으로 사용되는 데이터 구조이므로 배열 정렬 작업이 필요한 경우가 많습니다. C#에서는 배열을 편리하게 정렬할 수 있는 Sort 메서드가 있는 Array 클래스를 제공합니다. 이 문서에서는 C#에서 Array.Sort 함수를 사용하여 배열을 정렬하는 방법을 보여주고 구체적인 코드 예제를 제공합니다. 먼저 Array.Sort 함수의 기본 사용법을 이해해야 합니다. 배열.그래서

PHP에서 array_combine 함수를 사용하여 두 배열을 연관 배열로 결합하는 방법 PHP에서 array_combine 함수를 사용하여 두 배열을 연관 배열로 결합하는 방법 Jun 26, 2023 pm 01:41 PM

PHP에는 배열 작업을 더욱 편리하고 빠르게 만들어주는 강력한 배열 함수가 많이 있습니다. 두 배열을 연관 배열로 결합해야 하는 경우 PHP의 array_combine 함수를 사용하여 이 작업을 수행할 수 있습니다. 이 함수는 실제로 한 배열의 키를 다른 배열의 값으로 새로운 연관 배열로 결합하는 데 사용됩니다. 다음으로 PHP에서 array_combine 함수를 사용하여 두 배열을 연관 배열로 결합하는 방법을 설명하겠습니다. array_comb에 대해 알아보기

PHP array_merge_recursive() 함수를 사용하는 간단하고 명확한 방법 PHP array_merge_recursive() 함수를 사용하는 간단하고 명확한 방법 Jun 27, 2023 pm 01:48 PM

PHP로 프로그래밍할 때 배열을 병합해야 하는 경우가 종종 있습니다. PHP는 배열 병합을 완료하기 위해 array_merge() 함수를 제공하지만, 배열에 동일한 키가 존재할 경우 이 함수는 원래 값을 덮어씁니다. 이 문제를 해결하기 위해 PHP는 배열을 병합하고 동일한 키의 값을 유지할 수 있는 array_merge_recursive() 함수도 언어에 제공하여 프로그램 설계를 더욱 유연하게 만듭니다. array_merge

MySQL에서 고유 인덱스 사용에 대한 팁 및 FAQ MySQL에서 고유 인덱스 사용에 대한 팁 및 FAQ Mar 15, 2024 pm 03:09 PM

MySQL에서 고유 인덱스 사용에 대한 팁 및 FAQ MySQL은 널리 사용되는 관계형 데이터베이스 관리 시스템입니다. 실제 응용 프로그램에서 고유 인덱스(uniqueindex)는 데이터 테이블 디자인에서 중요한 역할을 합니다. 고유 인덱스는 테이블의 특정 열 값이 고유한지 확인하고 데이터 중복을 방지할 수 있습니다. 이 기사에서는 MySQL의 고유 인덱스 사용 기술과 몇 가지 일반적인 질문에 대한 답변을 소개하고 독자의 이해를 돕기 위해 구체적인 코드 예제를 제공합니다. 1.만들기

PHP array_fill() 함수 사용법에 대한 자세한 설명 PHP array_fill() 함수 사용법에 대한 자세한 설명 Jun 27, 2023 am 08:42 AM

PHP 프로그래밍에서 배열은 많은 양의 데이터를 쉽게 처리할 수 있는 매우 중요한 데이터 구조입니다. PHP는 많은 배열 관련 함수를 제공하며 array_fill()은 그 중 하나입니다. 이 기사에서는 array_fill() 함수의 사용법과 실제 응용에 대한 몇 가지 팁을 자세히 소개합니다. 1. array_fill() 함수 개요 array_fill() 함수의 함수는 지정된 길이의 동일한 값으로 구성된 배열을 생성하는 것입니다. 구체적으로 이 함수의 구문은 다음과 같습니다.

PHP array_change_key_case() 함수 사용 방법 소개 PHP array_change_key_case() 함수 사용 방법 소개 Jun 27, 2023 am 10:43 AM

PHP 프로그래밍에서 배열은 자주 사용되는 데이터 유형입니다. array_change_key_case() 함수를 포함하여 꽤 많은 배열 작업 함수도 있습니다. 이 함수는 데이터 처리를 용이하게 하기 위해 배열의 키 이름 대소문자를 변환할 수 있습니다. 이 기사에서는 PHP에서 array_change_key_case() 함수를 사용하는 방법을 소개합니다. 1. 함수 구문 및 매개변수 array_change_ke

Python에서 배열 모듈을 사용하는 방법 Python에서 배열 모듈을 사용하는 방법 May 01, 2023 am 09:13 AM

Python의 배열 모듈은 미리 정의된 배열이므로 표준 목록보다 메모리 공간을 훨씬 적게 차지하고 추가, 삭제, 인덱싱, 슬라이싱과 같은 요소 수준 작업을 빠르게 수행할 수도 있습니다. 또한, 배열의 모든 요소는 동일한 타입이므로 평균, 최대, 최소값 계산 등 배열이 제공하는 효율적인 수치연산 기능을 사용할 수 있습니다. 또한, 배열 모듈은 배열 객체를 바이너리 파일에 직접 쓰고 읽는 것을 지원하므로 대량의 수치 데이터를 처리할 때 더욱 효율적입니다. 따라서 대량의 동종 데이터를 처리해야 하는 경우 Python의 배열 모듈을 사용하여 코드의 실행 효율성을 최적화하는 것을 고려할 수 있습니다. 어레이 모듈을 사용하려면 먼저 다음을 수행해야 합니다.

Java의 ArrayStoreException 예외에 대한 솔루션 Java의 ArrayStoreException 예외에 대한 솔루션 Jun 25, 2023 am 08:05 AM

Java 개발에서는 배열의 편의성과 성능상의 이점 때문에 배열을 사용하여 일련의 데이터를 저장하는 경우가 많습니다. 그러나 배열을 사용하는 과정에서 일부 예외가 발생하는데, 일반적인 예외 중 하나가 ArrayStoreException입니다. 이 예외는 호환되지 않는 데이터 유형을 배열에 저장할 때 발생합니다. 이번 글에서는 ArrayStoreException이 무엇인지, 왜 발생하는지, 해결 방법은 무엇인지 소개하겠습니다. 1. 도착

See all articles