数据结构中散列表(哈希表)经典之冲突处理
散列是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置f(key),建立了关键字与存储位置的相互对应关系,这种关系 f 称为散列函数(哈希函数)。本文小编主要讲述散列函数的冲突处理问题。
查找过程中,关键码的比较次数,取决于产生冲突的多少,产生的冲突少,查找效率就高,产生的冲突多,查找效率就低。因此,影响产生冲突多少的因素,也就是影响查找效率的因素。影响产生冲突多少有以下三个因素:
1. 散列函数是否均匀;
2. 处理冲突的方法;
3. 散列表的装填因子。
散列表的装填因子定义为:α= 填入表中的元素个数 / 散列表的长度
α是散列表装满程度的标志因子。由于表长是定值,α与“填入表中的元素个数”成正比,所以,α越大,填入表中的元素较多,产生冲突的可能性就越大;α越小,填入表中的元素较少,产生冲突的可能性就越小。
实际上,散列表的平均查找长度是装填因子α的函数,只是不同处理冲突的方法有不同的函数。
解决哈希冲突的方法一般有:
NO.1开放定址法
所谓的开放定址法就是一旦发生了冲突,就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将记录存入。
公式:f(key)=(f(key)+di)%m(di=1,2,3….m-1)
比如说,关键字集合为{12, 67, 56, 16, 25, 37, 22, 29, 15, 47, 48, 34},表长为12。散列函数f(key) = key mod 12。
当计算前5个数{12, 67, 56, 16, 25}时,都是没有冲突的散列地址,直接存入;计算key = 37时,发现f(37) = 1,此时就与25所在的位置冲突。于是应用上面的公式f(37) = (f(37) + 1) mod 12 =2,。于是将37存入下标为2的位置。接下来22,29,15,47都没有冲突,正常的存入。到了48,计算得到f(48) = 0,与12所在的0位置冲突了,不要紧,我们f(48) = (f(48) + 1) mod 12 = 1,此时又与25所在的位置冲突。于是f(48) = (f(48) + 2) mod 12 = 2,还是冲突......一直到f(48) = (f(48) + 6) mod 12 = 6时,才有空位,如下表所示。
序号 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
关键字 | 12 | 25 | 16 | 67 | 56 |
NO.2再哈希法
对于散列表来说,可以事先准备多个散列函数。
公式:fi(key)=RHi(key)(i=1,2,3…,k)
这里RHi 就是不同的散列函数,可以把除留余数、折叠、平方取中全部用上。每当发生散列地址冲突时,就换一个散列函数计算。
这种方法能够使得关键字不产生聚集,但相应地也增加了计算的时间。
NO.3链地址法(拉链法)
将所有关键字为同义词的记录存储在一个单链表中,称这种表为同义词子表,在散列表中只存储所有同义词子表前面的指针。对于关键字集合{12, 67, 56, 16, 25, 37, 22, 29, 15, 47, 48, 34},用前面同样的12为余数,进行除留余数法,可以得到下图结构。
NO.4建立公共溢出区
这个方法是当你时重新给你找个地址,为所有冲突的关键字建立一个公共的溢出区来存放。
就前面的例子而言,共有三个关键字37、48、34与之前的关键字位置有冲突,那就将它们存储到溢出表中。如下图所示。
在查找时,对给定值通过散列函数计算出散列地址后,先与基本表的相应位置进行比对,如果相等,则查找成功;如果不相等,则到溢出表中进行顺序查找。如果相对于基本表而言,有冲突的数据很少的情况下,公共溢出区的结构对查找性能来说还是非常高的。
【推荐课程:C++相关课程】
以上是数据结构中散列表(哈希表)经典之冲突处理的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

C++对象布局和内存对齐优化内存使用效率:对象布局:数据成员按声明顺序存储,优化空间利用率。内存对齐:数据在内存中对齐,提升访问速度。alignas关键字指定自定义对齐,例如64字节对齐的CacheLine结构,提高缓存行访问效率。

策略模式在C++中的实现步骤如下:定义策略接口,声明需要执行的方法。创建具体策略类,分别实现该接口并提供不同的算法。使用上下文类持有具体策略类的引用,并通过它执行操作。

Golang和C++分别是垃圾回收和手动内存管理编程语言,语法和类型系统各异。Golang通过Goroutine实现并发编程,C++通过线程实现。Golang内存管理简单,C++性能更强。实战案例中,Golang代码更简洁,C++性能优势明显。

C++智能指针通过指针计数、析构函数和虚函数表实现自动内存管理。指针计数跟踪引用数,当引用数降为0时,析构函数释放原始指针。虚函数表启用多态性,允许针对不同类型的智能指针实现特定行为。

嵌套异常处理在C++中通过嵌套的try-catch块实现,允许在异常处理程序中引发新异常。嵌套的try-catch步骤如下:1.外部try-catch块处理所有异常,包括内部异常处理程序抛出的异常。2.内部try-catch块处理特定类型的异常,如果发生超出范围的异常,则将控制权交给外部异常处理程序。

要遍历STL容器,可以使用容器的begin()和end()函数获取迭代器范围:向量:使用for循环遍历迭代器范围。链表:使用next()成员函数遍历链表元素。映射:获取键值对迭代器,使用for循环遍历。

如何在C++中复制文件?使用std::ifstream和std::ofstream流读取源文件,写入目标文件,并关闭流。1.创建源文件和目标文件的新流。2.检查流是否成功打开。3.逐块复制文件数据,并关闭流以释放资源。

C++模板继承允许模板派生类重用基类模板的代码和功能,适用于创建具有相同核心逻辑但不同特定行为的类。模板继承语法为:templateclassDerived:publicBase{}。实例:templateclassBase{};templateclassDerived:publicBase{};。实战案例:创建了派生类Derived,继承了基类Base的计数功能,并增加了printCount方法来打印当前计数。
