为什么 Python 的哈希函数在会话之间产生不同的结果
在 Python 3.3 及更高版本中,内置 hash() 函数生成不同的哈希值对于不同会话中的相同字符串。这种行为源于一种设计选择,旨在防止利用冲突漏洞的恶意输入。
为了防止攻击者使用冲突密钥使应用程序过载,Python 使用随会话变化的随机种子。此偏移确保了不可预测性,阻止攻击者制造碰撞的能力。
开发人员可以通过设置 PYTHONHASHSEED 环境变量来覆盖此默认行为。固定的正整数值将设置特定的种子,而将该值设置为 0 将完全禁用偏移。
Python 2.7 和 3.2 默认情况下不启用此功能。然而,Python 3.3 开始合并它以增强安全性。
这种变量哈希行为的影响超出了布隆过滤器的范围。它影响集合、字典(Python 3.5 及更早版本)和其他映射结构中元素的顺序。 Python 不提供有关此顺序的保证,该顺序可能会因插入、删除和随机哈希种子而异。
对于稳定的哈希实现,请考虑使用 hashlib 模块,它提供加密哈希函数。 pybloom 项目依靠这种方法来实现可靠的哈希。
值得注意的是,由于结构复杂,存储哈希偏移量是不切实际的。然而,这种增加的复杂性也阻碍了攻击者利用定时攻击来确定偏移量。
以上是为什么 Python 的 `hash()` 函数在会话之间产生不同的结果?的详细内容。更多信息请关注PHP中文网其他相关文章!