假如我有十台缓存服务器 ,
1:怎样的算法可以将 一个数据均匀的分配到缓存服务器上,避免某一台服务器压力过高,
2:然后怎样从十台缓存服务器中的某一台读取缓存数据;
谈谈php的具体实现方法
假如我有十台缓存服务器 ,
1:怎样的算法可以将 一个数据均匀的分配到缓存服务器上,避免某一台服务器压力过高,
2:然后怎样从十台缓存服务器中的某一台读取缓存数据;
谈谈php的具体实现方法
可以先看下此文:http://www.codinglabs.org/html/consis...
最简单的就是拉一个哈希函数出来(比如jshash,sdbmhash,或者直接用stl里头对string的hash都可以):hash(key) % 10 => 给出机器的ID。存取都用这样的规则,就没有问题了。
不过这种简单方式存在的问题是,可用性和扩展性降低了。任意一台机器挂掉,相应的数据就没地方存,不能自动保存到其他机器。新增机器的时候也很麻烦。
目前的终极解决方案是一致性哈希算法,相应的文章很多,开源实现也很多,自己去搜吧。
使用哈希算法是必然的,就是要看对什么做哈希
如果你的存的时候是不带Key的,也就是说,存入一个值,缓存服务器返回一个Key,下一次访问使用这个返回的Key取值。可以用microtime对缓存机器数取模。
如果你存的时候是带Key的,就比较麻烦了,因为要保证一致性,我用过一个办法是对md5做折叠。
就是对你预设的Key做一次md5,得到一个32位的字符串,然后把字符串中间对折,做16进制加法,得到一个较小的数字(可以对折多次,得到足够小的数字,如果不做对折,直接做截取也可以,目标就是把大数字变小),然后用得到的这个数字对机器数取模,这样可以保证一致性。下一次用这个Key还可以用相同的算法定位到某台机器
建议楼主了解下“ 一致性hash ”, 这个能完全能解决你这个问题。
而且在php中,一致性hash是被memcahe等扩展内置支持的。