数据库
全是 IP区间
我查询哟个IP 的的归属地,有什么好的方式,主要是数据库有400多万条数据,要不要用缓存?
数据库
全是 IP区间
我查询哟个IP 的的归属地,有什么好的方式,主要是数据库有400多万条数据,要不要用缓存?
<code>mysql> select inet_aton("127.0.0.1"); +------------------------+ | inet_aton("127.0.0.1") | +------------------------+ | 2130706433 | +------------------------+ 1 row in set (0.00 sec) mysql> select inet_aton("127.0.0.255"); +--------------------------+ | inet_aton("127.0.0.255") | +--------------------------+ | 2130706687 | +--------------------------+ 1 row in set (0.00 sec) </code>
我想你看到上面的就知道大概要怎么做了,不过我们的ip数据一般都直接存为无符号整形的,并且对ip字段建索引,因此400万条数据查询毫无压力。
1:数据库方式。由于你的数据本身就是排好序的,所以只要将StartIP按256进制的方式转化为10进制整数然后存入新建的一列中,并对该列加索引。当要求某个ip归属地时将该ip转化为数字然后 Select * from table where IPBase10 limit 1即可。
2:二叉树。就是自己建平衡树然后查找。400多万条数据不算多,内存放的下。
3:归并。适用于你有极大量ip需要同时确认归属地。只需要对归属地信息数组A和待查询ip数组B进行归并即可,归并的过程中即可确定归属地,在大量数据下效率高于上面两张。时间复杂度为O(NlogN)+O(MN),前面为对数组B排序,后面为归并。
可以下载纯真ip库,安装后复制出安装文件夹里的qqwry.dat, 网上找个php调用示例直接调用,以后更新ip库也方便。
http://segmentfault.com/blog/joyqi/1190000000352578
http://www.ipip.net/
为什么不使用ip2long