> 백엔드 개발 > PHP 튜토리얼 > 面试遇到的两个题

面试遇到的两个题

WBOY
풀어 주다: 2016-06-06 20:26:04
원래의
1085명이 탐색했습니다.

第一个:
机器内存为2GB,但有个5GB的文件里面全是以逗号分割的数字,现在我们要进行对他排序,排序好不能重复(不能用DB);

第二个:
给出你一个数找到相邻的数字(12,222,500,888,991,1000)
比如:我给的是13,那么相邻最近的是12。 我给的是998,那么相邻最近的是1000

回复内容:

第一个:
机器内存为2GB,但有个5GB的文件里面全是以逗号分割的数字,现在我们要进行对他排序,排序好不能重复(不能用DB);

第二个:
给出你一个数找到相邻的数字(12,222,500,888,991,1000)
比如:我给的是13,那么相邻最近的是12。 我给的是998,那么相邻最近的是1000

第一个问题是典型的外排序问题,最简单的方法就是归并排序,详见https://zh.wikipedia.org/wiki/%E5%A4%96%E6%8E%92%E5%BA%8F

第二个问题可以通过二分法找到给的数字相邻两边的数字。

你这个文件二分的时候需要向前或者向后找到临近的逗号,然后再读取逗号两边的数。

第一个可以用外排,但如果数字都是整数的话,用位图会更简单,一次完成排序+去重
第二个,给出的数字集合是有序的吗?如果是,直接二分查找即可。

  1. 堆排序应该能适应一维海量数据的排序需求。

  2. 一维的最近邻查询。如果也要支持海量数据,那么数据结构可以用 B 树,在对 B 树进行深度优先遍历的过程中进行剪枝,不断向最近邻目标逼近。如果只是在内存里查找最近邻,用二叉搜索树也行。

其实用第 2 种方法我说的 B 树,也可以解决第 1 个问题。先建 B 树,然后从文件中最小的数据开始,以此寻找最近邻就可以了。比如最小数据为 a,从树中删除 a,再查询它的最近邻,得到 b,从树中删除 b,现在就有了 a->b。继续查询 b 的最近邻,得到 c,从树中删除 c,这样就得到 a->b->c……以此类推。时间复杂度应该是 O(nlog n)的。

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿