编程珠玑之生成0至n-1之间的k个不同随机序列的扩展问题 --2014人人网笔试题目-阿里云开发者社区

编程珠玑之生成0至n-1之间的k个不同随机序列的扩展问题 --2014人人网笔试题目

2013-09-25 1854

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

《编程珠玑》中习题1.4的题目是：“如果认真考虑了习题3，你将会面对生成小于n且没有重复的k个整数的问题。最简单的方法就是使用前k个正整数。这个极端的数据集合将不会明显的改变位图方法的运行时间，但是可能会歪曲系统排序的运行时间。如何生成位于0至n - 1之间的k个不同的随机顺序的随机整数？尽量使你的程序简短高效。”

解决这个问题可以使用以空间换时间的方式，基本的思想是利用洗牌的原理，将n个数(0至n-1)按次序排好，依次让每个数和一个随机挑选出的位子进行互换，这样肯定不会重复，而且次序被打乱，具有随性。只用交换k次，就可以取出k个小于n的互不相同的随机数。

由这个问题我们引出以下这个笔试题目的问题：

“使用一个长度为n的数组来产生随机数，当产生的随机数与数组的存在的相同则重新随机，当不同时插入到数组中，使用这种方法产生 1到n 的随机数的期望次数是多少次？（编程实现）”

解答：

一般的思想是产生一个随机数 arr[i] 后，和前面已经产生的arr[0]~arr[i-1]进行比较，如果有重复的就重新产生一个，该算法的平均时间复杂度为：O（n^2) ，而最坏复杂度为无限！！

这里我们按照编程珠玑上那个问题的扩展想法，利用空间换时间的算法，生成随机排列的数，此时时间复杂度为O（n）。

（1）建立一个长度为n+1的临时数组b，对该数组赋值依次赋值0~n, 即b[i] = i;

（2）取一个1~n之间的随机整数k=rand(0,n]，取b[k]读入arr[i]，再将b数组最后一个元素b[b.size-1]赋值给b[k]，将b的长度减1；

代码实现：

/*
*BLOG:http://blog.csdn.net/wdzxl198
*AUTHOR:Atlas
*EMAIL:wdzxl198@163.com
*/
#include<iostream>
using namespace std;

void Random(int *arr,int length)
{
	srand(time(NULL));
	int i,randnum;
	int limitsize = length;
	int b[limitsize];
	for(i=0; i<limitsize; i++)
	{
	   b[i] = i+1;
	}
	for(i=0; i<length; i++)
	{
	   randnum = rand()%limitsize;
	   limitsize--;
	   arr[i] = b[randnum];
	   b[randnum] = b[limitsize];
	}
}

int main()
{
	int arr[100];
	//假使随机出1到100的随机数
	Random(arr,100);	
	for(int i=0;i<100;i++)
	{
		cout<<arr[i]<<" ";
	}
	cout<<endl;	
	
	quickSort(arr,0,99);

	for(int i=0;i<100;i++)
	{
		cout<<arr[i]<<" ";
	}
	
	cout<<endl;	
	system("PAUSE");
	return 0;
}

这种方法的是O（n）时间复杂度，但是没有求出题目中期望的次数。

在求期望的过程中，我发现一篇博文，题目是有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。，这个题目与文章中的类似，转载过来分析下，

import java.util.Random;  
import java.util.Set;  
import java.util.TreeSet;  
/** 
 * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 
 * 写一个函数实现。复杂度是什么。 
 * bitmap，只要一个bit就可以标记是否被取过，可参考《编程珠玑》的位图排序 
 *  
 * 时间复杂度的话，我不太会算，以下是引用https://github.com/vyan/test/blob/master/accessTimes.cpp： 
 * 使用bit打点记录已经取的数，  
 * 复杂度分析，假设数组总长度为n  
 * 取到第1个之前未被取到的数的期望 E(1)=1  
 * 取到第2个之前未被取到的数的期望 E(2)=n/n-1  
 * 取到第3个之前未被取到的数的期望 E(3)=n/n-2  
 * ... 
 * 取到第n个之前未被取到的数的期望 E(n)=n/1  
 * 总得期望次数E=n+n/(n-1)+n/(n-2)+...+n/1; 
 *              =n(1+1/(n-1)+1/(n-2)+...+1/1)  
 *              =nln(n)  
 * 所以算法平均复杂度为nlogn  
 *  
 * 下面的代码里面，除法和求模运算我都用位运算来实现，事实上直接用java提供的（/,%）也可以 
 * 同时，为了验证是否真的取到了数组的所有元素，我用了TreeSet保存已选中的下标（去重） 
 *  
 * 最后，还有一个问题是，可能取了很多次，都没能全选中，这个时候可以设置一个最长时间或者最大尝试次数，超过则结束程序， 
 * 避免程序长时间运行甚至死循环 
 *  
 * @author lijinnan 
 *  
 */  
public class TimesOfAccessArray {  
  
    public static final int SHIFT = 5;  
    public static final int BLOCK_SIZE = (1 << SHIFT);  //32  
    public static final int MASK = (1 << SHIFT) - 1;  //31  
  
    public static void main(String[] args) {  
        int[] array = new int[200];  
        long times = accessTimes(array);  
        System.out.println(times);  
    }  
      
    public static long accessTimes(int[] array) {  
        if (array == null || array.length == 0) {  
            return -1L;  
        }  
        long result = 0L;  
        int len = array.length;  
        int[] bitmap = new int[divide(len, BLOCK_SIZE) + 1];  
        int setTimes = 0;  
        Set<Integer> set = new TreeSet<Integer>();  
        while (setTimes < len) {  
            int pos = new Random().nextInt(len);  
            set.add(pos);  
            if (set(bitmap, pos)) {  
                setTimes++;  
            }  
            result++;  
        }  
        System.out.println(set);  
        return result;  
    }  
      
    public static boolean set(int[] bitmap, int pos) {  
        boolean result = false;  
        int blockNo = divide(pos, BLOCK_SIZE);  
        int index = mod(pos, BLOCK_SIZE);  
        boolean notExist = (bitmap[blockNo] & (1 << index))== 0;  
        if (notExist) {  
            bitmap[blockNo] |= (1 << index);  
            result = true;  
        }  
        return result;  
    }  
  
    public static boolean exist(int[] bitmap, int pos) {  
        int blockNo = divide(pos, BLOCK_SIZE);  
        int index = mod(pos, BLOCK_SIZE);  
        return (bitmap[blockNo] & (1 << index)) != 0;  
    }  
      
    private static int divide(int x, int y) {  
        return x >> offSet(y);  
    }  
  
    private static int mod(int x, int y) {  
        int z = x;  
        int i = offSet(y);  
        return z - ((z >> i) << i);  
    }  
      
    //e.g. 32=2^5, return 5 只考虑2的幂  
    private static int offSet(int y) {  
        return howManyBits(y) - 1;  
    }  
  
    //二进制的表示里面，有多少位。例如32是6位  
    private static int howManyBits(int y) {  
        int bitNum = 0;  
        while (y != 0) {  
            y = (y >> 1);  
            bitNum++;  
        }  
        return bitNum;  
    }  
     
  
}

编程珠玑之生成0至n-1之间的k个不同随机序列的扩展问题 --2014人人网笔试题目

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

编程珠玑之生成0至n-1之间的k个不同随机序列的扩展问题 --2014人人网笔试题目

热门文章

最新文章

相关课程

相关电子书

相关实验场景