周末的深夜,Linux老大发布了紧急会议通知,召集CPU、内存、硬盘等所有硬件,以及git、 vim、浏览器、c、 Java等所有软件参会。
老大对深夜打扰大家深表歉意,表示春节快来了,到时候一定让大家好好休息,然后就进入中心议题:人类要求我们学会“掷骰子”,该怎么办?
内存表示不解:为啥?想让我们赌钱玩吗?我们这儿可没有骰子!
Linux老大:其实不是真正的掷骰子,是生成随机数,随机数在我们计算机里用途极为广泛,生成密钥,进行通信,生成盐(salt)...... 不可能指望人去手工操作。
vim笑道:生成随机数? 这太简单了,让新手退出我vim就行了。
Linux老大:为啥?
vim: 哈哈,因为新手不知道怎么才能退出vim,就会瞎胡乱按一通, 非常随机,这不就形成随机数了吗?!
CPU阿甘:这笑话够冷的!
Linux老大:口头警告vim一次,严肃点儿, 生成随机数是非常重要的事情,人类要求:
1. 要杂乱无章
2. 不能预测,不能根据已经生成的随机数,推测出下一个随机数是啥
3. 不能重现, 无法重现和某一随机数列完全相同的数列
听到此处,大家都吸了一口冷气,这要求够高的!人类通过掷骰子可以达到这个要求,但是计算机里都是确定的算法和程序,这该怎么办?
C老头儿说:我提一个方案,我听说人类有个算法,叫做什么线性同余算法,似乎可以生成随机数。
C老头儿写下了一个公式:
内存想起和CPU阿甘折腾过的递归函数调用,说到:“看到递归我就头晕。”
C老头说:这个算法很简单,A, C, M 都是精心挑选的整数,使用者在生成随机数之前,先选一个种子(seed),比如说用当前的时间戳当作种子,我们用简单的数字做个实验, 让A = 11 , C =5, M = 13, seed = 15
“看看,是不是挺随机的!” C老头儿挺得意。
Java 说:“这个算法很简单嘛,效果也不错,我也实现一下,放到我的java.util.Random当中吧。”
C老头说:“我就放到我的srand函数和rand函数里。srand用来设定‘种子’,rand用来获取下一个随机数。”
- srand((unsigned) time(&t));
- // 输出5个随机数
- for(int i=1 ;i<=5; i++){
- printf("%d\n", rand());
- }
Java说:“看看,还是面向对象好吧,我的Random类封装了内部状态,用户只需要在创建Random对象的时候把种子传进去(不传也行,我自己默认给它设置一个),然后就nextInt()方法就可以了。多简单!”
- Random r = new Random();
- for(int i=1; i<=5; i++){
- System.out.println(r.nextInt());
- }
C老头儿正要反击自以为是的Java, CPU阿甘又发言了:“不对啊,你这个随机数不符合我们老大的要求啊,这不是真正的随机数,这是伪随机数!”
C老头儿马上把注意力转移到阿甘身上:“凭什么说这是伪随机数?”
CPU阿甘说:“老大说了,要不可预测,但是你这公式,我如果知道了上一个随机数,下一个随机数我自己代入那个公式就可以计算出来了,在我这里,一毫秒都用不了,完全可以预测。”
阿甘此言不虚,他的速度是整个计算机系统最快的。
"还有,你居然用当前时间做种子,那我也用同样的时间做种子,岂不是可以生成和你一模一样的随机数队列?完全可以重现啊。”
C老头儿连续挨了两记闷棍,嘴里嘟囔着,但也说不出话来了。
Linux老大赶紧和稀泥:“虽然是伪随机数,但是这个算法非常简单,对于那些对安全要求不高的场合,比如玩游戏的时候,还是非常有用的。我们再想想,怎么生成真正的随机数吧!”
C老头儿说到:要不这样,我们可以使用Hash函数。
- R1 = hash(seed)
- seed = seed + 1
- R2 = hash(seed)
- seed = seed + 1
- R3 = hash(seed)
- seed = seed + 1
- R4 = hash(seed)
- ......
CPU阿甘说:“这个方法还行,在不知道种子(seed)的情况下,你给我一个随机数,我是无法预测下一个的,因为随机数是hash函数生成的,是个单向的过程。但是,如果我知道了种子,那就可以生成和你一模一样的随机数列,所以不满足‘不可重现’的性质。”
看来生成真正的随机数太难了,大家都沉默了。
过了良久, vim突然说到:你们以为我说的是笑话,但是思路却是可以借鉴啊?大家想想
用户敲击键盘的速度节奏是不是随机的?
用户的鼠标移动是不是随机的?
网卡每秒发送的数据量是不是随机的?
硬盘每秒写入的数据是不是随机的?
如果我们把这些随机的东西给综合起来......
Linux老大非常高兴:“没错,我们可以把它们认为是机器运行的环境噪音,我把它们收集起来放到一个池子里......”
CPU阿甘马上接口:“然后,可以用个Hash算法对这个池子中的内容做个消息摘要,结果就是真随机数了!杂乱无章,无法预测,无法重现。”
vim感觉有点不爽,这俩人也太会抢功劳了。
C老头儿也频频点头:“这个办法妙啊,我可以修改一下我的rand函数,来获得这个值......”
Linux老大:“别别,你的伪随机数还是要保留,上周码农翻身公众号刚刚说过,一切皆文件,我可以生成一个特殊的文件,就叫/dev/random吧,这样程序员就可以使用最常用的open ,read等方法来调用了!”
Linux老大说完,又感慨了一句:“终于,我们学会掷骰子了!”
一天以后。
CPU阿甘兴冲冲地跑来找Linux老大:老大,昨天忘了一件事,我的硬件就支持真正的随机数生成啊,我可以利用电阻的热噪声来生成的,是真随机数,用RdRand指令就能获得。
Linux老大:这个硬件是你出生的时候就被植入了,是个黑盒子,如果NSA在里边安装了后门,怎么办?
CPU阿甘看着自己的身体,愣住了......
【本文为51CTO专栏作者“刘欣”的原创稿件,转载请通过作者微信公众号coderising获取授权】