蓄水池抽样算法(Reservoir Sampling) 2019/11/21 Uncategorized 一、问题 蓄水池算法是一个数据抽样算法,寥寥几行,却暗藏玄机。主要用来解决如下问题: 给定一个数据流,数据流长度N很大,且N直到处理完所有数据之前都不可知,请问如何在只遍历一遍数据(O(N))的情况下,能够随机选取出m个不重复的数据。… 阅读