bootstrap方法的原理:当总体分布未知时,我们可以通过对总体进行反复的、有放回的抽样,从而组建多个样本并利用这些样本对总体进行推断,这个方法被称为非参数bootstrap方法。

当我们已经知道总体的分布函数,但其中含有待估参数时,我们也可以使用这种方法对参数进行估计,此时可以称为参数bootstrap方法。因此与上一讲提到的置换检验相比,bootstrap方法很适合来解决参数估计的问题。

网上有一个例子对bootstrap方法解释的很好。这个例子说为了测量池塘中有多少鱼,我们可以首先在池塘中放入100尾带有标记的鱼,过一段时间后当池塘中的鱼混合均匀后,我们可以进行反复的有放回的捕捞,看看每次捞出的鱼当中有多少带有标记,从而对池塘中鱼的总量进行估计。这个例子很形象的解释了bootstrap方法的原理。

bootstrap这个方法也被称为自助法、自举法、靴攀法。说实话当我初学这个方法时,光听名字就感到莫名其妙。直到后来在了解了该方法的由来之后,我才发现我们的教材简直是害人不浅,把明明一门很有意思的课硬是搞成了劝退课程。

bootstrap字面的意义就是鞋带,该方法的发明者起这个名字的缘由指的是用自己的鞋带把自己提升起来,很好的契合了该方法的原理。这让我想小时候家里天天播放的TVB版的天龙八部,剧中常见大侠们用左脚踩右脚上天的场景

使用bootstrap进行参数估计

接下来我们使用bootstrap方法来估计women数据集中weight变量均值的95%可信区间。


> library(boot<

更多推荐

R语言统计分析:bootstrap方法