17.2.2用样本的分布频率分布估计总体分布 |
|
2019-10-04 10:22:28 |
|
17.2.2用样本的分布频率分布估计总体分布 用样本估计总体,是研究统计问题的一个基本思想方法,对于不易知道的总体分布,常用样本的频率分布对它进行估计.样本容量越大,这种估计就越精确,用样本估计总体的思想就是用部分考查全体,用离散考查连续,用有限考查无限的思想,使原来不可以解决的问题,能基本解决. (1)频率分布直方图 反映样本的频率分布规律的直方图,称为频率分布直方图,简称频率直方图. 画频率分布直方图的主要步骤: ①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; 组距和组数的确定没有固定的标准,常常需要一个尝试和选择的过程.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.当然,数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5~12组. 组距是指每个小组的两个端点之间的距离 为了方便,组距的选择应力求“取整” $组数 =\dfrac{极差}{组距}$ ③将数据分组; 决定分点.使分点比数据多一位小数,并且把第1小组的下限略去,或把第1组的起点稍微减小一点,目的是将样本数据落在每一个组内部. ④列频率分布表; 落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.算出各小组的频率,填入表中,
这个表叫做频率分布表. ⑤画频率分布直方图, 图中每个小长方形的面积表示相应各组的频率,即小长方形的面积=组距x$\dfrac{频率}{组距}$=频率. 这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.在频率分布直方图中,各小长方形的面积的总和等于1. (2)频率分布折线图 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.如果将样本容量取得足够大,分组的组距取得足够小,则这条折线趋向于一条光滑曲线,我们称这一曲线为总体分布的密度曲线. 总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率.根据这条曲线,总体在(4,6)内取值的百分率就是总体密度曲线与直线x=a,x=b及x轴所围成图形的面积. (3)茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数. 当样本数据较少时,用茎叶图表示数据的效果较好.制作两位数茎叶图的方法是将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出共茎的叶在同一行列出. (4)几种表示频率分布的方法的优点与不足 ①频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便. ②频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容. ③频率分布折线图的优点是它反映了数据的变化趋势. ④用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
|
|
http://x.91apu.com//shuxue/gzzs/17tongji/32425.html |