统计与概率 · 第十五课

数据收集与整理

从调查对象出发,区分全面调查与抽样调查,理解总体、个体、样本、样本容量,并会用频数和频率整理数据。

知识关系图

数据收集与整理知识关系图:核心包括全面调查、抽样调查、总体、个体、样本、样本容量、频数、频率、调查方式选择、样本代表性和频数分布表。
用一张图看清调查方式、样本概念和数据整理流程。

数据收集与整理包括全面调查、抽样调查、总体、个体、样本、样本容量、频数和频率。全面调查适合总体较小或需要准确掌握全部情况的问题。抽样调查适合总体较大、调查成本较高或具有破坏性的问题。样本应具有代表性。频率等于频数除以总数。

动态交互演示

从调查对象到频数分布表

统计入门

1. 调查方式选择

判断用全面调查还是抽样调查,要看总体大小、成本和是否有破坏性。

了解全班最喜欢的运动总体数量:42调查成本:风险:

建议:全面调查人数少、容易全部询问,用全面调查更准确。

2. 总体、样本与样本容量

总体是研究对象全体,样本是从总体中抽取的一部分,样本容量是样本中个体的数量。

抽样比例约 10%,样本容量是 120

3. 样本代表性判断

样本不仅要有数量,还要能代表总体结构。

代表性评分86/100

从总体各部分随机抽取,代表性更强。

4. 频数与频率

频数是出现次数,频率是频数占总数的比例。

分组频数频率
60-6920.10
70-7960.30
80-8970.35
90-10050.25

总数 20,频率 = 频数 ÷ 总数。

5. 随机生成题目

为了了解全校 1800 名学生的睡眠时间,只调查篮球队 20 名学生,样本合理吗?

例题

例题 1:调查方式选择

题目:了解一个班 40 名学生最喜欢的运动项目,应该采用全面调查还是抽样调查?

班级人数较少,逐个调查成本低。
为了得到准确结果,可调查每一名学生。

答案:全面调查

例题 2:样本容量

题目:为了了解全校 1500 名学生的阅读时间,抽取 120 名学生调查。总体和样本容量分别是什么?

总体:全校 1500 名学生的阅读时间情况。
样本:被抽取的 120 名学生的阅读时间情况。
样本容量:120。

答案:总体是全校学生相关数据,样本容量为 120。

例题 3:样本代表性

题目:想了解全校学生早餐情况,只调查校门口便利店买早餐的学生,合理吗?

样本应能代表总体。
只调查便利店买早餐的学生,会遗漏在家吃早餐或不吃早餐的学生。
样本有偏差。

答案:不合理。

例题 4:频率计算

题目:某组数据共有 50 个,其中“优秀”出现 15 次,频率是多少?

频率 = 频数 ÷ 总数
频率 = 15 ÷ 50 = 0.3

答案:0.3

易错点

  • 全面调查不是永远更好;当总体很大、成本高或有破坏性时,应考虑抽样调查。
  • 样本容量只是样本中个体数量,不等于总体数量。
  • 样本代表性比“只看数量大不大”更重要。
  • 频数是次数,频率是比例,二者不能混用。
  • 频率之和通常为 1,百分比形式之和通常为 100%。
  • 整理数据时要注意分组不重不漏。