知识点一 算术平均数与加权平均数
1. 算术平均数
算术平均数:一般地,对于 n 个数 x₁, x₂, ..., xₙ,我们把
叫做这 n 个数的算术平均数,简称平均数,记作 {x}(读作"x 拔")。
2. 加权平均数
加权平均数:在实际问题中,一组数据里的各个数据的"重要程度"未必相同,因而在计算平均数时,往往给每个数据一个"权",由此计算出的平均数叫做加权平均数。
公式:
其中 f₁, f₂, ..., fₖ 分别是 x₁, x₂, ..., xₖ 的权。
3. 权的意义
| 权的含义 | 说明 |
|---|---|
| 出现次数(频数) | 某数据在数据组中出现的次数 |
| 所占比例 | 某数据占整体的比重 |
| 重要程度 | 根据实际情况赋予的权重 |
公式简化:若权以比例形式给出(f₁ + f₂ + ... + fₖ = 1),则:
4. 算术平均数与加权平均数的关系
- 算术平均数是加权平均数的特例(所有数据的权相等的情况)
- 当各数据的权相等时,加权平均数 = 算术平均数
- 加权平均数更能体现不同数据的重要性差异
知识点二 中位数与众数
1. 中位数
中位数:将一组数据按大小顺序排列后,处于最中间位置的一个数据(或最中间两个数据的平均数),叫做这组数据的中位数。
| 数据个数 | 中位数 |
|---|---|
| 奇数个 | 最中间的那个数据 |
| 偶数个 | 最中间两个数据的算术平均数 |
步骤: 1. 将数据从小到大排序 2. 确定中间位置 3. 取中间的数据(或两个数据的平均数)
2. 众数
众数:一组数据中出现次数最多的数据叫做这组数据的众数。
特征: - 一组数据的众数可能不止一个(可能有多个数据出现次数相同且最多) - 一组数据可能没有众数(当所有数据出现次数相同时)
3. 平均数、中位数、众数的对比
| 统计量 | 定义 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|---|
| 平均数 | 所有数据的平均值 | 充分利用所有数据 | 易受极端值影响 | 数据分布均匀时 |
| 中位数 | 排序后中间位置的值 | 不受极端值影响 | 未充分利用所有数据 | 有极端值时 |
| 众数 | 出现次数最多的值 | 代表数据集中趋势 | 代表性可能不够 | 关注多数情况时 |
4. 平均数、中位数、众数的选择
| 场景 | 推荐统计量 | 原因 |
|---|---|---|
| 数据中有极端值 | 中位数 | 不受极端值影响 |
| 关注整体平均水平 | 平均数 | 反映整体水平 |
| 关注大多数情况 | 众数 | 反映普遍情况 |
| 需要做进一步计算 | 平均数 | 便于数学计算 |
知识点三 极差、方差、标准差
1. 极差
极差:一组数据中的最大值与最小值的差。
特征: - 极差越大,说明数据的波动范围越大 - 极差计算简单,但只用了两个极端数据,信息利用不充分
2. 方差
方差:各数据与平均数的差的平方的平均数。
方差的意义: - 方差衡量一组数据的波动大小(离散程度) - 方差越大,数据波动越大,越不稳定 - 方差越小,数据波动越小,越稳定
3. 标准差
标准差:方差的算术平方根。
- 标准差的单位与原数据一致
- 标准差同样反映数据的波动程度
- 标准差越大,数据越分散
4. 计算方差的简化方法
- 先求平均数 {x}
- 计算每个数据与平均数的差
- 将每个差平方
- 求这些平方数的平均数
💡 技巧:可以利用公式 s2 = (x₁2 + x₂2 + ·s + xₙ2)/(n) - {x}2 简化计算。
知识点四 数据的波动
1. 数据波动的概念
数据波动:指一组数据中各数据偏离平均数的程度。波动大意味着数据分散,波动小意味着数据集中。
2. 衡量波动的工具对比
| 工具 | 含义 | 优点 | 缺点 |
|---|---|---|---|
| 极差 | 最大值与最小值的差 | 计算简单,直观 | 只用到两个数据 |
| 方差 | 各数据与平均数差的平方的平均值 | 利用了全部数据 | 单位是原数据单位的平方 |
| 标准差 | 方差的算术平方根 | 单位与原数据一致 | 计算较复杂 |
3. 用方差比较数据的稳定性
比较两组数据的波动(稳定性)时: 1. 分别求出两组数据的平均数 2. 分别求出两组数据的方差(或标准差) 3. 比较方差大小:方差小的一组更稳定
💡 应用:在选拔运动员、评价产品质量稳定性等场景中经常用到方差的比较。
4. 平均数和方差在实际中的应用
在实际问题中,常需要同时考虑"水平"和"稳定性":
| 情况 | 判断标准 |
|---|---|
| 平均数相同 | 方差小的更好(更稳定) |
| 方差相同 | 平均数大的更好(平均表现更好) |
| 都不同 | 需要综合考量 |
重点例题
例题1 求加权平均数
题目:某同学的三次数学测验成绩分别为 85 分、90 分、95 分,按 20%、30%、50% 的权重计算该同学的加权平均分。
解析:
答案:加权平均分为 91.5 分。
例题2 求中位数和众数
题目:求数据组 3, 5, 3, 7, 5, 8, 5, 9, 6 的中位数和众数。
解析:
排序:3, 3, 5, 5, 5, 6, 7, 8, 9(共 9 个数据,奇数个)
中位数为第 5 个数据:5
众数:5(出现 3 次,最多)
答案:中位数为 5,众数为 5。
例题3 计算方差
题目:甲、乙两人各射击 5 次,成绩如下(单位:环):
甲:7, 8, 9, 8, 8 乙:6, 10, 8, 9, 7
谁的成绩更稳定?
解析:
甲的平均数:{x}₁ = (7+8+9+8+8)/5 = 8 乙的平均数:{x}₂ = (6+10+8+9+7)/5 = 8
甲的方差:
乙的方差:
因为 s₁2 < s₂2,所以甲的成绩更稳定。
易错点提醒
- ⚠️ 算术平均数与加权平均数的混淆:当数据的"权"不同时,不能用算术平均数代替加权平均数
- ⚠️ 中位数的求法:一定要先排序,再找中间位置的数;偶数个数据时要取中间两个数的平均数
- ⚠️ 众数可能不唯一:一组数据可能有多个众数,也可能没有众数
- ⚠️ 方差公式记忆:是差的平方的平均值,不要忘了平方
- ⚠️ 极差只用两个数据:极差只能粗略反映数据的波动范围,不能全面反映离散程度
- ⚠️ 平均数受极端值影响:当数据有极端值时,中位数比平均数更能反映数据的集中趋势
方法技巧
1. 计算方差的简便技巧
如果数据较大,可以先将每个数据减去一个适当的常数 A(通常取接近平均数的值),计算简化后方差不变,再修正。
2. 选择合适的统计量描述数据
| 你关心的问题 | 选用的统计量 |
|---|---|
| 整体平均水平 | 平均数 |
| 中等水平 | 中位数 |
| 大多数水平 | 众数 |
| 波动/稳定性 | 方差(或标准差) |
| 数据范围 | 极差 |
3. 两组数据的比较方法
- 比平均水平:比较平均数或中位数,谁大谁的整体水平高
- 比稳定性:比较方差或标准差,谁小谁更稳定
- 综合比较:若既有水平差异又有稳定性差异,需结合实际问题判断
本章知识框架
第6章 数据的分析
├── 算术平均数与加权平均数
│ ├── 算术平均数:x̄ = (x₁+x₂+...+xₙ)/n
│ ├── 加权平均数:x̄ = (x₁f₁+x₂f₂+...+xₖfₖ)/(f₁+f₂+...+fₖ)
│ ├── 权的意义(频数、比例、重要程度)
│ └── 算术平均数与加权平均数的关系
├── 中位数与众数
│ ├── 中位数(排序后中间位置的值)
│ ├── 众数(出现次数最多的值)
│ ├── 平均数、中位数、众数的对比
│ └── 各统计量的适用场景与选择
├── 极差、方差、标准差
│ ├── 极差 = 最大值 - 最小值
│ ├── 方差:s² = Σ(xᵢ-x̄)²/n
│ ├── 标准差:s = √(s²)
│ └── 方差的计算简化方法
└── 数据的波动
├── 波动的概念
├── 衡量波动的工具对比(极差/方差/标准差)
├── 用方差比较数据的稳定性
└── 平均数与方差的综合应用
📌 笔记区
本文档由 AI 辅助生成,仅供参考学习使用