Administrator
发布于 2026-06-05 / 2 阅读
0
0

06 - 数据的分析


知识点一 算术平均数与加权平均数

1. 算术平均数

算术平均数:一般地,对于 n 个数 x₁, x₂, ..., xₙ,我们把

{x} = (x₁ + x₂ + ·s + xₙ)/(n)

叫做这 n 个数的算术平均数,简称平均数,记作 {x}(读作"x 拔")。


2. 加权平均数

加权平均数:在实际问题中,一组数据里的各个数据的"重要程度"未必相同,因而在计算平均数时,往往给每个数据一个"权",由此计算出的平均数叫做加权平均数。

公式

{x} = (x₁f₁ + x₂f₂ + ·s + xₖfₖ)/(f₁ + f₂ + ·s + fₖ)

其中 f₁, f₂, ..., fₖ 分别是 x₁, x₂, ..., xₖ


3. 权的意义

权的含义 说明
出现次数(频数) 某数据在数据组中出现的次数
所占比例 某数据占整体的比重
重要程度 根据实际情况赋予的权重

公式简化:若权以比例形式给出(f₁ + f₂ + ... + fₖ = 1),则:

{x} = x₁f₁ + x₂f₂ + ·s + xₖfₖ

4. 算术平均数与加权平均数的关系

  • 算术平均数是加权平均数的特例(所有数据的权相等的情况)
  • 当各数据的权相等时,加权平均数 = 算术平均数
  • 加权平均数更能体现不同数据的重要性差异

知识点二 中位数与众数

1. 中位数

中位数:将一组数据按大小顺序排列后,处于最中间位置的一个数据(或最中间两个数据的平均数),叫做这组数据的中位数。

数据个数 中位数
奇数个 最中间的那个数据
偶数个 最中间两个数据的算术平均数

步骤: 1. 将数据从小到大排序 2. 确定中间位置 3. 取中间的数据(或两个数据的平均数)


2. 众数

众数:一组数据中出现次数最多的数据叫做这组数据的众数。

特征: - 一组数据的众数可能不止一个(可能有多个数据出现次数相同且最多) - 一组数据可能没有众数(当所有数据出现次数相同时)


3. 平均数、中位数、众数的对比

统计量 定义 优点 缺点 适用场景
平均数 所有数据的平均值 充分利用所有数据 易受极端值影响 数据分布均匀时
中位数 排序后中间位置的值 不受极端值影响 未充分利用所有数据 有极端值时
众数 出现次数最多的值 代表数据集中趋势 代表性可能不够 关注多数情况时

4. 平均数、中位数、众数的选择

场景 推荐统计量 原因
数据中有极端值 中位数 不受极端值影响
关注整体平均水平 平均数 反映整体水平
关注大多数情况 众数 反映普遍情况
需要做进一步计算 平均数 便于数学计算

知识点三 极差、方差、标准差

1. 极差

极差:一组数据中的最大值与最小值的差

{极差} = {最大值} - {最小值}

特征: - 极差越大,说明数据的波动范围越大 - 极差计算简单,但只用了两个极端数据,信息利用不充分


2. 方差

方差:各数据与平均数的差的平方的平均数。

s2 = ((x₁ - {x})2 + (x₂ - {x})2 + ·s + (xₙ - {x})2)/(n)

方差的意义: - 方差衡量一组数据的波动大小(离散程度) - 方差越大,数据波动越大,越不稳定 - 方差越小,数据波动越小,越稳定


3. 标准差

标准差:方差的算术平方根。

s = √{((x₁ - {x})2 + (x₂ - {x})2 + ·s + (xₙ - {x})2)/(n)}
  • 标准差的单位与原数据一致
  • 标准差同样反映数据的波动程度
  • 标准差越大,数据越分散

4. 计算方差的简化方法

  1. 先求平均数 {x}
  2. 计算每个数据与平均数的差
  3. 将每个差平方
  4. 求这些平方数的平均数

💡 技巧:可以利用公式 s2 = (x₁2 + x₂2 + ·s + xₙ2)/(n) - {x}2 简化计算。


知识点四 数据的波动

1. 数据波动的概念

数据波动:指一组数据中各数据偏离平均数的程度。波动大意味着数据分散,波动小意味着数据集中。


2. 衡量波动的工具对比

工具 含义 优点 缺点
极差 最大值与最小值的差 计算简单,直观 只用到两个数据
方差 各数据与平均数差的平方的平均值 利用了全部数据 单位是原数据单位的平方
标准差 方差的算术平方根 单位与原数据一致 计算较复杂

3. 用方差比较数据的稳定性

比较两组数据的波动(稳定性)时: 1. 分别求出两组数据的平均数 2. 分别求出两组数据的方差(或标准差) 3. 比较方差大小:方差小的一组更稳定

💡 应用:在选拔运动员、评价产品质量稳定性等场景中经常用到方差的比较。


4. 平均数和方差在实际中的应用

在实际问题中,常需要同时考虑"水平"和"稳定性":

情况 判断标准
平均数相同 方差小的更好(更稳定)
方差相同 平均数大的更好(平均表现更好)
都不同 需要综合考量

重点例题

例题1 求加权平均数

题目:某同学的三次数学测验成绩分别为 85 分、90 分、95 分,按 20%、30%、50% 的权重计算该同学的加权平均分。

解析

{x} = 85 × 20% + 90 × 30% + 95 × 50% = 85 × 0.2 + 90 × 0.3 + 95 × 0.5 = 17 + 27 + 47.5 = 91.5

答案:加权平均分为 91.5 分。


例题2 求中位数和众数

题目:求数据组 3, 5, 3, 7, 5, 8, 5, 9, 6 的中位数和众数。

解析

排序:3, 3, 5, 5, 5, 6, 7, 8, 9(共 9 个数据,奇数个)

中位数为第 5 个数据:5

众数:5(出现 3 次,最多)

答案:中位数为 5,众数为 5。


例题3 计算方差

题目:甲、乙两人各射击 5 次,成绩如下(单位:环):

甲:7, 8, 9, 8, 8 乙:6, 10, 8, 9, 7

谁的成绩更稳定?

解析

甲的平均数:{x}₁ = (7+8+9+8+8)/5 = 8 乙的平均数:{x}₂ = (6+10+8+9+7)/5 = 8

甲的方差:

s₁2 = ((7-8)2 + (8-8)2 + (9-8)2 + (8-8)2 + (8-8)2)/(5) = (1+0+1+0+0)/(5) = 0.4

乙的方差:

s₂2 = ((6-8)2 + (10-8)2 + (8-8)2 + (9-8)2 + (7-8)2)/(5) = (4+4+0+1+1)/(5) = 2

因为 s₁2 < s₂2,所以甲的成绩更稳定。


易错点提醒

  • ⚠️ 算术平均数与加权平均数的混淆:当数据的"权"不同时,不能用算术平均数代替加权平均数
  • ⚠️ 中位数的求法:一定要先排序,再找中间位置的数;偶数个数据时要取中间两个数的平均数
  • ⚠️ 众数可能不唯一:一组数据可能有多个众数,也可能没有众数
  • ⚠️ 方差公式记忆:是差的平方的平均值,不要忘了平方
  • ⚠️ 极差只用两个数据:极差只能粗略反映数据的波动范围,不能全面反映离散程度
  • ⚠️ 平均数受极端值影响:当数据有极端值时,中位数比平均数更能反映数据的集中趋势

方法技巧

1. 计算方差的简便技巧

如果数据较大,可以先将每个数据减去一个适当的常数 A(通常取接近平均数的值),计算简化后方差不变,再修正。

2. 选择合适的统计量描述数据

你关心的问题 选用的统计量
整体平均水平 平均数
中等水平 中位数
大多数水平 众数
波动/稳定性 方差(或标准差)
数据范围 极差

3. 两组数据的比较方法

  1. 比平均水平:比较平均数或中位数,谁大谁的整体水平高
  2. 比稳定性:比较方差或标准差,谁小谁更稳定
  3. 综合比较:若既有水平差异又有稳定性差异,需结合实际问题判断

本章知识框架

第6章 数据的分析
├── 算术平均数与加权平均数
│   ├── 算术平均数:x̄ = (x₁+x₂+...+xₙ)/n
│   ├── 加权平均数:x̄ = (x₁f₁+x₂f₂+...+xₖfₖ)/(f₁+f₂+...+fₖ)
│   ├── 权的意义(频数、比例、重要程度)
│   └── 算术平均数与加权平均数的关系
├── 中位数与众数
│   ├── 中位数(排序后中间位置的值)
│   ├── 众数(出现次数最多的值)
│   ├── 平均数、中位数、众数的对比
│   └── 各统计量的适用场景与选择
├── 极差、方差、标准差
│   ├── 极差 = 最大值 - 最小值
│   ├── 方差:s² = Σ(xᵢ-x̄)²/n
│   ├── 标准差:s = √(s²)
│   └── 方差的计算简化方法
└── 数据的波动
    ├── 波动的概念
    ├── 衡量波动的工具对比(极差/方差/标准差)
    ├── 用方差比较数据的稳定性
    └── 平均数与方差的综合应用

📌 笔记区


本文档由 AI 辅助生成,仅供参考学习使用

随堂测验

阅读完文章后,来检验一下掌握程度吧

随堂测验

阅读完文章后,来检验一下你的掌握程度吧

-- 道题目
-- 选择题
-- 判断题

评论