Administrator
发布于 2026-06-16 / 0 阅读
0
0

02 - 随机变量及其分布


知识点1 离散型随机变量及其分布列

1. 随机变量的概念

一般地,如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,常用大写字母 X, Y, ξ, η 等表示。

所有取值可以一一列出的随机变量称为离散型随机变量

💡 说明:随机变量是这样一种变量——随着试验结果的变化而取不同的值,在试验之前只知道它可能取值的范围,而不能预知它取什么值。

2. 分布列

一般地,若离散型随机变量 X 可能取的不同值为 x₁, x₂, …, xₙ,且:

P(X = xᵢ) = pᵢ, i = 1, 2, …, n

用表格表示为:

X x₁ x₂ xₙ
P p₁ p₂ pₙ

这个表格称为离散型随机变量 X概率分布列,简称分布列

3. 分布列的性质

  • (非负性)pᵢ ≥ 0, i = 1, 2, …, n
  • (归一性)p₁ + p₂ + … + pₙ = 1

知识点2 两点分布(伯努利分布)

1. 定义

如果随机变量 X 的分布列为:

X 0 1
P 1 - p p

其中 0 < p < 1,则称 X 服从两点分布(或0-1分布伯努利分布)。

💡 说明:两点分布是最简单、最基本的离散分布,它描述了只有两种可能结果的随机试验(如抛硬币、成功/失败等)。

:抛一枚质地均匀的硬币一次,记正面朝上为1,反面朝上为0,则 X 服从参数 p = 0.5 的两点分布。


知识点3 二项分布

1. n 次独立重复试验

在相同条件下重复做的 n 次试验称为n 次独立重复试验。其特点是: - 每次试验只有两个可能的结果("成功"或"失败"); - 每次试验"成功"的概率相同,均为 p; - 各次试验的结果相互独立。

2. 二项分布的定义

在 n 次独立重复试验中,用 X 表示事件 A("成功")发生的次数,则:

P(X = k) = C(n, k) p^k (1 - p)^(n - k), k = 0, 1, 2, …, n

此时称随机变量 X 服从二项分布,记为:

X ~ B(n, p)

其中 n 为试验次数,p 为每次试验成功的概率。

💡 说明:二项分布的本质是 n 重伯努利试验中成功次数的分布。两点分布就是 n=1 时的二项分布 B(1, p)。

3. 二项分布的均值与方差

X ~ B(n, p),则:

E(X) = np
D(X) = np(1 - p)

:某射手每次射击命中目标的概率为 0.8,独立射击 5 次,求命中次数 X 的分布列、期望和方差。

X ~ B(5, 0.8)P(X = k) = C(5, k) · 0.8ᵏ · 0.2^(5-k)E(X) = 5 × 0.8 = 4D(X) = 5 × 0.8 × 0.2 = 0.8


知识点4 超几何分布

1. 定义

设有总数为 N 件的物品,其中 M 件为次品(或某种特定类型)。从中不放回地抽取 n 件,用 X 表示这 n 件中次品的件数,则 X 的分布列为:

P(X = k) = C(M, k) · C(N - M, n - k) / C(N, n), k = 0, 1, 2, …, min(M, n)

此时称随机变量 X 服从超几何分布

2. 超几何分布的均值

E(X) = n · M / N

💡 说明:超几何分布与二项分布的主要区别在于:超几何分布是不放回抽样,各次抽取不独立;二项分布是有放回抽样(或总体很大时近似),各次抽取独立。当 N 很大而 n 相对较小时,超几何分布可近似为二项分布 B(n, M/N)。

:一箱中有 10 件产品,其中 3 件不合格。从中不放回抽取 4 件,求抽到不合格品件数 X 的分布列中 X=2 的概率。

P(X = 2) = C(3,2) · C(7,2) / C(10,4) = 3 × 21 / 210 = 63/210 = 3/10 = 0.3


知识点5 离散型随机变量的均值(期望)与方差

1. 均值(数学期望)

一般地,若离散型随机变量 X 的分布列为 P(X = xᵢ) = pᵢ,则:

E(X) = x₁p₁ + x₂p₂ + … + xₙpₙ = Σ xᵢpᵢ

称为随机变量 X 的均值数学期望。它反映了离散型随机变量取值的平均水平

2. 均值的性质

  • E(aX + b) = aE(X) + b
  • 若 X 与 Y 独立,则 E(X + Y) = E(X) + E(Y)
  • 若 X 与 Y 独立,则 E(XY) = E(X) · E(Y)

3. 方差

D(X) = Σ [xᵢ - E(X)]² pᵢ

D(X) 为随机变量 X 的方差,它刻画了随机变量取值偏离均值的平均程度σ(X) = √D(X) 称为标准差

💡 说明:方差越小,说明取值越集中在均值附近,越稳定;方差越大,说明取值越分散。

4. 方差的性质

  • D(aX + b) = a² D(X)
  • 若 X 与 Y 独立,则 D(X + Y) = D(X) + D(Y)
  • 计算方差的简便公式:D(X) = E(X²) - [E(X)]²

5. 常见分布的均值与方差总结

分布 均值 E(X) 方差 D(X)
两点分布(参数 p) p p(1-p)
二项分布 B(n, p) np np(1-p)
超几何分布 n·M/N n·(M/N)·(1-M/N)·(N-n)/(N-1)

知识点6 正态分布

1. 定义

如果对于任何实数 a < b,随机变量 X 满足:

P(a < X ≤ b) = ∫ₐᵇ φ_{μ,σ}(x) dx

其中 φ_{μ,σ}(x) = 1/(√(2π)σ) · e^{-(x-μ)²/(2σ²)},则称 X 服从参数为 μ, σ²正态分布,记为:

X ~ N(μ, σ²)

其密度曲线称为正态曲线

💡 说明:μ 是均值,决定了曲线的中心位置;σ 是标准差,决定了曲线的"胖瘦"(分散程度)。σ 越大,曲线越矮胖;σ 越小,曲线越高瘦。

2. 正态曲线的性质

  • 曲线关于直线 x = μ 对称;
  • x = μ 处达到最大值;
  • |x| → ∞ 时,曲线以 x 轴为渐近线;
  • 曲线与 x 轴之间的面积为 1。

3. 标准正态分布

μ = 0, σ = 1 时的正态分布称为标准正态分布,记为 N(0, 1)

任何一个正态分布都可以通过标准化变换转化为标准正态分布:

Z = (X - μ) / σ ~ N(0, 1)

4. 3σ 原则

对于正态分布 X ~ N(μ, σ²)

区间 概率
(μ - σ, μ + σ) 约 68.27%
(μ - 2σ, μ + 2σ) 约 95.45%
(μ - 3σ, μ + 3σ) 约 99.73%

💡 说明:3σ 原则(三西格玛原则)表明,正态分布中取值几乎全部落在以均值为中心、3 倍标准差为半径的区间内,落在该区间外的概率不足 0.3%。这是质量控制等领域的重要依据。

5. 正态分布的应用

许多自然现象和社会现象都近似服从正态分布,如身高、体重、考试成绩、测量误差等。

:已知某次考试数学成绩服从 N(70, 100),求成绩在 60 到 80 分之间的概率比例。

μ = 70, σ = 10。60 到 80 即 μ ± σ,概率约为 68.27%。


易错点提醒

  • ⚠️ 离散型与连续型随机变量:离散型取值可一一列举,连续型取值充满某个区间
  • ⚠️ 分布列的归一性p₁ + p₂ + … + pₙ = 1,可用此检验分布列是否正确
  • ⚠️ 二项分布的条件:n 次独立重复试验,每次成功概率相同,各次试验相互独立
  • ⚠️ 超几何分布 vs 二项分布:超几何分布是不放回抽样,二项分布是有放回抽样(或总体远大于样本量时近似)
  • ⚠️ E(X) 与 D(X) 的性质E(aX + b) = aE(X) + b,但 D(aX + b) = a²D(X),注意 b 不影响方差
  • ⚠️ 方差的简便公式D(X) = E(X²) - [E(X)]²,比定义式计算更方便
  • ⚠️ 正态分布的参数N(μ, σ²) 中第二个参数是 σ²(方差),不是 σ(标准差)
  • ⚠️ 3σ 原则:是近似值,68.27%、95.45%、99.73% 是理论精确值

方法技巧

1. 求分布列的步骤

  1. 确定随机变量 X 的所有可能取值
  2. 求出每个取值对应的概率
  3. 列出分布列
  4. 验证概率之和是否为 1

2. 二项分布的识别

判断一个随机变量是否服从二项分布,需确认: - 是否为 n 次独立重复试验 - 每次试验是否只有两个结果 - 每次试验成功的概率是否相同

3. 正态分布的概率计算

利用 3σ 原则和标准化变换: - 将 X ~ N(μ, σ²) 转化为 Z = (X - μ)/σ ~ N(0, 1) - 利用 3σ 原则估计概率 - 对称性:P(X ≤ μ) = P(X ≥ μ) = 0.5

4. 期望与方差的计算策略

  • 优先使用性质:E(aX + b) = aE(X) + bD(aX + b) = a²D(X)
  • 方差用简便公式:D(X) = E(X²) - [E(X)]²
  • 熟记常见分布的期望和方差

本章知识框架

选择性必修三·第七章 随机变量及其分布
├── 离散型随机变量及其分布列
│   ├── 随机变量的概念
│   ├── 分布列(非负性、归一性)
│   └── 两点分布
├── 二项分布
│   ├── n 次独立重复试验
│   ├── 二项分布 B(n, p)
│   └── 均值 E(X) = np, 方差 D(X) = np(1-p)
├── 超几何分布
│   ├── 不放回抽样
│   └── 均值 E(X) = nM/N
├── 离散型随机变量的均值与方差
│   ├── 均值 E(X) = Σ xᵢpᵢ
│   ├── 方差 D(X) = Σ [xᵢ - E(X)]²pᵢ
│   ├── 性质
│   │   ├── E(aX+b) = aE(X)+b
│   │   ├── D(aX+b) = a²D(X)
│   │   └── D(X) = E(X²) - [E(X)]²
│   └── 常见分布的均值与方差
└── 正态分布
    ├── N(μ, σ²) 的定义
    ├── 正态曲线的性质
    ├── 标准正态分布 N(0, 1)
    ├── 标准化变换 Z = (X-μ)/σ
    └── 3σ 原则

课后练习

1. 袋中有 3 个红球和 2 个白球,从中任取 2 个,设取到红球的个数为 X,求 X 的分布列。

2. 某人投篮命中率为 0.6,独立投篮 4 次,求至少命中 2 次的概率。

3. 已知随机变量 X 的分布列为:

X -1 0 2
P 0.3 0.5 0.2

E(X)D(X)

4. 已知 X ~ B(10, 0.3),求 E(2X + 1)D(2X + 1)

5. 已知 X ~ N(2, 4),求 P(0 < X < 4) 的近似值。

6. 一批产品共 50 件,其中 5 件不合格。从中不放回抽取 10 件,求抽到不合格品件数 X 的期望。


参考答案

1. X 可取 0, 1, 2。P(X=0) = C(2,2)/C(5,2) = 1/10P(X=1) = C(3,1)C(2,1)/C(5,2) = 6/10P(X=2) = C(3,2)/C(5,2) = 3/10

2. X ~ B(4, 0.6)P(X≥2) = 1 - P(X=0) - P(X=1) = 1 - 0.4⁴ - C(4,1)×0.6×0.4³ = 1 - 0.0256 - 0.1536 = 0.8208

3. E(X) = -1×0.3 + 0×0.5 + 2×0.2 = 0.1E(X²) = 1×0.3 + 0×0.5 + 4×0.2 = 1.1D(X) = E(X²) - [E(X)]² = 1.1 - 0.01 = 1.09

4. E(X) = 10×0.3 = 3, D(X) = 10×0.3×0.7 = 2.1E(2X+1) = 2×3 + 1 = 7, D(2X+1) = 4×2.1 = 8.4

5. μ = 2, σ = 2。0 < X < 4 即 μ - σ < X < μ + σ,概率约为 68.27%。

6. 超几何分布,E(X) = n × M/N = 10 × 5/50 = 1


📌 笔记区


本文档由 AI 辅助生成,仅供参考学习使用

自选笔记

已选 0 节 · 0

评论