02 - 随机变量及其分布 - EDSIONC 知识库

知识点1 离散型随机变量及其分布列

1. 随机变量的概念

一般地，如果随机试验的结果可以用一个变量来表示，那么这样的变量叫做随机变量，常用大写字母 X, Y, ξ, η 等表示。

所有取值可以一一列出的随机变量称为离散型随机变量。

💡 说明：随机变量是这样一种变量——随着试验结果的变化而取不同的值，在试验之前只知道它可能取值的范围，而不能预知它取什么值。

2. 分布列

一般地，若离散型随机变量 X 可能取的不同值为 x₁, x₂, …, xₙ，且：

P(X = xᵢ) = pᵢ, i = 1, 2, …, n

用表格表示为：

X	x₁	x₂	…	xₙ
P	p₁	p₂	…	pₙ

这个表格称为离散型随机变量 X 的概率分布列，简称分布列。

3. 分布列的性质

（非负性）pᵢ ≥ 0, i = 1, 2, …, n
（归一性）p₁ + p₂ + … + pₙ = 1

知识点2 两点分布（伯努利分布）

1. 定义

如果随机变量 X 的分布列为：

X	0	1
P	1 - p	p

其中 0 < p < 1，则称 X 服从两点分布（或0-1分布、伯努利分布）。

💡 说明：两点分布是最简单、最基本的离散分布，它描述了只有两种可能结果的随机试验（如抛硬币、成功/失败等）。

例：抛一枚质地均匀的硬币一次，记正面朝上为1，反面朝上为0，则 X 服从参数 p = 0.5 的两点分布。

知识点3 二项分布

1. n 次独立重复试验

在相同条件下重复做的 n 次试验称为n 次独立重复试验。其特点是： - 每次试验只有两个可能的结果（"成功"或"失败"）； - 每次试验"成功"的概率相同，均为 p； - 各次试验的结果相互独立。

2. 二项分布的定义

在 n 次独立重复试验中，用 X 表示事件 A（"成功"）发生的次数，则：

P(X = k) = C(n, k) p^k (1 - p)^(n - k), k = 0, 1, 2, …, n

此时称随机变量 X 服从二项分布，记为：

X ~ B(n, p)

其中 n 为试验次数，p 为每次试验成功的概率。

💡 说明：二项分布的本质是 n 重伯努利试验中成功次数的分布。两点分布就是 n=1 时的二项分布 B(1, p)。

3. 二项分布的均值与方差

若 X ~ B(n, p)，则：

E(X) = np

D(X) = np(1 - p)

例：某射手每次射击命中目标的概率为 0.8，独立射击 5 次，求命中次数 X 的分布列、期望和方差。

解：X ~ B(5, 0.8)， P(X = k) = C(5, k) · 0.8ᵏ · 0.2^(5-k)， E(X) = 5 × 0.8 = 4， D(X) = 5 × 0.8 × 0.2 = 0.8。

知识点4 超几何分布

1. 定义

设有总数为 N 件的物品，其中 M 件为次品（或某种特定类型）。从中不放回地抽取 n 件，用 X 表示这 n 件中次品的件数，则 X 的分布列为：

P(X = k) = C(M, k) · C(N - M, n - k) / C(N, n), k = 0, 1, 2, …, min(M, n)

此时称随机变量 X 服从超几何分布。

2. 超几何分布的均值

E(X) = n · M / N

💡 说明：超几何分布与二项分布的主要区别在于：超几何分布是不放回抽样，各次抽取不独立；二项分布是有放回抽样（或总体很大时近似），各次抽取独立。当 N 很大而 n 相对较小时，超几何分布可近似为二项分布 B(n, M/N)。

例：一箱中有 10 件产品，其中 3 件不合格。从中不放回抽取 4 件，求抽到不合格品件数 X 的分布列中 X=2 的概率。

解：P(X = 2) = C(3,2) · C(7,2) / C(10,4) = 3 × 21 / 210 = 63/210 = 3/10 = 0.3。

知识点5 离散型随机变量的均值（期望）与方差

1. 均值（数学期望）

一般地，若离散型随机变量 X 的分布列为 P(X = xᵢ) = pᵢ，则：

E(X) = x₁p₁ + x₂p₂ + … + xₙpₙ = Σ xᵢpᵢ

称为随机变量 X 的均值或数学期望。它反映了离散型随机变量取值的平均水平。

2. 均值的性质

E(aX + b) = aE(X) + b
若 X 与 Y 独立，则 E(X + Y) = E(X) + E(Y)
若 X 与 Y 独立，则 E(XY) = E(X) · E(Y)

3. 方差

D(X) = Σ [xᵢ - E(X)]² pᵢ

称 D(X) 为随机变量 X 的方差，它刻画了随机变量取值偏离均值的平均程度。σ(X) = √D(X) 称为标准差。

💡 说明：方差越小，说明取值越集中在均值附近，越稳定；方差越大，说明取值越分散。

4. 方差的性质

D(aX + b) = a² D(X)
若 X 与 Y 独立，则 D(X + Y) = D(X) + D(Y)
计算方差的简便公式：D(X) = E(X²) - [E(X)]²

5. 常见分布的均值与方差总结

分布	均值 E(X)	方差 D(X)
两点分布（参数 p）	p	p(1-p)
二项分布 B(n, p)	np	np(1-p)
超几何分布	n·M/N	n·(M/N)·(1-M/N)·(N-n)/(N-1)

知识点6 正态分布

1. 定义

如果对于任何实数 a < b，随机变量 X 满足：

P(a < X ≤ b) = ∫ₐᵇ φ_{μ,σ}(x) dx

其中 φ_{μ,σ}(x) = 1/(√(2π)σ) · e^{-(x-μ)²/(2σ²)}，则称 X 服从参数为 μ, σ² 的正态分布，记为：

X ~ N(μ, σ²)

其密度曲线称为正态曲线。

💡 说明：μ 是均值，决定了曲线的中心位置；σ 是标准差，决定了曲线的"胖瘦"（分散程度）。σ 越大，曲线越矮胖；σ 越小，曲线越高瘦。

2. 正态曲线的性质

曲线关于直线 x = μ 对称；
在 x = μ 处达到最大值；
当 |x| → ∞ 时，曲线以 x 轴为渐近线；
曲线与 x 轴之间的面积为 1。

3. 标准正态分布

当 μ = 0, σ = 1 时的正态分布称为标准正态分布，记为 N(0, 1)。

任何一个正态分布都可以通过标准化变换转化为标准正态分布：

Z = (X - μ) / σ ~ N(0, 1)

4. 3σ 原则

对于正态分布 X ~ N(μ, σ²)：

区间	概率
(μ - σ, μ + σ)	约 68.27%
(μ - 2σ, μ + 2σ)	约 95.45%
(μ - 3σ, μ + 3σ)	约 99.73%

💡 说明：3σ 原则（三西格玛原则）表明，正态分布中取值几乎全部落在以均值为中心、3 倍标准差为半径的区间内，落在该区间外的概率不足 0.3%。这是质量控制等领域的重要依据。

5. 正态分布的应用

许多自然现象和社会现象都近似服从正态分布，如身高、体重、考试成绩、测量误差等。

例：已知某次考试数学成绩服从 N(70, 100)，求成绩在 60 到 80 分之间的概率比例。

解：μ = 70, σ = 10。60 到 80 即 μ ± σ，概率约为 68.27%。

易错点提醒

⚠️ 离散型与连续型随机变量：离散型取值可一一列举，连续型取值充满某个区间
⚠️ 分布列的归一性：p₁ + p₂ + … + pₙ = 1，可用此检验分布列是否正确
⚠️ 二项分布的条件：n 次独立重复试验，每次成功概率相同，各次试验相互独立
⚠️ 超几何分布 vs 二项分布：超几何分布是不放回抽样，二项分布是有放回抽样（或总体远大于样本量时近似）
⚠️ E(X) 与 D(X) 的性质：E(aX + b) = aE(X) + b，但 D(aX + b) = a²D(X)，注意 b 不影响方差
⚠️ 方差的简便公式：D(X) = E(X²) - [E(X)]²，比定义式计算更方便
⚠️ 正态分布的参数：N(μ, σ²) 中第二个参数是 σ²（方差），不是 σ（标准差）
⚠️ 3σ 原则：是近似值，68.27%、95.45%、99.73% 是理论精确值

方法技巧

1. 求分布列的步骤

确定随机变量 X 的所有可能取值
求出每个取值对应的概率
列出分布列
验证概率之和是否为 1

2. 二项分布的识别

判断一个随机变量是否服从二项分布，需确认： - 是否为 n 次独立重复试验 - 每次试验是否只有两个结果 - 每次试验成功的概率是否相同

3. 正态分布的概率计算

利用 3σ 原则和标准化变换： - 将 X ~ N(μ, σ²) 转化为 Z = (X - μ)/σ ~ N(0, 1) - 利用 3σ 原则估计概率 - 对称性：P(X ≤ μ) = P(X ≥ μ) = 0.5

4. 期望与方差的计算策略

优先使用性质：E(aX + b) = aE(X) + b，D(aX + b) = a²D(X)
方差用简便公式：D(X) = E(X²) - [E(X)]²
熟记常见分布的期望和方差

本章知识框架

选择性必修三·第七章 随机变量及其分布
├── 离散型随机变量及其分布列
│   ├── 随机变量的概念
│   ├── 分布列（非负性、归一性）
│   └── 两点分布
├── 二项分布
│   ├── n 次独立重复试验
│   ├── 二项分布 B(n, p)
│   └── 均值 E(X) = np, 方差 D(X) = np(1-p)
├── 超几何分布
│   ├── 不放回抽样
│   └── 均值 E(X) = nM/N
├── 离散型随机变量的均值与方差
│   ├── 均值 E(X) = Σ xᵢpᵢ
│   ├── 方差 D(X) = Σ [xᵢ - E(X)]²pᵢ
│   ├── 性质
│   │   ├── E(aX+b) = aE(X)+b
│   │   ├── D(aX+b) = a²D(X)
│   │   └── D(X) = E(X²) - [E(X)]²
│   └── 常见分布的均值与方差
└── 正态分布
    ├── N(μ, σ²) 的定义
    ├── 正态曲线的性质
    ├── 标准正态分布 N(0, 1)
    ├── 标准化变换 Z = (X-μ)/σ
    └── 3σ 原则

课后练习

1. 袋中有 3 个红球和 2 个白球，从中任取 2 个，设取到红球的个数为 X，求 X 的分布列。

2. 某人投篮命中率为 0.6，独立投篮 4 次，求至少命中 2 次的概率。

3. 已知随机变量 X 的分布列为：

X	-1	0	2
P	0.3	0.5	0.2

求 E(X) 和 D(X)。

4. 已知 X ~ B(10, 0.3)，求 E(2X + 1) 和 D(2X + 1)。

5. 已知 X ~ N(2, 4)，求 P(0 < X < 4) 的近似值。

6. 一批产品共 50 件，其中 5 件不合格。从中不放回抽取 10 件，求抽到不合格品件数 X 的期望。

参考答案

1. X 可取 0, 1, 2。P(X=0) = C(2,2)/C(5,2) = 1/10，P(X=1) = C(3,1)C(2,1)/C(5,2) = 6/10，P(X=2) = C(3,2)/C(5,2) = 3/10。

2. X ~ B(4, 0.6)，P(X≥2) = 1 - P(X=0) - P(X=1) = 1 - 0.4⁴ - C(4,1)×0.6×0.4³ = 1 - 0.0256 - 0.1536 = 0.8208。

3. E(X) = -1×0.3 + 0×0.5 + 2×0.2 = 0.1。E(X²) = 1×0.3 + 0×0.5 + 4×0.2 = 1.1，D(X) = E(X²) - [E(X)]² = 1.1 - 0.01 = 1.09。

4. E(X) = 10×0.3 = 3, D(X) = 10×0.3×0.7 = 2.1。E(2X+1) = 2×3 + 1 = 7, D(2X+1) = 4×2.1 = 8.4。

5. μ = 2, σ = 2。0 < X < 4 即 μ - σ < X < μ + σ，概率约为 68.27%。

6. 超几何分布，E(X) = n × M/N = 10 × 5/50 = 1。

📌 笔记区

本文档由 AI 辅助生成，仅供参考学习使用

菜单

分享

02 - 随机变量及其分布

知识点1 离散型随机变量及其分布列

1. 随机变量的概念

2. 分布列

3. 分布列的性质

知识点2 两点分布（伯努利分布）

1. 定义

知识点3 二项分布

1. n 次独立重复试验

2. 二项分布的定义

3. 二项分布的均值与方差

知识点4 超几何分布

1. 定义

2. 超几何分布的均值

知识点5 离散型随机变量的均值（期望）与方差

1. 均值（数学期望）

2. 均值的性质

3. 方差

4. 方差的性质

5. 常见分布的均值与方差总结

知识点6 正态分布

1. 定义

2. 正态曲线的性质

3. 标准正态分布

4. 3σ 原则

5. 正态分布的应用

易错点提醒

方法技巧

1. 求分布列的步骤

2. 二项分布的识别

3. 正态分布的概率计算

4. 期望与方差的计算策略

本章知识框架

课后练习

参考答案

评论

分享

02 - 随机变量及其分布

知识点1 离散型随机变量及其分布列

1. 随机变量的概念

2. 分布列

3. 分布列的性质

知识点2 两点分布（伯努利分布）

1. 定义

知识点3 二项分布

1. n 次独立重复试验

2. 二项分布的定义

3. 二项分布的均值与方差

知识点4 超几何分布

1. 定义

2. 超几何分布的均值

知识点5 离散型随机变量的均值（期望）与方差

1. 均值（数学期望）

2. 均值的性质

3. 方差

4. 方差的性质

5. 常见分布的均值与方差总结

知识点6 正态分布

1. 定义

2. 正态曲线的性质

3. 标准正态分布

4. 3σ 原则

5. 正态分布的应用

易错点提醒

方法技巧

1. 求分布列的步骤

2. 二项分布的识别

3. 正态分布的概率计算

4. 期望与方差的计算策略

本章知识框架

课后练习

参考答案

自选笔记

评论