高中数学/概率与统计/连续型随机变量与正态分布简介

阅读指南

预备知识

阅读本节内容，需要先掌握离散型随机变量、抽样方法与对总体的估计和导数及其应用这3个章节的知识。部分需要借助定积分符号阐述的内容，我们将其单独放在本节的“正态分布性质的积分形式表达”子章节以及部分习题中。

考试要求

后续课程联系

基础知识

知识引入

正态分布的由来与法蘭西斯·高爾頓提出的钉板实验关系密切。

由于在高尔顿板的实验过程中，每个小球在每一层都做了完全随机选择的左右选择，这就导致它可以类比为一个重复独立的伯努利试验，于是其分布结果可以用帕斯卡三角形第n层的那一排数描述。如果继续增加钉板的层数、最下方小孔数量和实验次数，可以发现各个孔中小球的高度连起来可以近似地构成一条平滑的曲线。这是一种不同于离散型概率分布的连续取值的概率分布。

Template:-

连续型变量的概率分布

只采用离散型随机变量并不能描述所有我们可能感兴趣的随机事件的结果变化。例如很多事件的观测结果可以在一个连续的数值区间内分布，此时谈论事件结果在某一个精确数值上的取值往往也变得意义不大。此外，由于测量误差（随机误差或系统误差）的存在，我们更有理由关心结果落在一个范围内而不是一个单点上的概率。

试验结果可以取连续实数值的随机变量叫做连续型（continuous random variable）随机变量。设X是一个可以在指定区间上连续取值的变量，则下面的函数F(t)叫做连续型随机变量X的（概率）分布函数^[1]或累积分布函数（cumulative distribution function）：
$F (t) : = P (X < t)$
此外，由于随机变量X的数值范围发生微小变动时，其概率值应该也不会有明显波动，所以我们假定F(t)是连续函数。

由定义易知^[1]：

概率分布函数F(t)是单调递增的。
$P (a \leq X < b) = P (X < a) - P (X < b) = F (b) - F (a)$
$\lim_{x \to - \infty} F (x) = 0$
$\lim_{x \to + \infty} F (x) = 1$
$P (- \infty < X < + \infty) = 1$

提示：离散型的随机变量也可以画出概率分布的散点图，此时的分布函数也有专门的名字，叫做概率质量函数（probability mass function）。

假定某随机变量X的累积分布函数F(t)是其定义域内的可导函数，则我们将其导函数F'(t)为X的概率密度函数（probability density function）。

正态分布简介

我们直接定义下列函数的图象称为正态（分布）密度曲线（normal (distribution) density curve），简称为正态曲线或钟形曲线（bell curve或bell-shaped curve）^[2]：
$ϕ_{μ, σ} (x) = \frac{1}{\sqrt{2 π} σ} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}} (x \in ℝ)$
以此函数为导函数的概率分布也叫做正态分布（normal distribution）或译为常态分布。
当 $μ = 0, σ = 1$ 时的正态分布是标准正态分布（standard normal distribution）或拉普拉斯-高斯分布（Laplace–Gauss distribution），此时其密度函数也叫做（高斯）函数（Gauss function）。

提示：英语复合词（English compound）的构造方法有时候不太统一，例如高斯误差函数的英文可以写成“Gauss function”或“Gaussian function”。

可以证明它具有下列性质^[2]：

它的两端无限接近x轴，但是始终在x轴上方。

曲线是单峰的，它关于直线 $x = μ$ 对称；

曲线在 $x = μ$ 处达到峰值 $\frac{1}{σ \sqrt{2 π}}$

它与x轴围成的区域的面积值是有限的，而且恰好为1。

如果去掉高尔顿板试验中最下边的球槽，并沿着其底部在合适的高度建立一个水平坐标轴，其刻度单位为球槽的宽度。设X表示落下的小球第一次与高尔顿板底部坐标轴接触时的坐标，那么X是一个随机变量，且X分布在区间(a, b]内的概率 $P (a < X \leq b)$ 为正态曲线与x轴、直线x = a、直线x = b共同围成的封闭图形的面积。

关于正态曲线，有以下经验结论^[2]：

当 $σ$ 一定时，曲线随着 $μ$ 的变化而沿x轴平移。

当 $μ$ 一定时，曲线的性质由 $σ$ 确定。 $σ$ 越小，曲线越“瘦高”，表示总体的分布越集中； $σ$ 越大，曲线越“矮胖”，表示总体的分布越分散。

相关例题1：标准正态分布的均值和标准差分别是( )。

A.0与1；B.1与1；C.0与0；D.1与1

相关例题2：标准正态分布的概率密度函数是否有最大值和最小值？

正态分布的问题涉及其取值的两侧对称性，这可以借助其图象特点帮助理解。对于标准正态分布等具有两侧对称性的连续型概率分布，当x > 0时，F(x)的近似值可以在标准正态分布表中查到（如果是习题，一般都会给出所需的必要数据）；而当x < 0时，F(x)的近似值可以利用图象关于y轴的对称性F(x) = 1 - F(-x)来求解。

相关例题3：已知正态分布曲线关于y轴对称，求其均值的大小。

相关例题4：设随机变量X服从标准正态分布，P(X > 1) = p。

(1) 求P(-1 < X < 0)的值。

(2) 求P(-1 < X < 1)的值。

相关例题5：设随机变量X服从正态分布N(0, 1), a > 0，则下列结论中正确的有( )：

A.P(|X| < a) = P(|X| < a) + P(|X| = a)

B.P(|X| < a) = 2 P(X < a) - 1

C.P(|X| < a) = 1 - 2 P(X < a)

D.P(|X| < a) = 1 - P(|X| > a)

相关例题6：设随机变量X服从标准正态分布N(0, 1)。已知F(-1.96) = 0.025，则P(|X| < 1.96) = ( )。
（出自2007年中国大陆课标版高考湖南卷第5题。）

A.0.025；B.0.050；C.0.950；D.0.975

相关例题7：已知某服从正态分布N(0, 1)的随机变量在区间(-2, -1)和(1, 2)内的取值概率分别为 $p_{1}, p_{2}$ ，试确定 $p_{1}, p_{2}$ 的大小关系。

对于一般化的正态分布（不一定是标准正态分布），需要将其理解为标准正态分布经过变量代换或其图象经过平移、变形得到的结果。遇到有关正态分布的考题时，需要分辩其中的参数，并熟记均值和方差（或标准差）对图象产生的影响。

相关例题8：如果正态总体落在区间 $(0.2, + \infty)$ 内的概率是0.5，那么相应的正态曲线在x为何值处达到最高点。

相关例题9：设随机变量X服从正态分布 $N (3, a^{2})$ ，求P(X < 3)的值。

相关例题10：设随机变量 $X \sim N (2, 3^{2}), P (X \leq c) = P (X > c)$ ，求c的值。

相关例题11：设随机变量X服从正态分布 $N (2, 9), P (X > c + 1) = P (X < c - 1)$ ，求c的值。

相关例题12：已知某正态分布的累积分布函数F(X)满足F(3) = 0.9987，求其正态分布总体在区间(-3, 3)内取值的概率。

相关例题13：设正态总体 $N (a, b^{2})$ ，如果取a = 0, b = -1，则其其概率密度函数f(x)是( )。

A.奇函数；B.偶函数；C.非奇非偶函数；D.即是奇函数也是偶函数

相关例题14：已知随机变量X服从正态分布 $N (0, σ^{2}), P (X > 2) = 0.023$ ，求 $P (- 2 \leq X \leq 2)$ 的值。

相关例题15：在某次数学测试中，学生成绩X近似服从正态分布 $N (100, σ^{2}) (σ > 0)$ ，若X在(80, 120)内的概率为0.8，则X在(0, 80)内的概率为( )。

A.0.05；B.0.1；C.0.15；D.0.2

相关例题16：在某项测量中，测量结果X服从正态分布 $N (1, σ^{2}) (σ > 0)$ ，若X在区间(0, 1)内取值的概率为0.4，求X在(0, 2)内取值的概率。
（出自2007年中国大陆大纲版高考全国卷Ⅱ第14题。）

相关例题17：某班有60名学生，一次考试后数学成绩 $X \sim N (110, 1 0^{2}), P (100 \leq X < 110) = 0.35$ ，则估计该班学生数学成绩在120分以上的人数为( )。

A.10；B．9；C．8；D．7

相关例题18：设随机变量 $X \sim N (4, σ^{2}), P (4 < X < 8) = 0.3$ ，求P(X < 0)的值。

相关例题19：设随机变量 $X \sim N (0, σ^{2}), P (- 2 \leq X \leq 0) = 0.4$ ，求P(X > 2)的值。

相关例题20：设随机变量 $X \sim N (μ, σ^{2}), E X = 3, D X = 1$ ，则P(-1 < X < 1)的值是( )。

A.2 F(1) - 1；B.F(4) - F(2)；C.F(2) - F(4)；D.2 F(2) - 1

相关例题21：已知随机变量X服从正态分布 $N (2, σ^{2}), P (X \leq 4) = 0.84$ ，则 $P (X \leq 0)$ = ( )。
（出自2007年中国大陆课标版高考浙江卷第5题。）

A.0.16；B.0.32；C.0.68；D.0.975

相关例题22：根据以往的经验，某工程施工期间的降水量X（单位：mm）对工期的影响如下表：

降水量X	$X < 300$	$300 \leq X < 700$	$700 \leq X < 900$	$X \geq 900$
工期延误天数	0	2	6	10

此外，历年气象资料表明，该工程施工期间降水量X小于300、700、900的概率分别为0.3、0.7、0.9。求：

(1)工期延误天数的均值与方差；

(2)在降水量X至少是300的条件下，工期延误不超过6天的概率。

正态数据的标准化与3-西格玛经验标准

之前我们提到过，标准得分（z分数）常用于确定正态分布数据中的百分位数取值，或者是确定某个具体取值高于正态类型总体中百分之多少的数据。换句话说，借助标准得分的转换，可以实现在正态分布或其它分布中从百分位数到原始值之间的相互换算。^[3]

将百分位数转化为对应原始值的步骤^[3]：

利用传统统计学参考资料中提供的z分数表，查找百分位数对应的z分数。
将z-分数转化为原始值，也即转换为原始测量单位。

将原始值转化为对应百分位数的步骤^[3]：

将原始值进行归一化处理，从而得到z分数。
通过查表，找到指定分布（比如正态分布）中z分数低于指定值的百分比例。

此外，正态分布的2个原始值之间的包含比例也可以通过z分数的转换计算。

$3 - σ$ 原则：服从于正态分布 $N (μ, σ^{2})$ 的随机变量X绝大多数时候只会取到 $(μ - 3 σ, μ + 3 σ)$ 之间的值。^[2]

有关正态分布的概率，有下列特殊的取值需要记忆^[2]：

$P (μ - σ < X \leq μ + σ) = 0.6826$

$P (μ - 2 σ < X \leq μ + 2 σ) = 0.9544$

$P (μ - 3 σ < X \leq μ + 3 σ) = 0.9974$

$3 - σ$ 原则：服从于正态分布 $N (μ, σ^{2})$ 的随机变量X绝大多数时候只会取到 $(μ - 3 σ, μ + 3 σ)$ 之间的值。^[2]

相关例题1：已知随机变量x服从正态分布 $N (μ, σ^{2}), P (μ - 2 σ < x \leq μ + 2 σ) = 0.9544, P (μ - σ < x \leq μ + σ) = 0.6826, μ = 4, σ = 1$ ，求P(5 < x < 6)的值。

相关例题2：某中学高考数学成绩近似地服从正态分布N(100, 100)，则此校数学成绩在80～120分的考生占总人数的百分比为( )。

A.31.74%；B.68.26%；C.95.44%；D.99.74%

相关例题3：已知服从正态分布 $N (μ, σ^{2})$ 的随机变量在区间 $(μ - σ, μ + σ), (μ - 2 σ, μ + 2 σ), (μ - 3 σ, μ + 3 σ)$ 内取值的概率分别为68.3%，95.4%和99.7%。某校高一年级1000名学生的某次考试成绩服从正态分布 $N (90, 1 5^{2})$ ，则此次成绩在(60, 120)范围内的学生大约有( )。

A.997人；B.972人；C.954人；D.683人

相关例题4：商场经营的某种袋装大米质量（单位：kg）服从正态分布 $N (10, 0 . 1^{2})$ 。试估算任取一袋大米，质量不足9.8kg的概率。

相关例题5：已知某市某次英语考试的成绩可视为服从正态分布(100, 36)，求考试成绩在区间(88, 112]内的概率。

中心极限定理的文字简述与正态分布的多种适用场合

我们提到过，通过分析多次重复的独立伯努利试验能够说明大数定理。大数定理有好几个强弱不同的版本，我们把其中的弱版本大数定理放在拓展性章节留给了感兴趣的读者。不过，我们还在此不加证明地继续介绍一个结论更强的定理，它预言伯努利试验在成功概率为0.5且实验次数无限增大时的概率分布就是正态分布：

林德伯格-莱维中心极限定理（Lindeberg-Lévy central limit theorem）指出：很多个独立同分布因素的叠加结果会接近正态分布。
作为支撑概率论的中心定理，它意味着：

只要是数量足够多的同类型连续概率分布，它们的数值叠加结果都是正态分布。

大量统计独立的随机变量的平均值的分布趋近于正态分布。

作为一个意义深远的定理，我们先在本小节关心它的统计学意义，稍后的其它小节中再借助微积分学的符号补充此定理的数学形式。

上述的中心极限定理表明，其它类型的概率分布很大程度上可以用正态分布作为近似。来自自然的观测结果都有很多随机误差，并且经常可以视为是彼此独立的，所以这些不同来源但彼此独立的误差大量叠加、抵消之后最终展现出来的结果就是正态分布。由于正态分布和随机误差的渊源，标准正态分布的概率密度函数（即高斯函数）也叫做（高斯）误差函数（(Gauss) error function）。

知识背景：在有关函数积分变换的理论中，高斯误差函数是卷积运算下的一个不动点。由于求独立分布变量的和的分布就是对2种概率密度函数求卷积运算，于是这可以直接说明任意分布与另一独立正态分布的和仍然与原来的分布相似。

亞伯拉罕·棣莫弗是最早找到二项分布和高斯函数之间关系的人，皮埃尔-西蒙·拉普拉斯继续探索了这一结论，他们研究的版本后来就被叫做棣莫弗-拉普拉斯中心极限定理。卡尔·高斯也曾发现随机误差和钟形曲线之间的关联。后来，芬兰数学家雅尔·W·林德伯格（Jarl Waldemar Lindeberg，1876年–1932年）和法国数学家保罗·莱维在更普遍的情形下论证了中心极限定理的成立性，指出对于一切独立同分布（不限于是二项分布）的情况都有相同结果。计算机学家艾伦·图灵（Alan Mathison Turing，1912年－1954年）也曾独立证明过此定理。

提示：在实变函数论中有一个有关测度单调性与收敛性关系的重要定理叫做勒贝格-列维定理（Lebesgue-Levi theorem），由昂利·勒贝格（Henri Léon Lebesgue，1875年－1941年）和贝坡·列维（Beppo Levi，1875年—1961年）给出的。另外，在微分几何学中还有一个研究几何联络的重要数学家叫图利奥·列维-齐维塔（Tullio Levi-Civita，1873年－1941年）。请勿把保罗·莱维的姓氏“莱维”与这2个含有“列维”一词的意大利姓氏混淆。

积分形式下的正态分布性质与中心极限定理

借助定积分符号，我们可以从另一个角度描述出概率分布函数和变量在指定区间内取值概率的关系：

对于一个服从正态分布的随机变量X，它在区间[a, b)内取值的概率可以使用其概率密度函数 $p (x) = ϕ_{μ, σ}$ 和积分符号记为^[2]：
$P (a \leq X < b) : = \int_{a}^{b} ϕ_{μ, σ} (x) d x$
特别地，标准正态分布在整个实数轴上的积分为1，并且这一结论可以记为（我们总假定下列各式中的极限存在）：
$\int_{- \infty}^{+ \infty} p (x) : = \lim_{\begin{matrix} t_{1} \to - \infty \\ t_{2} \to + \infty \end{matrix}} \int_{t_{1}}^{t_{2}} p (x) = \lim_{\begin{matrix} t_{1} \to - \infty \\ t_{2} \to + \infty \end{matrix}} \int_{t_{1}}^{t_{2}} ϕ_{μ, σ} = \lim_{\begin{matrix} t_{1} \to - \infty \\ t_{2} \to + \infty \end{matrix}} \int_{t_{1}}^{t_{2}} \frac{1}{\sqrt{2 π} σ} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}} = 1 = P (- \infty \leq X < \infty)$

提示：按照我们采用的定义（把概率密度函数定义为累积分布函数的导函数）来看，上述概率分布函数和变量在指定区间内取值概率的关系是微积分基本定理的直接推论。不过如果只是学习和掌握本节的主要内容，可以不需要预先了解微积分基本定理。

知识背景：这种积分区间延伸至无限远的积分被归类为一种反常积分（infinite limits of integration）。对高斯函数在整个实数轴上进行的无界积分也叫做高斯积分（Gaussian integral），它的积分值是使用专门的极坐标变量代换技巧求出的。

一般地地，我们补充规定下列的常见记号（假定下列各式中的极限存在）：
积分下限函数： $\int_{t_{1}}^{+ \infty} p (x) : = \lim_{t_{1} \to - \infty} \int_{t_{1}}^{t_{2}} p (x)$

积分上限函数： $\int_{- \infty}^{t_{2}} p (x) : = \lim_{t_{2} \to + \infty} \int_{t_{1}}^{t_{2}} p (x)$

$\int_{- \infty}^{+ \infty} p (x) : = \lim_{\begin{matrix} t_{1} \to - \infty \\ t_{2} \to + \infty \end{matrix}} \int_{t_{1}}^{t_{2}} p (x)$

最后，我们简要地给出林德伯格-莱维中心极限定理的数学表述^[4]：
对于以0为均值、1为方差的一系列随机变量 $X_{n} (n \in ℕ^{*})$ ，有 $\lim_{n \to \infty} P (\frac{\sum_{k = 1}^{n} X_{k}}{\sqrt{n}} < t) = \frac{1}{\sqrt{2 π}} \int_{- \infty}^{x} e^{- \frac{t^{2}}{2}} d t$

提示：高斯函数、正态分布和上述的中心极限定理都有推广到多变量的版本。^[4]

常用结论与常见模型

几点补充

有时候问题中所给的概率密度函数并非是最常见的正态概率密度函数形式，这时需要先尝试进行适当的代数变形将其转变成正态分布的形式。尤其是切勿将概率密度函数中的均值与标准差认错。

相关例题1：下列函数是正态分布密度函数的是( )：

A.

f (x) = \frac{1}{\sqrt{2 π} σ} e^{\frac{(x - μ)^{2}}{2 σ}}

；B.

f (x) = \frac{\sqrt{2 π}}{2 π} e^{\frac{x^{2}}{2 σ}}

；C.

f (x) = \frac{1}{2 \sqrt{2 π} σ} e^{\frac{(x - 1)^{2}}{4}}

；D.

f (x) = \frac{1}{\sqrt{2 π}} e^{\frac{x^{2}}{2}}

另有一些问题会同时涉及到期望或方差的运算性质。

相关例题2：已知随机变量X的概率密度函数是 $ϕ_{μ, σ} (x) = \frac{1}{2 \sqrt{2} π} e^{- \frac{(x + 2)^{2}}{8}} (x \in ℝ)$ ，求E(2X - 1)的值。

还有一些题目要求读者涉及广义奇偶性，应了解此类问题的特征。

相关例题3：如果随机变量 $X \sim N (2, 2^{2}), P (X < a) = 0.2$ ，求P(X < 4-a)的值。

随机变量的代换与概率归一化

在大学数学中，一个比较常见的操作是对随机变量X进行仿射变换 $Y = a X + b$ ，或是将它的概率密度函数乘以某个同样包含X的指数函数。处理这类问题时，会涉及2个问题：

对指数中的X的二次代数式进行配平方
对系数进行归一化

标准正态分布中的系数就来自于对积分变量的替换和对概率的归一化处理。我们知道全样本空间的概率必为1，但是可以证明高斯积分（即高斯误差函数在整实数轴上的反常积分）的结果是大于1的定值，所以需要将其除以合适的系数，使总概率维持为1。

我们先假定公式 $\int_{- \infty}^{+ \infty} e^{- t^{2}} d t = \sqrt{π}$ 的正确性。
如果作换元 $t = \frac{x - μ}{\sqrt{2} σ}$ ，则t对x的导函数（视均值和标准差为常数）为 $\frac{1}{\sqrt{2} σ}$ 。反过来也能求出x对t的导函数为 $\sqrt{2} σ$ 。
进而由换元积分法可得：
$\begin{matrix} \int_{- \infty}^{+ \infty} e^{- \frac{(x - μ)^{2}}{\sqrt{2} σ^{2}}} d x & = \int_{- \infty}^{+ \infty} e^{- (\frac{x - μ}{\sqrt{2} σ})^{2}} d x \\ = \int_{- \infty}^{+ \infty} e^{- t^{2}} \cdot \sqrt{2} σ d t \\ = \sqrt{2} σ \int_{- \infty}^{+ \infty} e^{- t^{2}} d t \\ = \sqrt{2} σ \cdot \sqrt{π} = \sqrt{2 π} σ \end{matrix}$
此即 $\begin{matrix} \int_{- \infty}^{+ \infty} e^{- \frac{(x - μ)^{2}}{\sqrt{2} σ^{2}}} d x = \sqrt{2 π} σ \Leftrightarrow \int_{- \infty}^{+ \infty} \frac{1}{\sqrt{2 π} σ} e^{- \frac{(x - μ)^{2}}{\sqrt{2} σ^{2}}} d x = 1 \end{matrix}$ 。

知识背景：(1)对概率“归一化”的说法是借鉴自线性泛函分析，在该课程中我们会将函数类比为向量进行研究。(2)由于量子力学很大程度上就是用复变量函数对微观世界中的概率问题进行建模，所以对函数的系数进行归一化也是量子力学中的常见做法。

计算机技术辅助

Mathematica

Matlab/Octave

R

Python

补充习题

对于正态分布 $N (μ, σ^{2})$ 的2个参数，当( )时，相应的正态曲线的形状越扁平。

A.

μ

越大；B.

μ

越大；C.

σ

越大；D.

σ

越大

参见

参考资料

Template:Reflist

补充来源：

Template:Cite web

外部链接

Template:Wikipedia Template:Wikipedia Template:Wikipedia Template:Wikipedia Template:Wikipedia Template:Wikipedia Template:Wikipedia

↑ ^1.0 ^1.1 Template:Cite book
↑ ^2.0 ^2.1 ^2.2 ^2.3 ^2.4 ^2.5 ^2.6 Template:Cite book
↑ ^3.0 ^3.1 ^3.2 Template:Cite book
↑ ^4.0 ^4.1 Template:Cite book

[李贤平_2010_概率分布及其性质-1] 1.0 ^1.1 Template:Cite book

[人教社课标版数学_2006_正态分布-2] 2.0 ^2.1 ^2.2 ^2.3 ^2.4 ^2.5 ^2.6 Template:Cite book

[Urdan_2013_-3] 3.0 ^3.1 ^3.2 Template:Cite book

[李贤平_2010_林德伯格-莱维定理-4] 4.0 ^4.1 Template:Cite book

[1]

[2]

[3]

[4]

高中数学/概率与统计/连续型随机变量与正态分布简介

目录

阅读指南

预备知识

考试要求

后续课程联系

基础知识

知识引入

连续型变量的概率分布

正态分布简介

正态数据的标准化与3-西格玛经验标准

中心极限定理的文字简述与正态分布的多种适用场合

积分形式下的正态分布性质与中心极限定理

常用结论与常见模型

几点补充

随机变量的代换与概率归一化

计算机技术辅助

Mathematica

Matlab/Octave

R

Python

补充习题

参见

参考资料

外部链接

导航菜单

高中数学/概率与统计/连续型随机变量与正态分布简介

阅读指南

预备知识

考试要求

后续课程联系

基础知识

知识引入

连续型变量的概率分布

正态分布简介

正态数据的标准化与3-西格玛经验标准

中心极限定理的文字简述与正态分布的多种适用场合

积分形式下的正态分布性质与中心极限定理

常用结论与常见模型

几点补充

随机变量的代换与概率归一化

计算机技术辅助

Mathematica

Matlab/Octave

R

Python

补充习题

参见

参考资料

外部链接

导航菜单

搜索