查看“︁高中数学/概率与统计/连续型随机变量与正态分布简介”︁的源代码
←
高中数学/概率与统计/连续型随机变量与正态分布简介
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 阅读指南 == [[File:Crystal Clear app gnome.png | Crystal Clear app gnome | 50px]] === 预备知识 === 阅读本节内容,需要先掌握[[高中数学/概率与统计/离散型随机变量的分布列及其数字特征|离散型随机变量]]、[[高中数学/概率与统计/抽样方法与对总体的估计|抽样方法与对总体的估计]]和[[高中数学/高等数学初步/导数及其应用|导数及其应用]]这3个章节的知识。部分需要借助[[高中数学/高等数学初步/定积分|定积分符号]]阐述的内容,我们将其单独放在本节的“正态分布性质的积分形式表达”子章节以及部分习题中。 === 考试要求 === === 后续课程联系 === == 基础知识 == === 知识引入 === [[File:Francis_Galton_1850s.jpg |thumb |150px | 法蘭西斯·高爾頓(Francis Galton,1822年-1911年)是活跃于19世纪中后期的英国博学家。他发明的高尔顿钉板实验形象地说明了[[w:中心极限定理|中心极限定理]]的预言结果,而中心极限定理正与本节讨论的正态曲线密切相关。他的博士生[[w:卡尔·皮尔逊|卡尔·皮尔逊]](Karl Pearson,1857年-1936年)也是数理统计学大家,以[[高中数学/概率与统计/抽样方法与对总体的估计|矩估计法]]和[[高中数学/概率与统计/列联表与两套分类标准的独立性检验简介|卡方檢定]]的提出闻名。]] 正态分布的由来与[[w:法蘭西斯·高爾頓|法蘭西斯·高爾頓]]提出的钉板实验关系密切。 [[File:Quincunx (Galton Box) - Galton 1889 diagram.png |thumb |left | 图为[[w:高尔顿板|高尔顿钉板]](Galton board)或称豆子机(bean machine)。]] 由于在高尔顿板的实验过程中,每个小球在每一层都做了完全随机选择的左右选择,这就导致它可以类比为一个[[高中数学/概率与统计/互斥事件与独立事件|重复独立的伯努利试验]],于是其分布结果可以用[[高中数学/概率与统计/二项式定理|帕斯卡三角形]]第n层的那一排数描述。如果继续增加钉板的层数、最下方小孔数量和实验次数,可以发现各个孔中小球的高度连起来可以近似地构成一条平滑的曲线。这是一种不同于离散型概率分布的连续取值的概率分布。 {{-}} === 连续型变量的概率分布 === 只采用离散型随机变量并不能描述所有我们可能感兴趣的随机事件的结果变化。例如很多事件的观测结果可以在一个连续的数值区间内分布,此时谈论事件结果在某一个精确数值上的取值往往也变得意义不大。此外,由于测量误差([[w:随机误差|随机误差]]或[[w:系统误差|系统误差]])的存在,我们更有理由关心结果落在一个范围内而不是一个单点上的概率。 <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> 试验结果可以取连续实数值的随机变量叫做'''连续型'''('''continuous random variable''')随机变量。设X是一个可以在指定区间上连续取值的变量,则下面的函数F(t)叫做连续型随机变量X的'''(概率)分布函数'''<ref name="李贤平_2010_概率分布及其性质" />或'''累积分布函数'''('''cumulative distribution function'''): :<math>F(t) := P(X < t)</math> 此外,由于随机变量X的数值范围发生微小变动时,其概率值应该也不会有明显波动,所以我们假定F(t)是连续函数。 </font> </blockquote> 由定义易知<ref name="李贤平_2010_概率分布及其性质">{{cite book |title=概率论基础 |author=李贤平 |editor1=李蕊 (策划编辑) |editor2=杨帆 (责任编辑) |others=王超 (责任校对) |series=普通高等教育“十一五”国家级规划教材 |publisher=高等教育出版社 |location=中国北京市崇西城区德外大街4号 |edition=3 |isbn=978-7-04-028890-2 |section=第3章“随机变量与分布函数”第3.1节“随机变量及其分布”中“二、分布函数的性质”部分和“三、离散型随机变量”部分 |pages=116-122 |language=zh-cn |year=2010}}</ref>: * 概率分布函数F(t)是单调递增的。 * <math>P(a \le X < b) = P(X < a) - P(X < b) = F(b) - F(a)</math> * <math>\lim_{x \to - \infty} F(x) = 0</math> * <math>\lim_{x \to + \infty} F(x) = 1</math> * <math>P(- \infty < X < + \infty) = 1</math> [[File:Crystal Clear action info.png | Crystal Clear action info | 50px]] 提示:离散型的随机变量也可以画出概率分布的散点图,此时的分布函数也有专门的名字,叫做'''[[w:概率质量函数|概率质量函数]]'''('''probability mass function''')。 <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> 假定某随机变量X的累积分布函数F(t)是其定义域内的可导函数,则我们将其[[高中数学/高等数学初步/导数及其应用|导函数]]F'(t)为X的'''概率密度函数'''('''probability density function''')。 </font> </blockquote> === 正态分布简介 === <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> 我们直接定义下列函数的图象称为'''正态(分布)密度曲线'''('''normal (distribution) density curve'''),简称为'''正态曲线'''或'''钟形曲线'''('''bell curve'''或'''bell-shaped curve''')<ref name="人教社课标版数学_2006_正态分布">{{cite book |title=高中数学 (A版) 选修2-3 |author=李勇 (本册主编); 章建跃(作者+责任编辑); 白涛; 张淑梅 |editor1=刘绍学 (主编) |editor2=钱珮玲 (副主编) |editor3=张唯一 (责任编辑) |publisher=人民教育出版社 |location=中国北京市海淀区中关村南大街17号院1号楼 |edition=2 |isbn=978-7-107-20171-4 |section=第2章“随机变量及其分布”第2.4节“正态分布” |pages=70-74 |language=zh-cn |year=2006}}</ref>: :<math>\phi_{\mu, \sigma} (x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}} \quad (x \in \mathbb{R})</math> 以此函数为导函数的概率分布也叫做'''正态分布'''('''normal distribution''')或译为'''常态分布'''。 当<math>\mu = 0, \sigma = 1</math>时的正态分布是'''标准正态分布'''('''standard normal distribution''')或'''拉普拉斯-高斯分布'''('''Laplace–Gauss distribution'''),此时其密度函数也叫做'''(高斯)函数'''('''Gauss function''')。 </font> </blockquote> [[File:Crystal Clear action info.png | Crystal Clear action info | 50px]] 提示:英语[[w:合成词|复合词]](English compound)的构造方法有时候不太统一,例如高斯误差函数的英文可以写成“Gauss function”或“Gaussian function”。 <blockquote style="padding: 1em; border: 2px dotted;"> [[File:Crystal Project Warehause.png | Crystal Project Warehause | 50px]] 可以证明它具有下列性质<ref name="人教社课标版数学_2006_正态分布" />: * 它的两端无限接近x轴,但是始终在x轴上方。 * 曲线是单峰的,它关于直线<math>x = \mu</math>对称; * 曲线在<math>x = \mu</math>处达到峰值<math>\frac{1}{\sigma \sqrt{2 \pi}}</math> * 它与x轴围成的区域的面积值是有限的,而且恰好为1。 </blockquote> 如果去掉高尔顿板试验中最下边的球槽,并沿着其底部在合适的高度建立一个水平坐标轴,其刻度单位为球槽的宽度。设X表示落下的小球第一次与高尔顿板底部坐标轴接触时的坐标,那么X是一个随机变量,且X分布在区间(a, b]内的概率<math>P(a < X \le b)</math>为正态曲线与x轴、直线x = a、直线x = b共同围成的封闭图形的面积。 <blockquote style="padding: 1em; border: 2px dotted;"> [[File:Crystal Project Warehause.png | Crystal Project Warehause | 50px]] 关于正态曲线,有以下经验结论<ref name="人教社课标版数学_2006_正态分布" />: * 当<math>\sigma</math>一定时,曲线随着<math>\mu</math>的变化而沿x轴平移。 * 当<math>\mu</math>一定时,曲线的性质由<math>\sigma</math>确定。<math>\sigma</math>越小,曲线越“瘦高”,表示总体的分布越集中;<math>\sigma</math>越大,曲线越“矮胖”,表示总体的分布越分散。 </blockquote> <!-- 本小节例题1 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题1: 标准正态分布的均值和标准差分别是( )。 :A.0与1;B.1与1;C.0与0;D.1与1 <!-- 本小节例题2 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题2: 标准正态分布的概率密度函数是否有最大值和最小值? 正态分布的问题涉及其取值的两侧对称性,这可以借助其图象特点帮助理解。对于标准正态分布等具有两侧对称性的连续型概率分布,当x > 0时,F(x)的近似值可以在标准正态分布表中查到(如果是习题,一般都会给出所需的必要数据);而当x < 0时,F(x)的近似值可以利用图象关于y轴的对称性F(x) = 1 - F(-x)来求解。 <!-- 本小节例题3 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题3: 已知正态分布曲线关于y轴对称,求其均值的大小。 <!-- 本小节例题4 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题4: 设随机变量X服从标准正态分布,P(X > 1) = p。 :(1) 求P(-1 < X < 0)的值。 :(2) 求P(-1 < X < 1)的值。 <!-- 本小节例题5 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题5: 设随机变量X服从正态分布N(0, 1), a > 0,则下列结论中正确的有( ): :A.P(|X| < a) = P(|X| < a) + P(|X| = a) :B.P(|X| < a) = 2 P(X < a) - 1 :C.P(|X| < a) = 1 - 2 P(X < a) :D.P(|X| < a) = 1 - P(|X| > a) <!-- 本小节例题6 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题6: 设随机变量X服从标准正态分布N(0, 1)。已知F(-1.96) = 0.025,则P(|X| < 1.96) = ( )。<br /> (出自2007年中国大陆课标版高考湖南卷第5题。) :A.0.025;B.0.050;C.0.950;D.0.975 <!-- 本小节例题7 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题7: 已知某服从正态分布N(0, 1)的随机变量在区间(-2, -1)和(1, 2)内的取值概率分别为<math>p_1, p_2</math>,试确定<math>p_1, p_2</math>的大小关系。 对于一般化的正态分布(不一定是标准正态分布),需要将其理解为标准正态分布经过变量代换或其图象经过平移、变形得到的结果。遇到有关正态分布的考题时,需要分辩其中的参数,并熟记均值和方差(或标准差)对图象产生的影响。 <!-- 本小节例题8 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题8: 如果正态总体落在区间<math>(0.2, + \infty)</math>内的概率是0.5,那么相应的正态曲线在x为何值处达到最高点。 <!-- 本小节例题9 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题9: 设随机变量X服从正态分布<math>N(3, a^2)</math>,求P(X < 3)的值。 <!-- 本小节例题10 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题10: 设随机变量<math>X \sim N(2, 3^2), P(X \le c) = P(X > c)</math>,求c的值。 <!-- 本小节例题11 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题11: 设随机变量X服从正态分布<math>N(2, 9), P(X > c+1) = P(X < c-1)</math>,求c的值。 <!-- 本小节例题12 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题12: 已知某正态分布的累积分布函数F(X)满足F(3) = 0.9987,求其正态分布总体在区间(-3, 3)内取值的概率。 <!-- 本小节例题13 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题13: 设正态总体<math>N(a, b^2)</math>,如果取a = 0, b = -1,则其其概率密度函数f(x)是( )。 :A.奇函数;B.偶函数;C.非奇非偶函数;D.即是奇函数也是偶函数 <!-- 本小节例题14 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题14: 已知随机变量X服从正态分布<math>N(0, \sigma^2), P(X > 2) = 0.023</math>,求<math>P(-2 \le X \le 2)</math>的值。 <!-- 本小节例题15 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题15: 在某次数学测试中,学生成绩X近似服从正态分布<math>N(100, \sigma^2) \quad (\sigma > 0)</math>,若X在(80, 120)内的概率为0.8,则X在(0, 80)内的概率为( )。 :A.0.05;B.0.1;C.0.15;D.0.2 <!-- 本小节例题16 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题16: 在某项测量中,测量结果X服从正态分布<math>N(1, \sigma^2) \quad (\sigma > 0)</math>,若X在区间(0, 1)内取值的概率为0.4,求X在(0, 2)内取值的概率。<br /> (出自2007年中国大陆大纲版高考全国卷Ⅱ第14题。) <!-- 本小节例题17 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题17: 某班有60名学生,一次考试后数学成绩<math>X \sim N(110, 10^2), P(100 \le X < 110) = 0.35</math>,则估计该班学生数学成绩在120分以上的人数为( )。 :A.10;B.9;C.8;D.7 <!-- 本小节例题18 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题18: 设随机变量<math>X \sim N(4, \sigma^2), P(4 < X < 8) = 0.3</math>,求P(X < 0)的值。 <!-- 本小节例题19 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题19: 设随机变量<math>X \sim N(0, \sigma^2), P(-2 \le X \le 0) = 0.4</math>,求P(X > 2)的值。 <!-- 本小节例题20 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题20: 设随机变量<math>X \sim N(\mu, \sigma^2), EX = 3, DX = 1</math>,则P(-1 < X < 1)的值是( )。 :A.2 F(1) - 1;B.F(4) - F(2);C.F(2) - F(4);D.2 F(2) - 1 <!-- 本小节例题21 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题21: 已知随机变量X服从正态分布<math>N(2, \sigma^2), P(X \le 4) = 0.84</math>,则<math>P(X \le 0)</math> = ( )。<br /> (出自2007年中国大陆课标版高考浙江卷第5题。) :A.0.16;B.0.32;C.0.68;D.0.975 <!-- 本小节例题22 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题22: 根据以往的经验,某工程施工期间的降水量X(单位:mm)对工期的影响如下表:<br /> {| class="wikitable" |- | 降水量X || <math>X < 300</math> || <math>300 \le X < 700</math> || <math>700 \le X < 900</math> || <math>X \ge 900</math> |- | 工期延误天数 || 0 || 2 || 6 || 10 |} 此外,历年气象资料表明,该工程施工期间降水量X小于300、700、900的概率分别为0.3、0.7、0.9。求: :(1)工期延误天数的均值与方差; :(2)在降水量X至少是300的条件下,工期延误不超过6天的概率。 === 正态数据的标准化与3-西格玛经验标准 === 之前我们提到过,标准得分(z分数)常用于确定正态分布数据中的百分位数取值,或者是确定某个具体取值高于正态类型总体中百分之多少的数据。换句话说,借助标准得分的转换,可以实现在正态分布或其它分布中从百分位数到原始值之间的相互换算。<ref name="Urdan_2013_"标准化与z分数">{{cite book |title=''Statistics in Plain English'' |trans_title=白话统计学 |author=蒂莫西·C·厄丹(Timothy C. Urdan) |editor= |others=彭志文 (汉译者) |series=管理者终身学习 |publisher=中国人民大学出版社 |location=中国北京中关村大街31号 |edition=3 |isbn=978-7-300-18573-6 |section=第3章“标准化与z分数”第1节“标准化与z分数详解” |pages=43-52 |language=zh-cn |year=2013}}</ref> 将百分位数转化为对应原始值的步骤<ref name="Urdan_2013_"标准化与z分数" />: # 利用传统统计学参考资料中提供的z分数表,查找百分位数对应的z分数。 # 将z-分数转化为原始值,也即转换为原始测量单位。 将原始值转化为对应百分位数的步骤<ref name="Urdan_2013_"标准化与z分数" />: # 将原始值进行归一化处理,从而得到z分数。 # 通过查表,找到指定分布(比如正态分布)中z分数低于指定值的百分比例。 此外,正态分布的2个原始值之间的包含比例也可以通过z分数的转换计算。 <math>3-\sigma</math>原则:服从于正态分布<math>N(\mu, \sigma^2)</math>的随机变量X绝大多数时候只会取到<math>(\mu - 3 \sigma, \mu + 3 \sigma)</math>之间的值。<ref name="人教社课标版数学_2006_正态分布" /> <blockquote style="padding: 1em; border: 2px dotted;"> [[File:Crystal Project Warehause.png | Crystal Project Warehause | 50px]] 有关正态分布的概率,有下列特殊的取值需要记忆<ref name="人教社课标版数学_2006_正态分布" />: * <math>P(\mu - \sigma < X \le \mu + \sigma) = 0.6826</math> * <math>P(\mu - 2 \sigma < X \le \mu + 2 \sigma) = 0.9544</math> * <math>P(\mu - 3 \sigma < X \le \mu + 3 \sigma) = 0.9974</math> </blockquote> <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> <math>3-\sigma</math>原则:服从于正态分布<math>N (\mu, \sigma^2)</math>的随机变量X绝大多数时候只会取到<math>(\mu - 3 \sigma, \mu + 3 \sigma)</math>之间的值。<ref name="人教社课标版数学_2006_正态分布" /> </font> </blockquote> <!-- 本小节例题1 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题1: 已知随机变量x服从正态分布<math>N(\mu, \sigma^2), P(\mu - 2 \sigma < x \le \mu + 2 \sigma) = 0.9544, P(\mu - \sigma < x \le \mu + \sigma) = 0.6826, \mu = 4, \sigma = 1</math>,求P(5 < x < 6)的值。 <!-- 本小节例题2 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题2: 某中学高考数学成绩近似地服从正态分布N(100, 100),则此校数学成绩在80~120分的考生占总人数的百分比为( )。 :A.31.74%;B.68.26%;C.95.44%;D.99.74% <!-- 本小节例题3 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题3: 已知服从正态分布<math>N(\mu, \sigma^2)</math>的随机变量在区间<math>(\mu - \sigma, \mu + \sigma), (\mu - 2 \sigma, \mu + 2 \sigma), (\mu - 3 \sigma, \mu + 3 \sigma)</math>内取值的概率分别为68.3%,95.4%和99.7%。某校高一年级1000名学生的某次考试成绩服从正态分布<math>N(90, 15^2)</math>,则此次成绩在(60, 120)范围内的学生大约有( )。 :A.997人;B.972人;C.954人;D.683人 <!-- 本小节例题4 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题4: 商场经营的某种袋装大米质量(单位:kg)服从正态分布<math>N(10, 0.1^2)</math>。试估算任取一袋大米,质量不足9.8kg的概率。 <!-- 本小节例题5 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题5: 已知某市某次英语考试的成绩可视为服从正态分布(100, 36),求考试成绩在区间(88, 112]内的概率。 === 中心极限定理的文字简述与正态分布的多种适用场合 === 我们提到过,通过分析多次重复的独立伯努利试验能够说明大数定理。大数定理有好几个强弱不同的版本,我们把其中的弱版本大数定理放在拓展性章节留给了感兴趣的读者。不过,我们还在此不加证明地继续介绍一个结论更强的定理,它预言伯努利试验在成功概率为0.5且实验次数无限增大时的概率分布就是正态分布: <blockquote style="padding: 1em; border: 2px dotted;"> [[File:Crystal Project Warehause.png | Crystal Project Warehause | 50px]] '''林德伯格-莱维[[w:中心极限定理|中心极限定理]]'''('''Lindeberg-Lévy central limit theorem''')指出:很多个独立同分布因素的叠加结果会接近正态分布。 作为支撑概率论的中心定理,它意味着: * 只要是数量足够多的同类型连续概率分布,它们的数值叠加结果都是正态分布。 * 大量统计独立的随机变量的平均值的分布趋近于正态分布。 </blockquote> 作为一个意义深远的定理,我们先在本小节关心它的统计学意义,稍后的其它小节中再借助微积分学的符号补充此定理的数学形式。 上述的中心极限定理表明,其它类型的概率分布很大程度上可以用正态分布作为近似。来自自然的观测结果都有很多随机误差,并且经常可以视为是彼此独立的,所以这些不同来源但彼此独立的误差大量叠加、抵消之后最终展现出来的结果就是正态分布。由于正态分布和随机误差的渊源,标准正态分布的概率密度函数(即高斯函数)也叫做'''(高斯)误差函数'''('''(Gauss) error function''')。 [[File:Crystal Clear app kdict.png | Crystal Clear app kdict | 50px]] 知识背景:在有关函数[[w:积分变换|积分变换]]的理论中,高斯误差函数是[[w:卷积|卷积]]运算下的一个[[w:不动点|不动点]]。由于求独立分布变量的和的分布就是对2种概率密度函数求卷积运算,于是这可以直接说明任意分布与另一独立正态分布的和仍然与原来的分布相似。 [[File:Paul Pierre Levy 1886-1971.jpg |thumb |150px | 保罗·P·莱维(Paul Pierre Lévy,1886年-1971年)是研究概率论(特别是[[w:随机过程|随机过程]])的专家,也是[[w:鞅 (概率论)|鞅理论]]的研究先驱。]] [[w:亞伯拉罕·棣莫弗|亞伯拉罕·棣莫弗]]是最早找到[[二项分布]]和高斯函数之间关系的人,[[w:皮埃尔-西蒙·拉普拉斯|皮埃尔-西蒙·拉普拉斯]]继续探索了这一结论,他们研究的版本后来就被叫做棣莫弗-拉普拉斯中心极限定理。卡尔·高斯也曾发现随机误差和钟形曲线之间的关联。后来,芬兰数学家雅尔·W·林德伯格(Jarl Waldemar Lindeberg,1876年–1932年)和法国数学家[[w:保罗·莱维|保罗·莱维]]在更普遍的情形下论证了中心极限定理的成立性,指出对于一切独立同分布(不限于是二项分布)的情况都有相同结果。计算机学家[[w:艾伦·图灵|艾伦·图灵]](Alan Mathison Turing,1912年-1954年)也曾独立证明过此定理。 [[File:Crystal Clear action info.png | Crystal Clear action info | 50px]] 提示:在[[w:实变函数论|实变函数论]]中有一个有关[[w:测度|测度]]单调性与[[高中数学/高等数学初步/极限|收敛性]]关系的重要定理叫做[[w:单调收敛定理|勒贝格-列维定理]](Lebesgue-Levi theorem),由[[w:昂利·勒贝格|昂利·勒贝格]](Henri Léon Lebesgue,1875年-1941年)和贝坡·列维(Beppo Levi,1875年—1961年)给出的。另外,在[[w:微分几何|微分几何学]]中还有一个研究[[w:联络 (数学)|几何联络]]的重要数学家叫[[w:图利奥·列维-齐维塔|图利奥·列维-齐维塔]](Tullio Levi-Civita,1873年-1941年)。请勿把保罗·莱维的姓氏“莱维”与这2个含有“列维”一词的意大利姓氏混淆。 === 积分形式下的正态分布性质与中心极限定理 === 借助[[高中数学/高等数学初步/定积分|定积分符号]],我们可以从另一个角度描述出概率分布函数和变量在指定区间内取值概率的关系: <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> 对于一个服从正态分布的随机变量X,它在区间[a, b)内取值的概率可以使用其概率密度函数<math>p(x) = \phi_{\mu, \sigma}</math>和积分符号记为<ref name="人教社课标版数学_2006_正态分布" />: :<math>P(a \le X < b) := \int_a^b \phi_{\mu, \sigma}(x) dx</math> 特别地,标准正态分布在整个实数轴上的积分为1,并且这一结论可以记为(我们总假定下列各式中的极限存在): :<math> \int_{- \infty}^{+ \infty} p(x) := \lim_{\begin{array}{l} t_1 \to - \infty \\ t_2 \to + \infty \end{array}} \int_{t_1}^{t_2} p(x) = \lim_{\begin{array}{l} t_1 \to - \infty \\ t_2 \to + \infty \end{array}} \int_{t_1}^{t_2} \phi_{\mu, \sigma} = \lim_{\begin{array}{l} t_1 \to - \infty \\ t_2 \to + \infty \end{array}} \int_{t_1}^{t_2} \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}} = 1 = P(- \infty \le X < \infty) </math> </font> </blockquote> [[File:Crystal Clear action info.png | Crystal Clear action info | 50px]] 提示:按照我们采用的定义(把概率密度函数定义为累积分布函数的导函数)来看,上述概率分布函数和变量在指定区间内取值概率的关系是[[高中数学/高等数学初步/微积分基本定理简介|微积分基本定理]]的直接推论。不过如果只是学习和掌握本节的主要内容,可以不需要预先了解微积分基本定理。 [[File:Crystal Clear app kdict.png | Crystal Clear app kdict | 50px]] 知识背景:这种积分区间延伸至无限远的积分被归类为一种'''[[w:反常积分|反常积分]]'''('''infinite limits of integration''')。对高斯函数在整个实数轴上进行的无界积分也叫做'''[[w:高斯积分|高斯积分]]'''(Gaussian integral),它的积分值是使用专门的[[高中数学/其它独立内容/极坐标|极坐标变量代换]]技巧求出的。 <blockquote style="padding: 1em; border: 2px dotted;"> <font color="#008000"> 一般地地,我们补充规定下列的常见记号(假定下列各式中的极限存在): * 积分下限函数:<math>\int_{t_1}^{+ \infty} p(x) := \lim_{t_1 \to - \infty} \int_{t_1}^{t_2} p(x)</math> * 积分上限函数:<math>\int_{- \infty}^{t_2} p(x) := \lim_{t_2 \to + \infty} \int_{t_1}^{t_2} p(x)</math> * <math>\int_{- \infty}^{+ \infty} p(x) := \lim_{\begin{array}{l} t_1 \to - \infty \\ t_2 \to + \infty \end{array}} \int_{t_1}^{t_2} p(x)</math> </font> </blockquote> 最后,我们简要地给出'''林德伯格-莱维[[w:中心极限定理|中心极限定理]]'''的数学表述<ref name="李贤平_2010_林德伯格-莱维定理">{{cite book |title=概率论基础 |author=李贤平 |editor1=李蕊 (策划编辑) |editor2=杨帆 (责任编辑) |others=王超 (责任校对) |series=普通高等教育“十一五”国家级规划教材 |publisher=高等教育出版社 |location=中国北京市崇西城区德外大街4号 |edition=3 |isbn=978-7-04-028890-2 |section=第5章“极限定理”第5.3节“独立同分布场合的极限定理”中“三、中心极限定理”部分 |pages=324-329 |language=zh-cn |year=2010}}</ref>:<br /> 对于以0为均值、1为方差的一系列随机变量<math>X_n \quad (n \in \mathbb{N}^*)</math>,有<math>\lim_{n \to \infty} P(\frac{\sum\nolimits_{k=1}^n X_k}{\sqrt{n}} < t) = \frac{1}{\sqrt{2 \pi}} \int_{- \infty}^x e^{- \frac{t^2}{2}} dt</math> [[File:Crystal Clear action info.png | Crystal Clear action info | 50px]] 提示:高斯函数、正态分布和上述的中心极限定理都有推广到[[w:多元函数|多变量]]的版本。<ref name="李贤平_2010_林德伯格-莱维定理" /> == 常用结论与常见模型 == === 几点补充 === 有时候问题中所给的概率密度函数并非是最常见的正态概率密度函数形式,这时需要先尝试进行适当的代数变形将其转变成正态分布的形式。尤其是切勿将概率密度函数中的均值与标准差认错。 <!-- 本小节例题1 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题1: 下列函数是正态分布密度函数的是( ): :A.<math>f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{\frac{(x - \mu)^2}{2 \sigma}}</math>;B.<math>f(x) = \frac{\sqrt{2 \pi}}{2 \pi} e^{\frac{x^2}{2 \sigma}}</math>;C.<math>f(x) = \frac{1}{2 \sqrt{2 \pi} \sigma} e^{\frac{(x - 1)^2}{4}}</math>;D.<math>f(x) = \frac{1}{\sqrt{2 \pi}} e^{\frac{x^2}{2}}</math> 另有一些问题会同时涉及到期望或方差的运算性质。 <!-- 本小节例题2 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题2: 已知随机变量X的概率密度函数是<math>\phi_{\mu, \sigma} (x) = \frac{1}{2 \sqrt{2} \pi} e^{- \frac{(x+2)^2}{8}} \quad (x \in \mathbb{R})</math>,求E(2X - 1)的值。 还有一些题目要求读者涉及[[高中数学/函数与三角/函数的奇偶性|广义奇偶性]],应了解此类问题的特征。 <!-- 本小节例题3 --> [[File:Crystal Clear action edit.png | Crystal Clear action edit | 50px]] 相关例题3: 如果随机变量<math>X \sim N(2, 2^2), P(X < a) = 0.2</math>,求P(X < 4-a)的值。 === 随机变量的代换与概率归一化 === 在大学数学中,一个比较常见的操作是对随机变量X进行[[w:仿射变换|仿射变换]]<math>Y = aX + b</math>,或是将它的概率密度函数乘以某个同样包含X的指数函数。处理这类问题时,会涉及2个问题: * 对指数中的X的二次代数式进行配平方 * 对系数进行归一化 标准正态分布中的系数就来自于对积分变量的替换和对概率的归一化处理。我们知道全样本空间的概率必为1,但是可以证明高斯积分(即高斯误差函数在整实数轴上的反常积分)的结果是大于1的定值,所以需要将其除以合适的系数,使总概率维持为1。 我们先假定公式<math>\int_{- \infty}^{+ \infty} e^{-t^2} dt = \sqrt{\pi}</math>的正确性。<br /> 如果作换元<math>t = \frac{x - \mu}{\sqrt{2} \sigma}</math>,则t对x的导函数(视均值和标准差为常数)为<math>\frac{1}{\sqrt{2} \sigma}</math>。反过来也能求出x对t的导函数为<math>\sqrt{2} \sigma</math>。<br /> 进而由[[w:换元积分法|换元积分法]]可得:<br /> <math> \begin{array}{l} \int_{- \infty}^{+ \infty} e^{- \frac{(x - \mu)^2}{\sqrt{2} \sigma^2}} dx & = \int_{- \infty}^{+ \infty} e^{- (\frac{x - \mu}{\sqrt{2} \sigma})^2} dx \\ & = \int_{- \infty}^{+ \infty} e^{- t^2} \cdot \sqrt{2} \sigma dt \\ & = \sqrt{2} \sigma \int_{- \infty}^{+ \infty} e^{- t^2} dt \\ & = \sqrt{2} \sigma \cdot \sqrt{\pi} = \sqrt{2 \pi} \sigma \end{array} </math><br /> 此即<math> \begin{array}{l} \int_{- \infty}^{+ \infty} e^{- \frac{(x - \mu)^2}{\sqrt{2} \sigma^2}} dx = \sqrt{2 \pi} \sigma \quad \Leftrightarrow \quad \int_{- \infty}^{+ \infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{\sqrt{2} \sigma^2}} dx = 1 \end{array} </math>。 [[File:Crystal Clear app kdict.png | Crystal Clear app kdict | 50px]] 知识背景:(1)对概率“归一化”的说法是借鉴自[[w:泛函分析|线性泛函分析]],在该课程中我们会将函数类比为向量进行研究。(2)由于[[w:量子力学|量子力学]]很大程度上就是用复变量函数对微观世界中的概率问题进行建模,所以对函数的系数进行归一化也是量子力学中的常见做法。 == 计算机技术辅助 == === Mathematica === === Matlab/Octave === === R === === Python === == 补充习题 == [[File:Crystal Clear app ksirtet.png | Crystal Clear app ksirtet | 50px]] [[File:Crystal Clear app laptop battery.png | Crystal Clear app laptop battery | 50px]] * 对于正态分布<math>N(\mu, \sigma^2)</math>的2个参数,当( )时,相应的正态曲线的形状越扁平。 :A.<math>\mu</math>越大;B.<math>\mu</math>越大;C.<math>\sigma</math>越大;D.<math>\sigma</math>越大 == 参见 == * [[高中数学/概率与统计/大数定律与蒙特卡罗方法|大数定律与蒙特卡罗方法]] * [[高中数学/概率与统计/一元连续性样本数据的差异显著性检验简介|一元连续性样本数据的差异显著性检验简介]] == 参考资料 == {{Reflist}} 补充来源: * {{cite web |url= https://k12.mayi173.com/exam/list/3-2-1589-1.html |title=高中数学 正态分布 试题解析 练习题答案分析 |publisher=蚂蚁学习网 |language=zh-cn |date= |access-date=2021年1月31日}} == 外部链接 == {{Wikipedia|高尔顿板}} {{Wikipedia|累积分布函数}} {{Wikipedia|概率密度函数}} {{Wikipedia|正态分布}} {{Wikipedia|中心极限定理}} {{Wikipedia|误差函数}} {{Wikipedia|68–95–99.7原則}} {{DEFAULTSORT: normal distribution}} [[category:概率论]] [[category:统计学]] [[category:高中数学]]
该页面使用的模板:
Template:-
(
查看源代码
)
Template:Cite book
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wikipedia
(
查看源代码
)
返回
高中数学/概率与统计/连续型随机变量与正态分布简介
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息