高中数学(版聊式)/第1节 概率与随机性:修订间差异

来自testwiki
跳转到导航 跳转到搜索
imported>Tyj518
以“==随机性、频率与概率== 在日常生活中,我们会经常遇到一些无法准确预测的事件。最典型的例子就是抛硬币,一般情况下,...”为内容创建页面
 
(没有差异)

2013年6月13日 (四) 16:19的最新版本

随机性、频率与概率

在日常生活中,我们会经常遇到一些无法准确预测的事件。最典型的例子就是抛硬币,一般情况下,我们并没有办法准确预测抛出的硬币掉落以后是正面朝上还是反面朝上;掷色子也是一个类似的例子,一般而言我们无法预测掷色子的结果。此外,在物理学的实验当中会经常遇到这样的情形:在对某个物理量进行测量时,由于各种不确定因素的影响,得到的测量值并非就是准确的真值,而测量值相对于真值的偏离显然也是无法准确预测的;更重要的是,绝大多数情形下我们是没有办法完全排除各种不确定因素对测量的影响的,例如物理学理论证明,当环境温度大于绝对零度时,即使采用完全理想的电压表测量某个电阻上的电压,其测量值也会围绕着真值上下波动。以上这些例子都说明,我们应当建立一套数学理论,这个理论能够对这些不确定的事件进行定量描述,从而发现其中的内在规律。

需要注意的是,以上给出的各种不确定事件,并非完全没有规律可循。例如,虽然我们无法准确预测某一次抛硬币的结果,但我们知道,随着抛硬币次数的增大,出现正面朝上的次数与总的抛掷次数的比值将越来越接近0.5。又如,对于掷色子的情形,若色子是均匀对称的,则当投掷次数非常大时,每种可能结果出现的次数均约占总次数的1/6。而对于物理量测量的情形,我们知道可以通过多次重复实验后取平均来使得测量值尽量接近真值,一般来说实验次数越多,则测量平均值越接近真值。以上的例子说明,这些不确定事件具有某种规律,这种规律在试验的重复次数非常大时能够得以体现,我们称这种规律为统计规律。而概率论就是可以用来研究具有统计规律的随机事件的一种数学理论。

概率论的核心概念之一就是“概率”。粗略地说,概率反映了某个随机事件发生的可能性的大小,但更进一步的精确的定义则比较困难。直观上,由于我们研究的是具有统计规律的事件,因此似乎可以用多次重复试验当中某个特定事件发生的频率来衡量这个事件发生的可能性大小;换句话说,对于某个事件A,我们重复进行N次试验,统计其中事件A出现的次数NA,则当N足够大时,频率

f(A)=NAN

应当可以用来作为事件A的可能性的定量描述。但这样做有一个明显的问题:对于任意有限的N,频率f(A)一般而言都不会是一个确定的量,而尽管N越来越大时f(A)会变得越来越平稳,但目前而言我们没有办法保证N趋向无穷大时f(A)存在一个确定的极限。这说明,概率虽然与频率有着很紧密的关系,但将概率完全作为频率的衍生概念是会产生困难的。

为了克服这个困难,我们不妨换一种思路:我们先不赋予概率以“频率的极限”的解释,而是先把它作为一个抽象的概念进行处理。同时,我们让概率具有频率的某些性质,以使得概率这个抽象概念具有一定的直观性。在此基础上我们建立概率的理论,而后反过来将它应用到具有统计规律的随机事件的研究上。这样做的好处有二,一是可以避免“频率的极限”所产生的困难,二是由此得到的概率理论作为一个抽象的理论,不仅可以用来研究具有统计规律的随机事件,还有可能用在其它不确定事件的研究上 [1]

样本空间与事件

从本节开始,我们对高中阶段所涉及的概率论进行较为详细的介绍。

上一节提到过,概率论是用来研究随机事件的理论。具体而言,假设我们进行一次随机试验 [2] ,这个试验的结果我们没有办法进行准确预测,但我们知道该试验所有的可能结果。例如,对于抛硬币,若不考虑极端的硬币立在桌子上的情况,则一次抛硬币试验的可能结果总共有两种:正面朝上、反面朝上。我们将该随机试验的所有可能结果组成一个集合,称之为“样本空间”,一般用Ω表示,而样本空间当中的点被称为“样本点”,一般用ω表示。

  • :对于单次抛硬币试验,用字母H表示正面朝上,用字母T表示反面朝上,则样本空间为Ω={H,T}
  • :考虑一只用打字机打字的猴子,打字机上只有26个大写字母,则它打出的第一个字母总共有26种可能,相应的样本空间为Ω={A,B,,Z}
  • :某个固定的转盘上有一个可以任意转动的指针,并刻有一条半径。转动指针,则经过一段时间后指针将停在转盘上某处。用指针与刻下的半径之间的转角(逆时针为正)来表征各种可能结果,则样本空间为Ω=[0,2π)
  • :一个浮在无限大液面上的花粉做无规则运动。假设我们在液面上建立二维直角坐标系,而花粉初始时(即t=0时)位于坐标系的原点。考虑t=T时花粉的位置,若用花粉的坐标来表征t=T时花粉的位置,则样本空间为Ω={(x,y)|x,y}

除了单次的随机试验,我们还可以将多个(相同或不同的)随机试验组合起来看成一次大的随机试验,而将各个小随机试验的可能结果排成有序列,作为大随机试验的可能结果,由此则可以得到大随机试验的样本空间Ω。

  • :考虑抛两次硬币这个试验,同样用字母H表示正面朝上,用字母T表示反面朝上,则该试验的样本空间可以写成Ω={(H,H),(H,T),(T,H),(T,T)},其中Ω的各个元素具有如下含义:
ω 含义
(H,H) 第一次抛出正面,第二次也抛出正面
(H,T) 第一次抛出正面,第二次抛出反面
(T,H) 第一次抛出反面,第二次抛出正面
(T,T) 第一次抛出反面,第二次也抛出反面
  • :考虑这样一个试验:首先抛出一枚硬币,若正面朝上则再掷一次色子,若反面朝上则再接连掷两次色子。则该试验的样本空间可以写成

Ω={(H,1),,(H,6),(T,1,1),(T,1,2),,(T,6,6)}


在有了样本空间的概念以后,我们即可定义“事件”这一概念。概率论当中的“事件”,实际上就是指样本空间Ω的一个子集。若某次随机试验获得的结果ω属于Ω的某个子集A,我们就说在这次随机试验中发生了事件A[3]

  • :显然,样本空间Ω本身就是一个事件,无论随机试验的结果如何,事件Ω总是发生的。我们称Ω为“必然事件”。
  • :另一方面,空集∅也是一个事件,只不过无论随机试验的结果如何,事件∅总是不会发生的。我们称∅为“不可能事件”。

以上两个例子虽然很平凡,却是后面对概率的性质进行分析的基础。下面再给出两个例子。

  • :考虑抛两次硬币这一试验,则集合A={(H,H),(H,T),(T,H)}表示“两枚硬币中至少有一枚正面朝上”这一事件。
  • :我们从区间[0,1]上随机取出一个数,则样本空间即为Ω=[0,1],而集合A=[0,1/3]则表示“取出的数小于等于1/3”这一事件。


由于事件本身是集合,因此可以将集合论当中的一些概念与运算移植到事件上。例如

  • 若对于事件A与事件B,有A⊆B,则由集合包含关系的意义可知,当事件A发生时事件B必定发生。
  • 若已知事件A与事件B,定义事件C=A∪B,则由集合并运算的意义可知,事件C发生当且仅当事件A发生或事件B发生(此处的“或”包含二者都发生的情形)。
  • 若已知事件A与事件B,定义事件C=A∩B,则由集合交运算的意义可知,事件C发生当且仅当事件A与事件B同时发生。若A∩B=∅(即不可能事件),我们称A与B为互斥事件,此时A与B不可能同时发生。
  • 若已知事件A,定义事件B为A相对于Ω的补集,即B={ωΩ|ωA},则由补集的意义可知,对于任意一次随机试验,必定有事件A或事件B其中之一发生,且事件A与事件B不可能同时发生。我们称事件A与事件B为对立事件,此时A∪B=Ω为必然事件,而A∩B=∅为不可能事件。

概率的意义与概率模型

概率论的基本问题之一,便是研究随机事件发生的可能性,而概率便是用来定量描述事件可能性的数学概念。显然,对于每一个事件,都应当有一个概率值与之对应,因此,概率实际上可以看成一个映射,它将任意一个事件映射为某一实数,我们用符号P来代表这个映射,则P(A)即代表事件A发生的概率。

但并非任意一个将事件映为实数的映射都可以作为概率。前面提到过,虽然概率本质上是一个抽象的概念,但我们希望它能具有频率的某些性质,从而能够与现实世界中的随机现象建立某种直观上的联系。根据频率的意义,不难证明它具有如下性质:

  1. 对任意事件A,其发生的频率必定大于等于0。这是因为频数NA总是非负的。
  2. 必然事件发生的频率等于1。这是因为必然事件的频数就等于总的试验次数。
  3. 若事件A与事件B不可能同时发生,则事件A与事件B至少有一个发生的频率,等于事件A发生的频率加上事件B发生的频率。

我们希望概率也能够满足与上述三条相类似的性质。将以上论述进行总结,可得:

  • 概率P是将任一事件映为某一实数的一个映射,且具有如下性质:
    1. 对任意事件A,有P(A)0
    2. P(Ω)=1
    3. 对任意两个互斥事件A与B,有P(AB)=P(A)+P(B)

下面我们通过抛硬币的例子来进一步理解概率的意义。

  • :考虑抛硬币这一随机试验。我们按如下方式给定概率P:
事件A P(A)
0
{H} 1/2
{T} 1/2
{H,T}=Ω 1

不难验证,按以上方式给定的概率P满足前面所说的三条性质。显然,以上概率对应于抛掷一均匀硬币这一随机事件。

  • :还是考虑抛硬币这一随机试验,只不过这次我们按如下方式给定概率P:
事件A P(A)
0
{H} p
{T} 1p
{H,T}=Ω 1

其中p(0,1)p1/2。可以看出,它同样满足概率的三条性质,但显然它并不能用来分析抛掷均匀硬币这一随机试验。实际上,它可以用来分析抛掷某种非均匀硬币。由此也可看出,在给定概率空间Ω以后,相应的概率P并不是唯一的。

概率的其它性质

脚注

Template:Reflist

  1. 除了将概率论用于具有统计规律的事件的研究以外,人们往往还将其用于其它不确定事件的研究。例如,天气预报当中经常会出现 “降水概率70%”的说法。由于某一天的天气情况是不可重复的,因此并不具有文中所描述的狭义上的统计规律。这里的70%实际上反映的是 人们对不确定事件的可信度的衡量,因此,若降水概率为90%,则说明我们认为“发生降水”具有很高的可信度,而若降水概率为10%,则说明“发生降水”的可信度不高。 对于概率论为何能处理以及如何处理这类不确定事件,E. T. Jaynes的《概率论沉思录》当中有很好的阐述,但这部分知识明显超出了高中生的接受能力,这里只做一个简短的引介。
  2. 这里提到的“随机试验”的概念非常广泛,各种结果无法准确预测的过程都可看做是一次随机试验。
  3. 对于样本空间元素个数有限的情形,Ω的任意一个子集均可以作为事件。但对于更复杂的Ω为无限集的情形,只有某些Ω的子集能作为事件进行概率上的分析。详细的讨论已超出高中知识范围,这里为严格起见而对此进行说明。