概率论与数理统计有感(对概率论学习的一点感悟)
背景 某大二学生,寒假自学概率论,下面是笔者曾经踩过的坑和未解决的疑问,恳请大佬不吝解答,若文章有错误的地方还望指出
笔者认为概率论中有一个定义特别关键--概率空间的定义,其重要程度类似于高等数学中的极限定义(而就笔者粗浅了解到似乎理工类的概率论与数理统计书中并未提及概率空间的定义,实际上笔者自学时所用的资料也未提及,不知为何),笔者认为只有彻底掌握概率空间的定义,才能真正理解概率和随机变量到底是什么(也就是理解它们的定义),学习概率论时花了不少时间填这个坑
笔者知道概率空间属于测度论(实变函数论)的内容但笔者并无测度论基础,对概率空间中F的定义有3个疑问,均在文末
概率空间的定义(引自360百科)
第一项Ω是一个非空集合,有时称作"样本空间"。Ω 的集合元素称作"样本输出",可写作ω。
第二项F是样本空间Ω的幂集的一个非空子集。F的集合元素称为事件Σ。事件Σ是样本空间Ω的子集。集合F必须是一个σ-代数:
(Ω, F)合起来称为可测空间。事件就是样本输出的集合,在此集合上可定义其概率。
第三项P称为概率,或者概率测度。这是一个从集合F到实数域R的函数,P : F → R。每个事件都被此函数赋予一个0和1之间的概率值。P必须是一个测度,且P(Ω)=1。
笔者相信大部分看完概率空间这段定义后和我一样会有些茫然,虽然概率空间的定义同时给出了概率应该具有的基本性质,但并没有谈到如何计算概率,这就好像我们定义了整数,却没有给出四则运算,让人感觉无从下手
这个疑问笔者在这篇回复中得到答案,以下引用大佬原话
为了解决概率的古典定义所导致的种种问题,前苏联数学家Kolmogorov在1933年提出了概率论公理化结构。概率的公理化定义并不明确指出“概率是什么”(具体的概率定义留给不同的随机试验中具体指定),而只指明概率应该具有的基本性质。
简而言之,概率空间(Ω, F, P)Ω是全体样本点的集合,样本点是一个随机事件E可能的结果,F是 Ω的幂集的一个非空子集且是一个σ-代数,P是一个函数,定义域是F,值域是R(R是全体实数构成的集合)
σ-代数实际上是一个具有特定性质的集合,所以F其实是一个集合,这个集合同时具有 Ω的幂集的一个非空子集的性质与σ-代数所具有的性质,由于F是Ω的幂集的一个非空子集,所以该集合的元素仍然是一个集合(并且这个集合是Ω的一个非空子集,不妨假设为A),P(A)表示的就是这个集合A发生的概率,这个集合是F的一个元素同时也是Ω的一个非空子集。
到这里我们总结出概率其实是一个定义域为集合值域为实数的一个函数
随机变量是一种定义域为样本空间Ω值域为R的单值函数,随机变量一般用大写字母,而自变量用小写字母,区分好随机变量和自变量是不在分布函数中迷失的关键!
单值函数的定义为对定义域每一个自变量x,其对应的函数值f(x)是唯一的
之所以使随机变量这种函数只是为了将Ω中的元素(俗称事件)映射到坐标轴上便于分析和讨论
分布函数被定义为F(x)=P(X<x)
很多人会在这里感觉奇怪,明明说随机变量是一个函数为什么,这里写X<x,这不是不合逻辑吗,而且P(A)表示的是集合A发生的概率,可X<x分明不是集合
当初我也在这里懵逼了好久,看到知乎上一个大佬的回复才恍然大悟,原来P(X<x)是P({ω:X(ω)≤x})的一种简写,而{ω:X(ω)≤x}又是F中的一个元素(其中ω∈Ω),这下才把所有矛盾说通了
ps:因为这个简写害我查了三天的资料
学习概率论时一直有一个误区,笔者认为一件事情发生的概率可以用极限来描述的
也就是发生的概率为 lim_{n rightarrow +∞}{m/n} ,其中n为试验总次数,m为事件发生次数,既然有如此简洁的形式来定义概率,为何还需要那么复杂的公理化定义呢,以下是豆瓣大佬给出的答案
简单的说,是因为我们算一个函数f(x)在某点的极限的时候,其实是知道了函数的表达式,也就等于知道了对于每一个输入x得到的f(x)会是多少,所以才可以证明对于任意一个ε>0,存在一个正数δ,若|x-x0|<δ时,总有|f(x)-f(x0)|<ε恒成立,假设事件发生次数为m,同样是对于任意的ε>0,但对于一个随机事件却不见得我们选了一个正整数N,当实验次数n大于N时,却不一定有|m/n-A|<ε恒成立,因为我们无法计算出n>N后,m与n的关系。
笔者开头已经说过,并未完全理解概率空间中F的定义,主要体现在三点
1、
σ-代数的定义中若AN∈г(N=1,2,…)则∪AN∈г;
由于笔者并无测度论相关基础,用了许多时间并没有找到UAN的定义,它是指集合r中所有的元素(集合r的元素也是集合)的取并集的意思吗
2、满足是 Ω的幂集的一个非空子集且是一个σ-代数的集合是否存在不止一个的情况,如果存在应该如何选择F,为什么那样选择
3、为什么F要这样定义,有什么好处
这是三点笔者仍然对概率空间感到模糊的原因
希望看到这里的大佬能不吝解答
另外有错误的地方也希望有大佬指正
若大佬认同笔者的看法,请点个赞,因为我需要更多有关这篇文章的回馈来判断我对概率论的理解是否足够
ps :真的不是骗赞
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。