Fundamentals of Probability and Statistics I

一些关于概率和统计的基础知识。

Posted by Sunny on 2024-11-06
Words 1.1k and Reading Time 5 Minutes
Viewed Times

Fundamentals of Probability and Statistics I

本篇文章的目的是整理在HKU AI program里面ARIN7001课程的part IIARIN7101课程的基础知识以及对考研数学概率论部分基础知识的一些整理。由于HKU课程是全英文教学的,所以我的文章有关知识部分基本上是双语的。

概率和统计实际上是两个不同的概念。概率是预测未来事件发生的可能性;统计包含了对过去事件频率的分析,从数据出发,研究已发生事件的属性和规律。这就回答了我很早以前困惑的问题,考研的概率论更多的是频率预测概率的内容,statistics一上来就是贝叶斯。当然,概率和统计是有一部分相同的基础知识部分,每门课都讲了一遍。

Probability: predict the likelihood of the future events.
Statistics: analyze the frequency of past events.

Sets and Events

Sample Space: 样本空间,通常用$\Omega$表示。随机试验中的每一个可能的结果(强调原子性,即不可再分)称为样本点,记为$\omega$。样本点的全体组成的集合称为样本空间。$\Omega = { \omega }$。

Atomic Event: 由一个样本点构成的事件称为基本事件。

Event: 随机事件A是由若干个基本事件组成,A是$\Omega$的子集。

Union: 并集。

Intersection: 交集。

Disjoint(mutually exclusive): 中文翻译为不相交,互斥。即$E_i \cap E_j = \emptyset$

Partition: 完备事件组。有限个事件${E_1, E_2,…,E_n}$满足互斥和$E_1 \cup E_2 \cup … \cup E_n = \Omega$,则称构成一个完备事件组。

概率

概率是对随机事件A发生可能性大小的度量,记为$P(A)$。

  • 对于一个随机事件$A \subset \Omega$, $P(A) \in [0,1]$
  • $P(\emptyset) = 0$, $P(\Omega)=1$.
  • $P(A) + P(A^c) = 1$.
  • 对于互斥事件(mutually exclusive) $E1, E_2,…, E_n$,
    $P(U^n
    {i=1} Ei) = \sum^n{i=1} P(E_i)$.
  • 对于完备事件组(partition) $E1, E_2,…, E_n$,$P(\cup^n{i=1} E_i) = P(\Omega) = 1$.

常见概率公式

加法公式

对于两个任意事件$E_1$和$E_2$,有
$P(E_1\cup E_2) = P(E_1) + P(E_2) - P(E_1 \cap E_2)$.

对于三个任意事件$E_1$, $E_2$和$E_3$,有

$P(E_1\cup E_2\cup E_3) = P(E_1) + P(E_2) + P(E_3) - P(E_1 \cap E_2) - P(E_1 \cap E_3) - P(E_2 \cap E_3) + P(E_1\cap E_2 \cap E_3)$.

减法公式

$P(A-B) = P(A) - P(AB) = P(A\overline{B})$

条件(Conditional)概率公式

The conditional probability of event A given the occurance of event B (denoted by $P(A|B)$) is calculated as :

如何理解条件概率$P(·|A)$中的条件事件$A$?

只针对$·$做概率计算,每个概率都带着$|A$即可。

例如:$P(\overline{B}|A)=P(B \cup \overline{B}|A) - P(B|A)=1-P(B|A)$, $P[(B-C|A)]=P(B|A)-P(BC|A)$.

贝叶斯(Bayes)公式

For two events $A$ and $B$ in the sample space $\Omega$, the conditional probability of A given B is:

where $P(B) \neq 0$.

Moreover, if ${A_1, A_2,…, A_m}$ is a partition of $\Omega$, for each $i = 1,2,…,m$, we have:

贝叶斯公式的本质是条件概率,描述一件基于与之相关的先验(prior)知识条件的事件的概率。

全概率公式

if ${A_1, A_2,…, A_m}$ is a partition of $\Omega$, for any event B, we have:

乘法概率公式(Joint Probability)

For two events A and B ($P(A)>0$), we have $P(AB)=P(A)P(B|A)$.

For events $B_1,B_2,…,B_n$, we have:

独立事件

Two events A and B are independent (denoted by A $\perp$ B), if the occurance of B does not affect the probability of occurance of A, i.e., $P(A|B)=P(A)$.

Pairwise Independent(两两互斥): A finite set of events ${Ai}^n{i=1}$ is pairwise independent if and only if for any pairs $i \neq j$, $P(A_i \cap A_j)=P(A_i)P(A_j)$.

Mutually Independent(相互互斥): the collection of events is mutually independent if and only if for every combination of ${i_1,i_2,…,i_k} \subset {1,2,…,n}$, we have:

pairwise independent and mutually independent: mutually independent must be pairwise independent. The reverse is not true.