概率密度函数怎么求求概率密度的两种方法

破浪号 2024-08-12 23:34:32 12浏览

从随机实验到随机变量：用数字刻画不确定性

通信-随机过程系列第2篇

虽然随机实验的结果都有明确的含义，但直接使用这些结果进行数学分析往往很不方便。例如，抛硬币的结果是“正面”或“反面”，这对数学计算并不友好。

让我们先来看一个例子：假设一个喷泉每隔91分钟喷发一次，你随机抵达喷泉并停留20分钟，那么你能看到喷泉喷发的概率是多少呢？

为了更方便地分析这类问题，我们可以用数字或数值序列来表示随机实验的结果。例如，可以用数字“1”代表硬币的“正面”，用数字“0”代表硬币的“反面”。这种将随机实验结果与数字对应起来的过程，就称为用随机变量表达。

图1展示了抛硬币实验中，结果与随机变量之间的对应关系。

具体来说，假设一个随机试验的样本空间为S，随机实验的结果为s（s∈S）。我们可以定义一个函数X(s)，它的定义域为样本空间S，值域为实数的子集。这个函数X(s)就被称为随机变量。

图2更清晰地展示了随机变量的概念。通过引入随机变量，我们在概率和样本空间之间建立了联系，使得数学计算更加方便。

图2 随机变量的概念

使用随机变量的优势在于：无论随机实验本身的形式如何，我们都可以通过分析具体数值的概率来研究问题。随机变量可以是离散的，只能取有限个值，例如抛硬币实验中的随机变量；也可以是连续的，可以取某个区间内的任意实数，例如表示噪声电压幅值的随机变量。随机变量还可以是复数，但复随机变量通常被视为两个实随机变量组成的向量。

举例1：抛3枚硬币，出现几个正面？

在这个例子中，我们可以定义随机变量X为“正面出现的次数”。X可能的取值为0、1、2、3，分别对应所有硬币都是反面、出现1个正面、出现2个正面和出现3个正面。样本空间为{0, 1, 2, 3}。

需要注意的是，此时每种结果出现的概率不再相等。抛掷3枚硬币共有8种可能结果：

图3 抛掷3枚硬币的8种结果 (H代表正面，T代表反面)

从图3可以看出，只有1种结果包含3个正面，3种结果包含2个正面，3种结果包含1个正面，1种结果没有正面。因此：

P(X=3)=1/8
P(X=2)=3/8
P(X=1)=3/8
P(X=0)=1/8

举例2：同时抛掷2个骰子，点数之和是多少？

在这个例子中，我们可以定义随机变量X为“两个骰子点数之和”。

图4 抛掷2个骰子的36种结果

图4展示了抛掷2个骰子可能的36种结果。样本空间S为{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}。

我们可以统计每个点数和出现的次数，并计算其概率：

2只出现1次，所以P(X=2)=1/36；
3出现2次，所以P(X=3)=2/36=1/18；
4出现3次，所以P(X=4)=3/36=1/12；
5出现4次，所以P(X=5)=4/36=1/9；
6出现5次，所以P(X=6)=5/36；
7出现6次，所以P(X=7)=6/36=1/6；
8出现5次，所以P(X=8)=5/36；
9出现4次，所以P(X=9)=4/36=1/9；
10出现3次，所以P(X=10)=3/36=1/12；
11出现2次，所以P(X=11)=2/36=1/18；
12出现1次，所以P(X=12)=1/36；

问题：两个骰子点数之和为5、6、7或8的概率是多少？

换句话说，我们需要计算P(5≤X≤8) 的值。

由于随机变量X是离散的，所以P(5≤X≤8)=P(X=5)+P(X=6)+P(X=7)+P(X=8)=(4+5+6+5)/36=20/36=5/9

同样地，表示特定时刻噪声电压幅度的随机变量是连续的，因为它理论上可以取正负无穷之间的任意值。

以抛硬币实验为例，我们可以用下图来描述：

图5 硬币抛掷实验的随机变量

其中，x=0代表硬币反面朝上，x=1代表硬币正面朝上，P[X=x]表示结果为x的概率。图中的两个权重为1/2的delta函数分别代表抛硬币的两种可能结果。

总而言之，随机变量可以是离散的，也可以是连续的，它为我们分析和计算随机事件的概率提供了更便捷的工具。

从离散到连续：深入理解概率分布
我们先回顾一下两种不同类型的数据：

离散数据：只能取特定值，例如整数 1、2、3、4、5。
连续数据：可以在一个范围内取任意值，例如身高。

我们已经了解了离散随机变量的例子，现在我们将重点关注连续随机变量。
均匀分布 (矩形分布)
在均匀分布中，随机变量落在区间 [a, b] 内任何点的概率都是相等的。与离散随机变量不同，连续随机变量在区间内有无限多个可能取值。
为了保证所有可能结果的概率之和为1，均匀分布的概率密度函数呈现为一个矩形：

图1: 均匀分布

由于矩形面积代表总概率 1，我们可以推导出概率密度函数：
矩形面积 = 1 = p × (b - a)
p = 1 / (b - a)
用数学语言表达：
当 a ≤ x ≤ b 时，P(X = x) = 1 / (b - a)
其他情况下，P(X = x) = 0
喷泉问题：
假设一个喷泉每隔一段时间喷发一次，最长间隔为 91 分钟。你随机到达喷泉，等待时间不超过 20 分钟的概率是多少？
答案：
你等待时间不超过 20 分钟的概率，相当于随机变量（等待时间）落在 0 到 20 分钟这个区间内的概率。由于喷发时间服从均匀分布，概率密度为：
p = 1 / (91 - 0) = 1 / 91
等待时间不超过 20 分钟的概率为：
p 20 = (1 / 91) 20 ≈ 0.22
这意味着你有大约 22% 的概率在到达后 20 分钟内看到喷泉喷发。