目录

漫话机器学习系列132.概率质量函数Probability-Mass-Function,-PMF

【漫话机器学习系列】132.概率质量函数(Probability Mass Function, PMF)

https://i-blog.csdnimg.cn/direct/95d8b1e21db84dd6bc640a9902461c79.png

概率质量函数(Probability Mass Function, PMF)详解

1. 概述

概率质量函数(PMF, Probability Mass Function)用于描述 离散随机变量 的概率分布。简单来说,它给出了随机变量取某个具体值的概率。PMF 适用于那些 只能取有限个或可数无穷多个离散值 的变量,例如抛硬币的结果(正面或反面)、掷骰子的点数(1-6)等。

2. 概率质量函数的数学定义

设 XXX 是一个离散随机变量,取值范围为 https://latex.csdn.net/eq?x_1%2C%20x_2%2C%20%5Cdots%2C%20x_n ,则概率质量函数定义如下:

https://latex.csdn.net/eq?P%28X%20%3D%20x%29%20%3D%20f%28x%29

其中:

  • P(X = x) 表示随机变量 X 取值为 x 的概率。
  • f(x) 代表该值的概率质量函数。

PMF 必须满足以下两个条件:

  1. 非负性 :对于所有可能的 x, https://latex.csdn.net/eq?P%28X%20%3D%20x%29%20%5Cgeq%200

  2. 归一化性质 (所有概率之和为 1):

    https://latex.csdn.net/eq?%5Csum_%7Bx%20%5Cin%20S%7D%20P%28X%20%3D%20x%29%20%3D%201

    其中 S 是随机变量 X 的所有可能取值集合。

3. 概率质量函数的直观解释

概率质量函数可以用 柱状图条形图 来表示。例如,在图片中,我们看到一个离散随机变量的概率分布,横轴是 可能取值 ,纵轴是 概率 ,用不同高度的柱子来表示每个取值的概率大小。

4. 例子
(1) 掷骰子的 PMF

假设掷一个公正的 6 面骰子,随机变量 X 表示掷出的点数。由于骰子是公正的,每个点数的概率相等,PMF 如下:

https://i-blog.csdnimg.cn/direct/5f4171bb29d84e0fbcc2bf64a85af92f.png

如果用柱状图表示,每个点数x(1 到 6)都会对应一个相等高度的柱子。

(2) 抛硬币的 PMF

设 X 为一次抛硬币时出现正面的次数,则:

https://i-blog.csdnimg.cn/direct/8dbc7dabbd3d43efb4859ef6267c3cce.png

这也是一个典型的离散概率分布。

5. PMF 与其他概率分布的关系
  • 概率密度函数(PDF, Probability Density Function) :PMF 适用于 离散随机变量 ,而 PDF 适用于 连续随机变量 。对于连续变量,例如人的身高或温度,我们不能用 PMF,而需要用概率密度函数。

  • 累积分布函数(CDF, Cumulative Distribution Function) :PMF 只给出某个具体取值的概率,而 CDF 是 从小到大累积概率 ,定义为:

    https://latex.csdn.net/eq?F%28x%29%20%3D%20P%28X%20%5Cleq%20x%29%20%3D%20%5Csum_%7Bt%20%5Cleq%20x%7D%20P%28X%20%3D%20t%29

    CDF 适用于 PMF 和 PDF,但 PMF 直接给出每个取值的独立概率,而 CDF 累加这些概率。

6. PMF 的实际应用

概率质量函数在很多现实场景中都有重要作用:

  1. 机器学习和数据科学 :离散数据建模,如分类问题、朴素贝叶斯分类器等。
  2. 金融建模 :股票价格涨跌的离散状态概率。
  3. 质量控制 :工厂产品的合格与不合格概率建模。
  4. 自然语言处理(NLP) :分析单词在文本中的出现概率。
7. 结论

概率质量函数是描述 离散随机变量 概率分布的重要工具,广泛应用于统计学、数据科学、金融等领域。理解 PMF 有助于更深入地研究概率论,并在实际问题中构建有效的概率模型。


图示解析 在图片中:

  • 标题用中文和英文分别写出了“概率质量函数”(Probability Mass Function)。
  • 文字说明指出 PMF 是用于描述 离散随机变量 的概率分布。
  • 右侧的柱状图表示了某个离散随机变量的概率分布,其中每个可能取值对应一个概率高度。
  • 画面风格手绘,增强了可读性和直观理解。

希望这篇文章能帮助你全面理解 概率质量函数(PMF)