Statistic
Beyes
\[P(H|D) = \frac{P(H) \cdot P(D|H)}{P(D)}\]
H: hyposis 假设事件,D: data 数据
- \(P(H|D)\) : 后验概率, the probability of observing event H given that D is true
- \(P(H)\) : 先验概率, the probability of observing event H
- \(P(D|H)\): 似然度
- \(P(D)\) : the probability of data D
例:在判断垃圾邮件的算法中: \(P(H)\) : 所有邮件中,垃圾邮件的概率。 \(P(D)\) : 出现某个单词的概率。 \(P(D|H)\) : 垃圾邮件中,出现某个单词的概率。 \(P(H|D)\) : 出现某个单词的邮件,是垃圾邮件的概率。
概率是已知模型和参数,推数据。统计是已知数据,推模型和参数。
\(P(x|\theta)\)
如果\(\theta\)是已知确定的,\(x\)是变量,这个函数叫做概率函数(probability function),它描述不同的样本点\(x\)出现概率是多少。
如果\(x\)是已知确定的,\(\theta\)是变量,这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数\(\theta\),出现\(x\)这个样本点的概率是多少
判别模型和生成模型
- 判别模型,判别y类型,学习条件分布\(P(y|x)\)
- 生成模型,生成y分布,学习联合分布\(P(x, y)\),使用贝叶斯定理得出结论\(P(y|x)\)
两个小朋友判断图片是的动物是狮子还是大象
- A小朋友画出两只动物,表示图片和狮子更像,生成模型
- B小朋友根据鼻子体型等特征,判断图片是狮子,判别模型
References:
- https://blog.csdn.net/u011508640/article/details/72815981