Shawn's blog Writing is thinking

为什么是“最大似然”而不是“最大概率”?

为什么是“最大似然”而不是“最大概率”

虽然两者经常被混用不加区别,“迂腐”的统计学家们仍然“固执”要将两者区分开来,其中缘由可从下面等式说起:

\[L(\mu, \sigma; data) = P(data;\mu, \sigma)\]

以正态分布 \(N(\mu, \sigma)\)和一组观测到的数据data为例。上面等式左边表示似然,右边表示概率密度,两者等值。但含义上右边讲的是“已知分布参数为 \(\mu\)和 \(\sigma\) 的情况下观察到data的概率是多少”,左边讲的是“观测到一组数据data,对应分布参数为\(\mu\)和 \(\sigma\) 的似然为多少”

综上,给定分布参数下观察到某数据的概率密度在数值上等于给定某数据下该参数为某值的似然。然而,尽管两者大小相等,侧重点却截然不同,前者侧重于数据而后者侧重于参数。这也是为什么我们称“最大似然”而不是“最大概率”的原因。