徐慧志的个人博客
2023年11月05日

2023-11-05 你只看见符合自己观念的事例,还是会根据事例更新自己的观念?

发布于 2023年11月05日  •  3 分钟  • 1401 字

随着年岁的增长,越来越发现世界上有两种人。一种人是这样的,他们对某种事情坚持一种观点,不管世事如何变迁,不管观点带有如何明显的偏激性,他只会选择性地看到支持这种观点的数据。如果他认定AI是不好的,他就只会看到AI对人类有害的例子。比方说AI造成种族歧视、造成生命威胁的时候,他就会跳出来,“你看,AI是多么可怕,我说了吧”。但是AI给人类提供方便的时候,促进生产效率的时候,他就沉默不言,仿佛没有这件事情发生。又比方说地域歧视,特别在上海,能感受到部分上海人对上海周边某个地方的人怀有敌意。如果这个地方的车牌在路上变道没有打转向灯,他们会说,“**人就是不行”。但是如果是别的地方的人没有遵守交通规则,他们就不会下这种判断。

而另一种人,他们会根据自己的经验或者经历来改变对某些事情的看法。假设我们问他们,世界上最好的城市是什么?随着自己的经验增多他们会有不同的答案。世界上最好的咖啡是什么?随着品尝到的咖啡增多,他们的结论有可能会变化。也有部分上海人他们虽然一开始对某地人有不好的看法,但是接触的人多了,他们发现不是这样。

这两种人的不同的地方在于,一种人会根据自己相信的观念去找符合这种观念的事例(我们称之为观测数据),另一种人会根据不同的事例更新自己的观念。

这就是贝叶斯定理的基本内容。贝叶斯定理是一种计算事件发生的概率的方法。它很很神奇,因为它阐释了我们看待事物的基本的原理。

贝叶斯定理有三要素:先验概率、似然和后验概率。

先验知识是指人们对待某件事情的历史经验,例如,假设过去20年里有15年高考的时候都下雨了,那么”高考会下雨“这个先验概率就是0.75。(一般来说都是经验,“估摸着”是多少,这里的0.75是用频率学派的计算方法算出来的。)

似然是指,在已经有”高考会下雨“的观念下,高考下雨这个事件发生的概率。

后验概率是指,在今年高考没有下雨的情况下,自己对”高考会下雨“这一信念的坚持程度。或者在今年高考下雨的情况下,自己对”高考会下雨“这一信念的坚持程度。

在上面的两种人的例子中,先验概率(prior )就是他们对一些事情最基本的观念。这种观念有可能是父母长辈传授给他们的,也有可能是基于自己的人生经历得到的。在公式中用$P(belief)$表示。

后验概率(posterior)是指,在观察到数据的情况下,自己对信念的坚持程度。在公式中用$P(belief|data)$表示。

似然(likelihood)是指,已经有了信念的情况下,支持这种信念的数据出现的可能性。在公式中用P(data|belief)表示。

$$ P(belief|data) = \frac{P(data|belief)P(belief)}{P(data)} $$

注意,并不是要批评先验知识。

因为先验知识也是基于历史数据得到的。为什么上一辈会有某种观念?因为在他们的人生经历中,某种事例就是发生得很多。为了避免风险,他们形成了某种观念。我在一本书上看到一个小标题“偏见就是力量”,深以为然,“偏见”是我们人类生存的宝贵经验。

这个定理同时也指出,随着更多数据被观测到,先验知识的作用会减小,信念可能会发生变化。当后验概率$P(belief|data)$很小的时候,说明这种信念不足以得到支持了。这时候要考虑另外一种可能性(我们称之为叫备择假设),我们通过计算发现,P(备择假设|data)这个概率很大,可能我们之后的先验知识就变成这个备择假设了。

贝叶斯定理表明,所有人的观念基本上都是一种偏见,都是先验知识。有趣的是人们会不会更改自己的观念。

Sein heißt werden, leben heißt lernen.

Der einfache Weg is immer verkehrt.