“概率”一词在我们的生活中随处可见，数学家买彩票中奖的几率高吗？

尽管“概率”的定义不晦涩难懂，仿佛人人都会用，但你可能不知道，概率计算的结论常常违反他们的判断力，概率论中有许多无法表述、说不清道不明的谬论。不能完全相信直觉！

我们的大脑也会产生错误观念和盲区，如同开车的驾驶人员视觉中有“盲区”，必须几次浴室镜子来摆脱一样，他们的思想过程中也有盲区，必须通过测算和思考来回应。概率论是一个经常会出现与判断力有悖的怪异结论的行业，连一位数学家都是稍不留神就会错得一塌糊涂。如今，我们就最先举例子传统概率中的一个谬论，称为“基本上比例谬误(baseratefallacy)”。

我们从一个生活中的例子逐渐

王宏去医院做检验，查验他得了某类病症的概率。其结果竟然为呈阳性，把她吓了一大跳，连忙在网络查询。网上的材料说，查验总是有偏差的，这类查验有“1%的假阳性率和1%的假阴性率”。这句话的意思就是说，在生病的人中做检查，有1%的人是假阴性，99％的人是真呈阳性。但在未生病的人中做检查，有1%的人是假阳，99％的人是真呈阴性。因此，王宏根据这类表述，可能他自己患上这个疾病的概率(即概率)为99%。

王宏想，即然仅有1%的假阳性率，99%全是真呈阳性，那么我人群中已被感染这种病的概率便该是99%。但是，大夫却对他说，她在一般在人群中被感染的概率仅有0.09(9%)上下。这是怎么回事呢？王宏的思路错误观念在哪儿？

彩色图库：pexls

医生说:“99%？哪有那么大一点的感柒概率啊。99％是测试的精确性，不是你生病的概率。你忘了一件事:被感染这个疾病正常的比例为不大的，1000本人中只有一个人生病。”原先这名医生在从医之外，也钟爱研究数学，常常将概率方式用以医学中。

他计算方法大部分是这样子的:由于测试的漏报率是1%，1000本人即将迎来10个被报为“假阳”，而根据这种病在人口中比例(1/1000=0.1%)，真呈阳性仅有1个，因此，大概11个检测为呈阳性的人中只有一个是真呈阳性(得病)的，因而，王宏被感染的概率约是1/11，即0.09(9%)。

王宏思来想要去仍觉得迷糊，但这件事情增强了王宏去追忆他以前学过的概率论。通过不断阅读文章，再思索揣摩医生的优化算法以后，他明白了自身犯那类称为“基本上比例谬误”的错误，即忘掉应用“这种病在人口中的最基本占比(1/1000)”这个事实。

提到基本上比例谬误，大家最好从概率论中着名的贝叶斯定理谈起

托马斯·贝叶斯(ThomasBayes，1701—1761)是英国统计学家，曾是个法师。贝叶斯定理是他对概率论和应用统计学做出的较大奉献，是当今人工智能技术中常用的机器学习算法的基础框架，它观念之深入远高于一般人所能认知能力，或许贝叶斯自身死前对于此事也认识不到位。由于这般关键的成果，他死前却并未发布，要在他死后1763年才由好朋友发表的。

粗略地说，贝叶斯定理涉及到2个随机变量A和B的互相影响，假如用一句话来概括，这些定律讲的是:运用B所带来的最新资讯，应如何修改B不会有时A的“先验概率”P(A)，从而获得B存有后的“标准概率”P(A|B)，或称后验概率，假如写出公式计算:

这儿先验、后验的定义是一种约定成俗，是相对的。例如也可以将A、B相反描述，即怎样从B的先验概率P(B)，获得B的“标准概率”P(B|A)，见图中斜线所说。

不要害怕公式计算，根据事例，我们就能渐渐地了解它

比如，对前边王宏看病的事例，随机变量A表明“王宏得某类病”；随机变量B表明“王宏的检验结果”。先验概率P(A)是指王宏在没有任何检验结果时得这种病的概率(即这种病在公众中的最基本概率0.1%)；而标准概率(或后验概率)P(A|B)是指王宏“检验结果为呈阳性”条件下得这种病的概率(9%)。怎样从基本上概率调整到后验概率的？大家等会儿再表述。

贝叶斯定理是18新世纪时代的产物，200明年用得好好的，却不想在20个世纪70时代碰见了考验，该考验来自于丹尼尔·卡尼曼(DanielKahneman)和特维尔斯基(Tversky)所提出的“基本上比例谬误”。前者是非洲裔美国心理学家，2002年诺贝尔经济学奖获得者。

基本上比例谬误并不是否认贝叶斯定理，反而是讨论一个让人困惑的难题:为何人的直觉常常与贝叶斯公式的数值相违背？好似刚刚的例子所显示，大家使用判断力的时候经常会忽视基本概率。卡尼曼等在他们的文章内容《思考，快与慢》革职了一个出租车的事例，来启示大家考虑这一危害大家“管理决策”的主要原因。大家不愿在这儿促膝长谈基本上比例谬误对“决策理论”的价值，仅仅使用此例来增强对贝叶斯公式的了解。

倘若某城市有两种颜色的的士:蓝色和绿色(市场占有比例为15∶85)。一辆的士晚间肇事后逃逸，但还好那时候有一位目击者，这名目击证人评定肇事者的的士是蓝色的。可是，他“亲眼目睹的真实度”怎么样呢？

公安机关在相同自然环境下对该目击证人开展“绿蓝”检测获得:80%的情形下鉴别恰当，20%的现象有误。也许有阅读者立刻就得出了结果:肇事车是蓝色的概率该是80%吧。假如你做此回应，就是犯与上边事例中王宏同样的错误，忽视了先验概率，不会考虑在这个城市中“绿蓝”车的最基本占比。