“如果对90分的2004年份阿根廷碧安祺(ValentinBianchi)赤霞珠(CabernetSauvgnon),在一小时之后再重新给它打一次分,那新得分为89分的可能性是多少呢?”——这是列纳德-蒙洛迪诺在《醉汉的脚步:随机性如何主宰我
“如果对90分的2004年份阿根廷碧安祺(Valentin Bianchi)赤霞珠(Cabernet Sauvgnon),在一小时之后再重新给它打一次分,那新得分为89分的可能性是多少呢?”——这是列纳德-蒙洛迪诺在《醉汉的脚步:随机性如何主宰我们的生活》(郭斯羽译,湖南科学技术出版社2010年出版)一书中提出的一种假设。蒙洛迪诺是一位研究数学物理的物理学家,任教于加州理工学院,着有《费曼的彩虹:物理大师的24堂课》和《欧几里得之窗:从平行线到超空间的几何学故事》等科普着作,并与科学超人史蒂芬-霍金合着《时间简史-普及版》和《大设计》。霍金为《醉汉的脚步:随机性如何主宰我们的生活》题写的推荐语是:“一部关于随机性定律是如何影响我们生活的可读性很强的指南。”
酒评家们的分数是一种具有随机性和偶然性的随机变量。
酒评家们的分数是一种具有随机性和偶然性的随机变量。
“醉汉的脚步”(The Drunkards Walk)是用来解释随机性的一种数学统计模型,起源于英国数学家卡尔-皮尔逊的“随机游走”理论,比如液体的分子运动、股市的价格波动、动物的觅食路径、醉汉的脚步,都是以不规则的、不可预测的“随机游走”模式运动的。根据随机性定律,酒评家们的分数也是一种具有随机性和偶然性的随机变量。请同一位品尝者再过一小时重新品尝同一款酒,可能会给出不同的分数;请不同品尝者在同一时间或相近时间品尝同一款酒,大家给出的分数可能更是天壤之别。例如加州塔布拉斯-格里克酒庄(Tablas Creek Vineyard)的2002年份塔布拉斯干红(C?tes de Tablas),《Wine Advocate》杂志在2004年8月给予90分,《Wine Spectator》杂志在2005年1月只给予78分。在《Wine Spectator》评分体系,90分(90-95分范围)属于“具有特殊的复杂性和个性的出色的葡萄酒”;在《Wine Spectator》评分体系,78分(70- 79分范围)属于“尚可饮用但可能有轻微缺陷的平庸的葡萄酒”。那么,消费者究竟该如何判断这款葡萄酒?是不是可以把两家杂志给予的分数加起来去平均,也即“90+78”除以2,终得出84分的结论?
在书中,列纳德-蒙洛迪诺还提出一种假设:如果葡萄酒的得分是90分,品酒记录表为15份,一种可能是15份品酒记录表给予的分数都是90分,另一种可能是15份品酒记录表给予的分数分别为80、81、82、87、89、89、90、90、90、91、91、94、97、99、100分,这15个分数的均值同样是90分,那么这意味着什么呢?蒙洛迪诺分析指出:“所有酒评分数都是90分的数据,其样本标准差为0,这告诉我们,所有数据都与均值相同。但当样本标准差较大时,数据就没有簇集在均值附近。那个取值在80分到100分的葡萄酒分数集,其样本标准差为6分。根据一个经验规则可知,大多数评分与均值的差都落在6分之内。此时我们对这种酒所能真正给出的评价,是它的分数很可能落在84分到96分之间。”
我们在品酒会上给一款葡萄酒打分时,通常是以各位评委的分数之和除以评委人数,去取一个平均值。而根据随机性定律,均值并不能准确地反映一款葡萄酒的真实水平,甚至还会掩盖部分真相。除了均值,我们还应该考虑到反映数据离散程度的样本标准差,也即样本方差的算术平方根。如此说来,葡萄酒评比大赛不但需要邀请公证员监督公证,似乎还应该邀请一位研究概率与统计的数学家。