探索
EXPLOE
二战时期的统计学
发布时间:2024-12-13
打印
{{ isAudioPlay ? '暂停播放' : '播放声音' }}
放大 缩小

那是1943年,第二次世界大战正全面展开。

德国的闪电战在二战前期占了很多便宜,直到后来,苏联的坦克才能与其一较高下。作为德军的主要战斗力,坦克的相关数据是盟军非常希望获得的重要情报,如德国一个月究竟能生产多少辆坦克。获取这些信息有助于由英、美等57个国家所组成的盟军做出正确的战略部署。

通过暗中侦查和截获德军电报,盟军情报人员估计,德国人每个月生产的坦克数为1000~1400辆。然而,过了不久,盟军就发现这个估计数字相当不可靠,德国生产坦克的速度远远达不到这个数量。“有没有其他办法可以探寻这个隐秘的信息?”美国马里兰州巴尔的摩市摩根州立大学的数学系副教授乔纳森·法利(Jonathan Farley)博士问道,“我们怎样才能确定一个准确的数字呢?”

统计学的力量

从实际情况来看,德国设计的坦克几乎坚不可摧,盟军不可能俘获所有坦克。于是,盟军采用了一种数学方法来估计坦克的数量。这始于一个偶然的观察,他们发现每辆被俘获的坦克都有一个编号。由于生产这些坦克的是德国人,按照他们做事严谨的习惯,盟军有理由猜测这些坦克是按一定顺序生产的。由于盟军俘获每辆坦克的概率是相同的,这个问题就变成了一个叫作“均匀分布的边界估计”的问题,这对统计学家而言非常简单。假设德军坦克的编号分别为1,2,3…N,其中N为最大编号。设俘获德军坦克的数量为k,其中坦克的最大编号为m,就可以用公式

N=(1+1/k)m来估计德军坦克的总量。

战后,人们在分析德国战时记录时发现,战时德国每月生产坦克的实际数量为255辆。使用估计理论以被俘获的坦克为样本估计得到的数量为256辆,这与实际

m

不同俘获坦克数量(k)下的坦克总量估计(N)。当k=4、俘获坦克的最大编号(m)

为60时,估计坦克总量为75。当k值越大(俘获坦克数量越多)时,估计数量越接近实际数量数量非常接近,从而证明了统计学的力量。

失踪的弹孔

然而,统计学并非战争中唯一采用的数学知识。还有一个广泛应用的数学分支,叫概率论。这是一门预测事件发生可能性的学科,它的出现主要是因为在现实世界中很多时候我们都很难准确地预测一些事情。概率论最简单的例子之一就是抛硬币。一枚硬币有两面——正面和反面。当你抛起一枚硬币,最终得到正面的概率是多少?因为抛硬币最终得到的不是正面就是反面,所以在进行大量重复实验(抛硬币)的前提下,得到正面和反面的次数与总实验次数的比才接近0.5。概率论是一个强大的概念,在数学、人工智能和医学等方面有着非常广泛的应用。

即使是在战争期间,概率论也可以大显身手。在20世纪40年代,亚伯拉罕·瓦尔德(Abraham Wald)是美国统计研究小组(SRG,隶属于纽约的哥伦比亚大学)众多数学家和统计学家精英中的一员。瓦尔德和SRG其他成员一起居住在曼哈顿的一套公寓里(如今这栋建筑已成为哥伦比亚大学的教工公寓),他们在秘密地进行一项研究,就是要搞清楚如何使己方战斗机不被德军击落。这难道不是飞机工程师的工作吗?为什么要从数学家那里寻求答案?!

原来,为了让飞机不被击落,军方要为飞机披上装甲,使它们更好地防御敌人的攻击。装甲太重就会增加飞机的重量,降低飞机的机动性,也会消耗更多的燃料,但是防御不足又会带来问题。在这两个极端之间,有一个最优方案。军方把这些数学家聚在一起的目的就是找出这个最优方案。

通过研究那些从战场归来的飞机上弹孔分布的规律(如第35页表格),军方认为,应该把装甲集中安装在飞机受攻击最多的地方,也就是弹孔最多的地方。但是,这些地方究竟需要增加多少装甲?他们希望瓦尔德可以给出这个问题的答案。然而,瓦尔德给出的答案却出乎他们的意料。瓦尔德提出了一个反直觉的解决方法——他建议加装装甲的地方是没有弹孔的地方,也就是飞机引擎,而不是布满弹孔的机身。

STATS负责人和美国乔治梅森大学数学科学系教授丽贝卡·戈尔丁(Rebecca Goldin)博士说:“瓦尔德认为,从飞机上的弹孔获得的数据只能代表那些未被击落的飞机的情况。因为飞机各个部位被击中的概率应该是相同的,那么引擎上失踪的弹孔去了哪里?只能是因为被击中引擎的飞机没能返回。”如此看来,引擎就是飞机的死穴,一旦被击中,无一不被击落。大量飞机在机身被打得千疮百孔的情况下仍能返航,这个事实充分说明机身可以经受住打击,也就不需要增加装甲。

从统计学的角度来讲,瓦尔德解决的问题很简单——如何确定飞机从一定数量的攻击中存活的概率,比如说4次攻击中被击中3次。假设有10架飞机,7架飞机从战场归来,机身上有3处弹孔。弹孔具体在飞机的什么部位?机身、燃油系统、引擎抑或是其他部位?瓦尔德注意到,归来的飞机中,引擎遭到的打击比其他部位更少。那么另外3架未飞回的飞机呢?是因为机械故障还是被击落了?在战争期间,最符合逻辑的假设是这3架飞机被敌军击落了。在此基础上,瓦尔德进一步推测这些飞机被击落的原因是引擎被击中,这也是它们没有飞回来的原因!

观察到这一点很重要,乔丹·艾伦伯格(Jordan Ellenberg)在他《魔鬼数学》(How not to Be Wrong)一书中写道:“如果你去医院的恢复室看看,你就会发现腿部有弹孔的人比胸口有弹孔的人多得多。但这并不是因为人们胸口不会中弹,而是因为胸口中弹的人多半无法挽救。”因此,艾伦伯格把发动机比作飞机的“心脏”。如果你心脏中弹,与大腿中弹相比你的存活可能性小得多!

我们通常会由于偏见而引起一些过失,而这种选择偏见在商业模式中随处可见。通常,当我们尝试分析或理解某一情况时,我们并没有保持客观的立场,我们会被偏见左右,从而偏向于某些判断,从而导致我们得出错误的结论。在飞机的这个例子里,选择偏见体现在大部分人仅仅关注了飞机被敌军击中的部位,而瓦尔德的敏锐观察是将注意力集中在那些没有被子弹破坏的部位,并且在这些部位安装装甲使飞机能更好地抵挡敌军的攻击。正如《哈佛商业评论》(Harvard Business Review)中所说:“要找到使企业成功的方法,理论上,正确的办法就是去研究那些蒸蒸日上的公司和那些挣扎在死亡边缘的公司,两者都要研究。”