明老师找油-33-“死人不会说话”与地质统计学调参(2) 上期微信发表以后,一些朋友提到,“死人不会说话”故事只是一个故事,大家想都能想明白要加厚驾驶舱和发动机及机尾,人们根本没有必要用著名的科学家花这么大力气干这么个事。 需要解释一下的是,飞机设计师在设计飞机的时候也一定会有意识地加厚这些部位,在这种情况下,怎样发现飞机的薄弱环节,仅靠“拍脑袋”定性分析是远远不够的,必须靠数据说话,进行定量分析才行。 回到这个例子, 读读沃尔德这篇 1943 年的论文吧。 论文背景是,二战时,从战火中返航的飞机的伤痕呈现某种规律,有的部位中弹多,有的部位中弹少。为了提高飞机的防御力,直觉上似乎应该在弹孔密集处加强装甲。 不过这位专家说:到底哪里最需要防护,直觉说了不算,我算给你看。 (CameronMoll 画的示意图) 这位专家是匈牙利裔犹太人,后来去美国做研究,二战前后达到个人学术成就的顶峰。 此时你是否想起了一头姓冯名诺依曼的超级神犇? 沃尔德的名气比冯·诺依曼小一万倍,但在当时神牛辈出的学术圈也不是无名之辈。 诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。 弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」
(沃尔德台词:老乡见老乡,风头全抢光!快把话题转回我的论文) ========
沃尔德的论文题目是:
A Method of Estimating Plane Vulnerability Based on Damage of Survivors
一种根据幸存飞机损伤情况推测飞机要害部位的方法。 上图是正文第一页。开篇是定义参数,推出引理,列出数值分析方法等等。 铺垫了五十五页之后,沃尔德开始代入数据,演示如何计算飞机要害处。他用了一组虚构的数据: 400 架飞机参与轰炸行动,返回 359 架。在返回的这些飞机中, 240 架毫发无损, 68 架中弹 1发,29 架中弹 2 发, 12 架中弹 3 发, 10 架中弹 4 发。另外还已知飞机的各部位面积及各部位中弹次数,其中发动机部位的弹孔分布最稀疏。但对于没回来的飞机是怎么死的一无所知。 我的第一反应是:这道应用题是不是条件不足?
只了解返航的飞机的情况,完全不知道坠毁的飞机哪里中了弹,没有对照,怎么知道哪个部位是要害呢? 沃尔德毕竟是吃这碗饭的,前五十五页也不是白写的。推算结论如下表: 大意是说,根据这组虚构的数据,得出结论,发动机是最要命的地方,被击中一弹,就有 39% 的概率坠毁。 弹孔最稀疏处,恰恰是要害处,因为没怎么被击中要害的飞机才更有机会返航、进入统计样本。这就是「幸存者偏差」。 接下来,沃尔德马上推出升级版算法:只要知道返回的飞机何处中了何种子弹,我就可以算出飞机不同部位被不同武器击中之后的坠毁概率!此处使用的数据仍是虚构的,只为演示算法,结论如下:
沃尔德根据虚构的数据算出:
1. 飞机最怕被20毫米机炮击中发动机,挂掉的概率是53.4% ;
2. 第二危险的是被7.9毫米机枪击中驾驶舱,有 19.4% 的概率坠毁;
3. 综合来说,发动机是最致命的地方;
4. 综合来说,被20毫米机炮击中掉血最多。 或许有人会说:我用膝盖都能想到发动机和驾驶舱是要害,还要你算给我看?更不用说你的数据还是虚构的了。 不过我的想法是,设计飞机的人不会没有考虑到发动机和驾驶舱的重要性,或许已经给予了充分甚至过分的保护了呢?加厚装甲的代价是损失飞行灵活性,不是想加就加的。 所以在这点上我认为,凭常识是不足以判断飞机哪里需要加固的。有了计算方法,我们才有办法知道对要害的保护有没有矫枉过正,有没有暴露出新的要害。 ======== 这篇 1943 年的论文的实用价值在于:战场上我们很难找回坠毁的飞机,因而没有办法像 CSI那样去给飞机验尸,但是不要紧,只要分析返回的飞机,使用统计学方法,就可以推算出那些挂掉的飞机的死因,以助改进飞机的设计。 总之,故事确有真实源头,不过故事中没有提到的是,飞机的要害部位与弹孔分布的关系,不是光凭空口推理的,而是一位优秀的统计学家以平生所学,花了近百页的篇幅,列了一百多个式子推导出来的。
沃尔德的结局令人惋惜。1950 年,四十八岁的他受印度政府邀请,携妻前往印度讲学。不料,航行至印度的尼尔吉里丘陵时,飞机坠毁,沃尔德和妻子都未能成为幸存者。
|