明老师找油-32-“死人不会说话”与地质统计学调参(1) 随着国内油田逐步进入勘探开发后期,钻井越来越多,对地质模型的精度要求也越来越高,地质家希望把更多的井数据加入到地质建模中,地质统计学建模技术和地质统计学反演技术近几年得到很大发展,在项目研究过程中,很多人都提到两点:
1、 要把尽可能多的井参与到统计学参数(如纵向和横向变程、储地比等)的求取 2、 井太少时没法做好统计学建模或统计学反演
情况真的是这样吗?
先来看一个故事吧,它的名字叫 --“死人不会说话” 话说1941年,第二次世界大战正打得如火如荼。有一天,美国哥伦比亚大学著名统计学家沃尔德教授(Abraham Wald)遇到了一个意外的访客, 那是英国皇家空军的作战指挥官。他说:沃尔德教授,每次飞行员出发去执行轰炸任务,我们最怕听到的回报是:『呼叫总部,我中弹了!』请协助我们改善这个攸关飞行员生死的难题吧! 沃尔德接下这个紧急研究案,他受委托分析德国地面炮火击中联军轰炸机的资料,并且以统计为基础,来建议机体装甲应该如何加强,才能降低被炮火击落的机会。 依照当时的航空技术,机体装甲只能局部加强,否则机体过重,会导致起飞困难及操控迟钝。 沃尔德将联军轰炸机的弹着点资料,描绘成两张比较表. 沃尔德的研究发现,机翼是最容易被击中的部位,而飞行员的座舱与机尾,则是最少被击中的部位。 沃尔德详尽的资料分析,令英国皇家空军十分满意。但在研究成果报告的会议上,却发生一场激辩。 负责该项目的作战指挥官说: “沃尔德教授的研究清楚地显示,联军轰炸机的机翼,弹孔密密麻麻,最容易中弹。因此,我们应该加强机翼的装甲。” 沃尔德客气但坚定地说: “将军,我尊敬你在飞行上的专业,但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿最少发现弹孔。” 在全场错愕怀疑的眼光中,沃尔德解释说: “我所分析的样本中,只包含顺利返回基地的轰炸机。从统计的观点来看,我认为被多次击中机翼的轰炸机,似乎还是能够安全返航,而飞机很少发现弹着点的部位,并非真的不会中弹,而是一旦中弹,根本就无法返航。” 指挥官反驳说: “我很佩服沃尔德教授没有任何飞行经验,就敢做这么大胆的推论,就我个人而言,过去在执行任务时,也曾多次机翼中弹严重受创,要不是我飞行技术老到,运气也不错,早就机毁人亡了,所以,我依然强烈主张应该加强机翼的装甲。” 这两种意见僵持不下,皇家空军部部长陷入苦思。
他到底要相信这个作战经验丰富的飞行将军,还是要相信一个独排众议的统计学家? 由于战况紧急,无法做更进一步的研究,部长决定接受沃尔德的建议,立刻加强驾驶舱与机尾发动机的防御装甲。 不久之后,联军轰炸机被击落的比例,果然显著降低。 为了确认这个决策的正确性,一段时间后,英国军方动用了敌后工作人员,搜集了部份坠毁在德国境内的联军飞机残骸,他们中弹的部位,果真如沃尔德所预料,主要集中在驾驶舱与发动机的位置。看不见的弹痕最致命 ,乍看之下,作战指挥官加强机翼装甲的决定十分合理,但他忽略了一个事实:弹着点的分布,是一种严重偏误的资料。因为最关键的资料,其实是在被击落的飞机身上,但这些飞机却无法被观察到,因此,布满了弹痕的机翼,反而是飞机最强韧的部位。空军作战指挥官差点因为太重视「看得见」的弹痕,反而做出错误的决策。
这个案例有两个特别值得警惕的地方。死掉或被俘的人无法发表意见
第一, 搜集更多资料,并不会改善决策品质。由于弹痕资料的来源本身就有严重的偏误,努力搜集更多的资料,恐怕只会更加深原有的误解。
第二,召集更多作战经验丰富的飞行员来提供专业意见,也不能改善决策品质,因为这些飞行员,正是产生偏误资料过程中的一环。他们都是安全回航的飞行员,虽然可能有机翼中弹的经验,但都不是驾驶舱或发动机中弹的「烈士」。
简单的说,当他们愈认真凝视那些「看得到」的弹痕,他们离真相就愈远。 哲学家们给它起了一个洋气的名字,叫“幸存者偏差” 幸存者谬误实在是过分常见了,我可以随便举一大堆: 为什么地铁总是人满为患但还是亏本运营?因为你总是人满为患的时段去挤地铁。 为什么中国盖的桥,修的路都是动不动就塌了。因为没塌的不会有人报道。 为什么电视上香港人的房子都那么大,香港人还说房子太小,地太贵。因为小房子上不了电视,机位没法摆。 为什么外国人都很有钱的样子。因为没钱的来不了中国让你看见。 为什么新疆人都卖切糕和拉面?因为卖葡萄和哈密瓜的在新疆。
故事讲完了,我们的地质家们有何感悟吗? 问大家几个问题: 1、 你的井位的平面位置是否是均匀的? 2、 研究工区在钻井前没有进行过地质研究? 3、 在油区外,甚至泥岩里、洼陷里你打井了吗? 4、 你这个地区储层基本上是均匀的吗? 5、 研究区的井位密度相对于沉积微相的变化是否已足够密? 如果以上问题你的回答基本上都是“是”,那恭喜你,你可以用这些井进行统计求取参数,进行统计学建模了J
如果有两个以上问题是否定的,那你就要小心了,因为你的数据极有可能出现“幸存者偏差”。
举两个例子: 例1:在中国东部某盆地50平方千米范围内,打了四口井后,结合地震属性发现强振幅是河道主体,占工区面积的30%,弱振幅没有储层,但占工区面积的70%,后续连续在强振幅的构造高部位上打了12口井,口口成功,按说井数也不少了,可这些井统计的变程你相信吗? 例2:在中国西部,塔里木盆地奥陶系碳酸盐岩洞穴型储层,通过前面几口井钻探证实强串珠是优质储层,之后几年相继钻探了几百口井,成功率很高,但问题在于,串珠储层仅占工区面积的2%,在98%的弱反射区域上基本没有井位,另外在纵向上,当井钻至溶洞顶部时就很快完钻,在储层部位基本没有测井资料,这样的变程该怎么统计? 这两个例子大家可能觉得有点过于极端,实际上在咱们身边会有许许多多这样的情况,可我们还在拿这样的一批井在统计各种统计学参数,这样的结果是很危险的,希望引起大家足够的重视。 下期我会根据实际项目经验给大家提一些改善统计学参数优化的建议,敬请关注。
|