雾影地之竹龟三1914年,飞行员托尼·雅努斯(Tony Jannus)完成了第一次载客飞行,21英里(1英里约为1.6千米)的飞行持续了23分钟,乘客为此支付了400美元,这一事件也预示了民航时代即将开启。但是,直到1926年,美国联合航空公司(United Airlines)的一架飞机首次用于投递邮件,这才开始了第一次真正的商业飞行。与此同时,英国飞机制造商和设计师弗雷德里克汉德利佩奇(Frederick Handley Page)领导了一个委员会,开展对民航需求的评估,他们发现民用航空和军用航空的要求截然不同,此次调查的成果就是在1937年成立了航空注册委员会(ARB)。ARB负责英国商业航空公司适航证书的签发和续签,并根据制造商的建议批准了维修时间表。航空公司需要遵守这些维修计划以维持其适航认证。几乎所有推荐的维修任务都会要求对使用寿命周期内的部件进行大修,这样就能避免承运人因不遵守认证要求而对行业造成损害。在这些日子里,大多数负责维修的工程师都认为所有的部件都遵循着“浴盆曲线”的故障模式。
他们意识到在进行维修时必须慎之又慎,因为在大修之后很可能会发生过早失效。他们认为,在大修之后的磨合阶段结束后,所有部件都将保持较低的故障率状态运行相当长一段时期,这段时期便被称为使用寿命,随后部件的故障率会不断增加,直至发生磨损失效。作为一项维护策略,必须按照批准的维修时间表在磨损期到来之前对部件进行更换。有一种普遍的观点认为,飞机维修的工作量(小时)与其可靠性和耐久性有直接的关系。
到20世纪50年代,商用飞机的尺寸与20世纪30年代的飞机相比有了很大的增加。商业航空公司开始抱怨适航认证过程,并对许多维护任务的必要性表示怀疑。他们在进行维修时发现,其实许多大修部件仍能运转良好。同时,他们也注意到大修后出现了一些意想不到的故障,由此推断是过度的维修工作引发了额外的(可避免的)过早故障。其实他们的观点并非完全没道理,只是当时还拿不出令人信服的证据。
适航认证对航空公司来说就是一场噩梦,因为它会导致检修费用飘升,并且在大修完成后还会常常出现意想不到的故障。例如,对于拥有150客运量的波音707飞机,在到达20000h的运行时间之前,竟然需要400万工时的大修任务。显然商业航空公司的经济可行性遭受到自身适航认证要求的威胁。
20世纪50年代,航空公司发现,不可能有把握地确定飞机甚至部件的检修频率,因为可靠性和检修频率之间没有直接联系,个别短寿命部件会决定部分子系统的可靠性。他们还发现,对于没有明显工时-可靠性关系的部件,取消其检修任务可以降低维护人力的成本,并且不会对可靠性造成影响。
同样在20世纪50年代,美国联邦航空局(FAA)也在努力应对这样一个事实,即某些型号的飞机引擎即使经过了大修频率的优化也还是会发生故障。然后,FAA开始对保险公司记录的故障事件进行统计分析。他们要求所有制造和销售飞机的企业为每一种飞机型号制定一份经过批准的、有详细文件的预防性维修计划。到20世纪60年代,波音公司提出了一种新的飞机设计方案,其载客量是当时最大的707机型的3倍。依据其政策,FAA要求为747-100型飞机制定一个可接受的维修计划。他们认为,现有的维修计划包括基于时间的严格检查、维修和更换,其成本和时间也将是707机型的3倍。因此,FAA认为研发747-100型客机在经济上根本不可行。但即便如此,波音公司和联合航空公司(UA)仍然决定挑战当时业界普遍认可的浴盆磨合模型假设。
联合航空公司和波音公司随后进行了一项新的研究,即根据历次故障的物理属性来确定需要什么样的维修资产来确保适航性能。他们设立了一个维修指导小组(MSG),专门负责开发系统的常识性工艺,用来确定如何为波音747-100飞机保留系统的各项功能。不负所望,MSG通过提出一项可接受的主动维修 (PM)计划,证明了技术和经济的可行性,并最终获得了FAA的认可。MSG还编写了一本手册,介绍了为新波音747飞机制定维修策略的方法,随后于1968年由美国航空运输协会(ATA)出版,并被命名为《维修评估与方案评估》(MSG-1),其基础是为维修策略选择而设计的决策图。这份文件在20世纪70年代被推广到其他飞机上使用。文件的第二版称为MSG-2,标题是《航空公司/制造商维修方案计划书》,后来用于洛克希德1011、道格拉斯DC-10和其他一些军用飞机上。20世纪70年代,美国国防部(DoD)命名了以可靠性为中心的维修(RCM)这种新方法。1975年,DoD规定所有主要系统需要采用RCM方法进行评估。
联合航空公司在对其掌握的大量故障案例进行研究后,证明了非结构部件存在不止一种故障模式。基于230个非结构性部件建立的故障密度函数显示:绝大多数这样的故障都是自然随即分布的,如图2(D)、(E)、(F);仅有11%的故障与工作时间相关,如图2(A)、(B)、(C);此外,只有4%的故障符合浴盆曲线。乐观点的话,可以合理的假设当时的维护计划有效的防止了大约11%的故障发生;而悲观地说,维修计划仅有4%的情况下是有效的,也就是说96%的情况下它们没有达到目标。这一发现具有里程碑式的意义。
联合航空公司将它发现的六种故障模式分为了两类,并发表在Stanley Nowlan(联合航空公司的维修分析总监)和Howard Heap(联合航空公司的维修方案策划经理)于1979年所做的报告《以可靠性为中心的维修》中。
注:,F.S诺兰和H.F.希普《以可靠性为中心的维修》于1982年由机械工业出版社翻译出版。
图2所列各图表示随着时间的推移出现故障的条件概率。其中:图2(A)是前面描述的浴盆曲线(B)表示老化模式,故陷的可能性随着时间的增长而增加;图2(C)表示一种特殊的老化情况,其抗失效性能会随磨损、腐蚀和疲劳的加重逐渐下降;图2(D)显示了一种先快速老化,然后随机失效的模式,它通常出现在液压和气动系统中;图2(E)表明了一种完全随机失效的恒定故障率;最后,图2(F)显示了最糟糕的一种情况——系统发生“夭折”,它通常是由大修或更换新部件等干预措施导致。
联合航空公司的报告后来被修改为MSG-3(1980年),应用于波音757和 767等新机型的维修过程。1993年,一份名为《欧洲维修系统指南》的欧洲版MSG被应用于“协和”飞机和空客330/340。RCM原理的应用和分析反馈,为空气动力学设计提供了惊人的安全改进,已从20世纪60年代每百万次起飞大约有60次坠毁,降低到20世纪90年代的仅不到2次(现在是0.2次)。更令人印象深刻的是,改进是在大幅降低成本的情况下实现的。
后来,核工业开始采用RCM。1982年,美国电力研究所(EPRI)在核电站开展了两个试点项目。到1987年,美国的整个核工业都采用了这种方法。1993年,EPRI模式的简化版本得到开发,有效节省了RCM过程本身的成本。1982年,RCM被应用于南非的采矿业和其他一些行业,1986年被推广到其他地方,首先是欧洲、北美和南美,然后是中东和大洋洲。关于RCM的第一批商业出版物,出现在1991年和1993年。在这些书籍出版之后,RCM变得越来越出名和流行。RCM简直完美地贴合了当时日益复杂的产业化进程、日益增长的精细维修技术需求以及日趋激烈的全球化竞争,当然还包括以尽可能低的成本优化资产产出的需要。20世纪90年代开始出现了一系列令人困惑的RCM变体,其中一些甚至还超过Nowlan和Heap以及后来的书中所描述的严格程度。为了解除这些困惑,提供一种手段去筛除那些不太凑效的方法,同时也为了给当时已出台的异常复杂的军事标准提供一个备用方案,美国汽车工程师学会(SAE)于1999 年发表了一个新的标准(SAE JA1011,以可靠性为中心的维修(RCM)工艺评估标准)。从那以后,仅有其他少数几本关于这个话题的书出版过。
以可靠性为中心的维修再造工程,热苏斯R西冯特、祝玉林译,北京:国防工业出版社,2020.10,中文图书
以可靠性为中心的维修,(英)J莫布雷著、石磊 谷宁昌译,机械工业出版社,2000.7,中文图书
以可靠性为中心的维修(上、下),F.S诺兰、H.F.希普,机械工业出版社,1982,中文图书
|