OEE 与 MTBF/MTTR:如何将生产性能与机器可靠性联系起来

Technicien maintenance réparant équipement industriel - MTBF MTTR fiabilité machine

作者 Alyssa Fleurette

发布时间:2025.11.13

阅读时间:

在车间里,往往存在着两个互不往来的世界:一个是生产世界,负责监控 OEE 和关键性能指标;另一个是维护世界,负责通过 MTBF 和 MTTR 控制机器的可靠性。结果是什么?维护指标在真空中运行,会议上每个人都把矛头指向另一个部门,最重要的是,计划外停工继续破坏工业绩效。

然而,这些指标并不是相互竞争的,而是相辅相成的。一个指标衡量损失的可见影响,另一个指标确定损失的根本原因。了解了如何将它们结合起来,就能在正确的时间、正确的地点采取行动,并长期改善结果,而不仅仅是观察结果。

为什么 OEE 和 MTBF/MTTR 经常被误解

第一个误解源于角色混淆。许多制造商在使用 OEE 时将其当作诊断工具,而实际上它只是一个温度计–这一点在我们将OEE 作为 KPI 或真正的管理工具进行分析时已有所阐述。

它显示了发烧(可用性为 65%,性能为 78%,质量为 92%),但对引起发烧的感染却只字未提。

相反,MTBF 和 MTTR 可显示设备的可靠性,但不能直接说明其对运行的影响。

在国际制造业中,这种混淆更加严重:我们谈论可用性效率,却没有将它们与 “为什么要测量 OEE“一文中所述的实际损失联系起来。

筒仓指示器陷阱

生产部门报告 OEE 为 68%,问 “为什么这么低?
维护部门回答 MTBF “在正常范围内”。

如果两者之间没有联系,就不可能知道 OEE 下降是由于长时间停机、重复微小停机还是质量偏差造成的–我们在比较 OEE vs FEE vs ERR时也提到了这个问题。

“正确 “的 MTBF 可能会掩盖长期的不稳定性,而故障次数少的高 MTTR 可能会产生破坏性影响。

后验计算问题

最后,这些指标往往是在事件发生几天后,在电子表格上事后计算出来的。其结果是,我们只能做出反应而非预测,现场团队对他们无法识别的数字失去了信心。人工数据收集会产生错误和遗漏,组织无法实时做出决策。

在分析一台设备一个月的总工作时间时,现场数据与人工计算之间的差异可能高达 15%至 20%。这种不准确性导致无法对损失原因进行详细分析,也无法有效地确定纠正措施的优先次序。

这些指标之间的根本区别

在对它们进行比较之前,重要的是要了解它们各自衡量的是什么。这三个关键绩效指标在制造业中的作用截然不同,但又相辅相成。

设备总体效能:运行绩效指标

OEE (设备综合效率)是一项运营绩效指标。其计算方法是将三个比率相乘:可用性,即实际运行时间除以计划运行时间(不包括计划停机时间);性能,即实际比率与理论比率的比较;质量,即衡量合格部件与已生产部件的比率。

60% 的 OEE 意味着在 100 个单位的理论生产时间中,只有 60 个单位实际转化为合格产品。这是一个综合、全面的指标,只显示损失而不解释损失的来源。它考虑了计划生产时间内的所有损失(不包括计划停工,如预防性维护或周末停工),使您能够评估生产设施的竞争力。

OEE 已成为全球制造业最广泛使用的关键绩效指标之一,因为它提供了一个可在不同生产基地之间进行比较的全局视图。然而,如果不对其根本原因进行分析,OEE 仍然只是一个观察指标,而不是改进的杠杆。

平均故障间隔时间:测量可靠性和平均故障间隔时间

平均故障间隔时间(MTBF)衡量生产资产的可靠性。它越高,设备故障就越少。它是可维修设备发生故障前的平均时间,以运行小时数表示,代表连续故障之间的平均寿命。

通过它可以预测故障,并制定预防性维护计划。高平均无故障时间(MTBF)表明两次干预之间的最佳运行时间,有助于保持设备的良好工作状态。

MTBF 是根据总有效运行时间除以记录的故障次数计算出来的。这种衡量可靠性的方法对于比较同类设备和识别需要特别关注的设备至关重要。在某些行业,MTBF 甚至包括在与设备供应商签订的维护合同中。

故障率:MTBF 的补充指标

故障率是平均无故障时间(MTBF)的倒数,它还可以量化单位时间内的故障频率。这一数值对于比较不同工业领域同类设备的可靠性尤为有用。故障率越低,设备的可靠性就越高。

通过分析多个时期的故障率,我们可以发现趋势:故障率逐渐上升表明设备性能下降,需要采取预防措施。对故障率的时间分析与特定时刻的绝对值同样重要。

平均修复时间:衡量可修复性

MTTR(平均修复时间)衡量设备的可修复性。MTTR 越低,维修速度越快。这是设备发生故障后重新投入使用所需的平均维修时间。

较高的平均修复时间(MTTR)表明在进行维修时遇到困难:缺乏备件、技能不足、通道问题或维修的复杂性。MTTR 考虑了诊断、维修、测试和重新安装。

在现代工业中,降低 MTTR 已成为一个战略问题。工作中节省的每一分钟都要乘以每年的故障次数,才能计算出总收益。因此,团队培训、备件可用性和设备可用性是关键的绩效因素。

MTTF: 维护指标的补充指标

MTTF(平均故障间隔时间)是另一个用于不可修复设备的平均寿命指标。MTBF 衡量的是可维修设备连续故障之间的平均时间,而 MTTF 衡量的是不可维修设备最终故障的平均时间。

在制造业中,MTTF 对系统的设计和选型特别有用,它使人们有可能预见到部件的完全更换而不是维修。例如,LED 灯泡有 MTTF(不需要维修),而电机有 MTBF(需要维修)。

MTTF 和 MTBF 之间的区别对于计算维护成本和优化备件库存管理至关重要。MTTF 短的部件需要替换库存,而 MTBF 低的设备则需要备件和维修技能。

三个指标的互补性

简而言之,OEE 衡量我们的损失所在,而 MTBF 和 MTTR 则帮助我们了解损失的原因,至少在可用性方面。将它们结合起来,我们就能获得工业绩效的全貌。

这种互补性更加强大,因为它使我们摆脱了生产和维护之间毫无结果的争论。这两个部门的工作数据相同,分析角度不同,但却趋于一致:最大限度地延长生产时间,最大限度地减少损失。

如何交叉参考 OEE 和 MTBF/MTTR,找出造成损失的真正原因

通过对这些维护指标进行综合分析、按机器进行实时分析,可以看出这些指标的真正威力。这种方法可以提高生产设备的竞争力。

可用性损失与故障率的映射

首先分解 OEE 的可用率。如果您看到的可用率是 70%,这意味着 30% 的损失。但这些损失是由于几次长时间停机(重大故障)、多次重复微小停机(堵塞、卡住),还是由于系列变化优化不当造成的?

这就是 MTBF 和 MTTR 的价值所在。MTBF 低(如 80 小时),而 MTTR 高(如 3 小时),表明设备不可靠,维修时间长。这是一台关键设备,会对您的可用性造成压力。相反,如果平均无故障时间正确(200 小时),但可用率下降,则可能显示出未计入 “正式 “故障的微小故障。

通过对故障率和效率(性能)进行交叉分析,还可以识别正在运行但处于降级模式的设备。这些在 MTBF 计算中看不到的情况会对总体 OEE 产生重大影响,需要采取特定的预防性维护或重新校准措施。

分析故障次数及其对总正常运行时间的影响

一定时期内的故障次数是评估设备健康状况的关键指标。通过将故障次数与平均无故障时间(MTBF)和平均故障间隔时间(MTTR)进行交叉对比,可以精确了解每台设备的关键性。

例如,一台设备每月发生 15 次故障,平均故障间隔时间为 2 小时,停机时间为 30 小时;而另一台同类型设备每月发生 5 次故障,平均故障间隔时间为 4 小时,停机时间为 20 小时。因此,前者尽管平均故障间隔时间较短,但仍需要优先干预。

这种分析还必须考虑到每台设备的总工作时间。即使 MTBF 相同,每天工作 24 小时的设备自然会比每天工作 8 小时的设备出现更多故障。因此,应始终将指标降低到可比基础上(例如,每运行 1000 小时)。

根据关键指标确定维护行动的优先次序

通过交叉参考 OEE 和 MTBF/MTTR,您可以根据设备的关键性对其进行分类。关键设备(低 OEE + 低 MTBF + 高 MTTR)需要绝对优先:加强预防性维护计划、分析故障模式和备件库存。

脆弱的机器(MTBF 低,但 OEE 影响适中)需要加强监控并优化维修时间。参数较差的机器(平均无故障时间正确,但 OEE 较低)需要更多关注减速和调整。这种矩阵可以摆脱 “消防队 “模式,根据每台设备的总运行时间,将维护资源分配到影响最大的地方。

通过实时数据收集从观察到行动

手动计算或每周计算的问题在于它们会冻结分析。有了 TeepTrak 这样的实时监控系统,停机数据就会自动收集、打上时间戳并得到确认。根据历史数据自然计算出 MTBF 和 MTTR,并可立即与每条生产线的 OEE 相互参照。传感器网络可确保持续、可靠地收集数据。

在实际操作中,这样做可以在偏差变得严重(MTBF 逐渐下降)之前发现偏差,识别由于同一根本原因导致的反复停机(即使停机时间很短),并衡量维护行动的实际影响。这种方法将关键绩效指标转化为具体的行动杠杆。

建立这样一个系统需要初始投资,但投资回报很快。平均而言,从人工监控转为自动化系统的制造商在不到一年的时间内就能将 OEE 提高 10-15%,原因很简单,因为能见度更高,响应速度更快。

计算 MTBF 和 MTTR:计算方法和示例

了解如何计算这些指标对有效使用它们至关重要。计算公式非常简单,但严格的数据收集工作却能起到事半功倍的效果。

计算 MTBF:公式和实际应用

MTBF 的计算公式如下:MTBF = 总运行时间/故障次数。例如,如果一台机器在一个月内运行了 720 小时,发生了 4 次故障,则 MTBF 为 720/4 = 180 小时。

这个计算示例表明,设备平均运行 180 小时才会发生故障。通过 MTBF 可以预测预防性干预措施并计划停机。

需要注意的是,MTBF 只应包括实际运行时间,而不是总的日历工作时间。如果设备在周末关闭,则这些时间不计入计算。这种区分对于获得可靠的可比指标至关重要。

平均维修时间公式及解释

平均维修时间的计算也遵循类似的逻辑:MTTR = 总维修时间/维修次数。如果这 4 个故障的维修时间分别为 2 小时、3 小时、1.5 小时和 2.5 小时,则总维修时间为 9 小时。

因此,每项工作的平均修复时间为 9/4 = 2.25 小时,即大约 2 小时 15 分钟。这一平均维修时间是衡量维护部门效率的直接指标。

高平均故障间隔时间可能有几个原因:缺乏技能、没有备件、难以使用设备或故障的内在复杂性。对这些原因进行分析后,就可以采取有针对性的措施来降低平均故障间隔时间:培训、库存管理、改进技术文档或人体工程学改造。

完整计算实例:具体工业案例研究

让我们以对一台液压机进行 3 个月监测的完整计算为例。总监测时间为 2 160 小时(90 天 × 24 小时),总有效运行时间为 1 850 小时(不包括计划停机时间)。设备发生了 12 次重大故障,累计维修时间为 48 小时。因此,维修次数与故障次数相符。

MTBF 计算:1,850 / 12 = 154 小时。MTTR 计算:48 / 12 = 4 小时。这些结果表明,在两次故障之间,压力机平均运行 154 小时,每次需要维修 4 小时。如果这类设备的工业目标是 MTBF> 200 小时和 MTTR< 3 小时,那么这台机器显然需要采取纠正措施。

按故障类型细化分析

平均故障间隔时间可以全局计算,也可以按故障类型计算。这种粒度使得识别重复出现的故障成为可能。例如,如果 12 次故障中有 8 次与液压系统有关,您就知道应该把精力集中在哪里。这种方法通过定位最有利可图的干预措施和优化资产寿命来提高竞争力。

在本文中,我们系统地建议按子系统(机械、液压、电气、气动)和类型(磨损、调整、随机故障)对故障进行分类。通过这种分类,可以计算出每个类别的具体平均无故障时间,并精确地找出设备的薄弱环节。

具体例子:在交通堵塞线路上反复停车的情况

让我们以食品行业的一个典型案例为例。一条装瓶生产线的 OEE 为 62%,远低于预期的 75%。生产经理指责 “机器停机太多”,而维护部门则反驳说平均无故障时间为 180 小时,”符合行业标准”。

诊断:确定隐藏的损失

利用详细的监控系统进行深入调查后发现,可用率仅为 72%(而不是估计的 85%)。长时间停机(>10 分钟)只占可用率损失的 40%,其余 60%来自与输出传送带反复堵塞有关的小停机(2-5 分钟)。

这些微停机时间太短,维护人员不会将其记录为 “故障”,因此也不会在 MTBF 计算中出现。然而,这种情况每班发生 8 到 12 次,即每天损失 30 到 45 分钟。官方公布的故障次数并不能反映实际情况。

对一个月总工作时间的分析还显示,这些微停机每周损失近 25 个小时,相当于一个完整班次。这种损失在传统指标中是看不到的,它解释了可接受的平均无故障时间(MTBF)与降低的 OEE 之间的差距。

采取的行动:有针对性的预防性维护

经过分析,问题出在瓶子导向装置的逐渐错位上。通过实施有针对性的预防性维护(每周调整一次,而不是每月一次)和从第 3 次微停开始的警告系统,团队将微停减少了 70%。团队还将可用率提高到 84%,并在 6 周内将 OEE 从 62% 提高到 71%。

实施这一解决方案需要生产部门和维护部门之间的密切协作,这充分说明了交叉参考关键绩效指标的好处。如果不对停产情况进行详细分析,宏观指标就无法发现问题所在。

定量结果:对维护指标的影响

由于对操作员进行了快速调整培训,此类事故的平均修复时间从 4 分钟缩短到 2 分钟。平均维修时间缩短了一半。由于减少了与堵塞相关的机械应力,生产线的总体平均无故障时间从 180 小时提高到 245 小时。

故障率下降了 35%,操作人员对设备重拾信心,设备现在处于良好、稳定的工作状态。这一经验证明了性能与可靠性相结合的综合方法的价值。

除数据外,这种改进还对生产线的性能(效率)产生了影响:减少了操作员的压力,减少了重新启动时原材料的浪费,产品质量更加稳定。整体 OEE 得到了加倍改善。

结论:衡量才能理解,理解才能行动

OEE、MTBF 和 MTTR:这三个指标不是竞争对手,而是盟友。OEE 告诉你损失了多少,MTBF 和 MTTR 则帮助你了解损失的原因,至少在机器可靠性方面。但是,只有通过对它们进行实时、细粒度(按机器、按工作站、按停机类型)的交叉对比,才能获得可操作的远景。

太多制造商满足于在周末评估其工业绩效。最好的制造商会持续监控其可靠性,在偏差变得严重之前就将其识别出来,并围绕相同的现场数据进行生产和维护。

在所有行业中,这种综合方法正成为一项重要的竞争优势。那些掌握了 OEE-MTBF-MTTR 相互促进技术的工厂,只需优化现有设备,就能在不进行大量投资的情况下提高 10% 到 20% 的生产能力。在竞争日益激烈的市场中,正是这种运营智慧带来了不同。

常见问题:OEE、MTBF 和 MTTR

OEE 和 MTBF 有什么区别?

OEE 结合可用性、性能和质量来衡量设备的整体性能。它揭示了您的损失程度。MTBF 通过计算平均故障间隔时间来衡量设备的可靠性。它可以解释您损失的原因(就可用性而言)。OEE 是结果指标,MTBF 是根本原因指标。将二者结合起来,您就能识别关键设备并确定维护行动的优先次序。

如何计算机器的 MTBF?

MTBF 的计算公式为:MTBF = 总运行时间/故障次数。例如,如果机器运行 500 小时,故障 5 次,则 MTBF = 500/5 = 100 小时。重要:只计算实际运行时间(不包括计划停机和周末)。按类型(机械、电气、液压)对故障进行分类,以完善分析并有针对性地采取预防措施。

在业内,什么是良好的 MTTR?

良好 “的 MTTR 取决于行业和设备类型,但这里有一些基准:MTTR< 2 小时 = 优秀(有效的反应性维护),MTTR 在 2-4 小时之间 = 复杂设备可以接受,MTTR> 4 小时(高 MTTR) = 有问题,需要采取行动(培训、备件、文档)。目标不仅仅是低 MTTR,而是稳定和可预测的 MTTR。如果平均维修时间差异很大,则表明干预措施缺乏标准化。

MTBF 与 MTTF:有什么区别?

平均故障间隔时间(MTBF)是指可维修设备(如电机、泵)的平均故障间隔时间。修复后又重新启动。MTTF(平均故障间隔时间)测量的是不可修复部件(如灯泡、保险丝、电子板)发生最终故障之前的时间。它将被全部更换。MTBF 用于计划预防性维护,而 MTTF 则用于确定备件库存的规模。

如何利用 MTBF 和 MTTR 提高 OEE?

首先,分析可用率(OEE 的组成部分)。如果可用率低,则查看平均无故障时间(MTBF):如果可用率低,则应加强预防性维护,间隔故障时间。然后再看 MTTR:如果 MTTR 高,则要培训团队、优化备件库存并改善可得性。按机器交叉参考这些维护指标,以确定关键设备。优先考虑那些 OEE 低 + MTBF 低 + MTTR 高的设备:其影响将是最大的。

为什么要交叉参考 OEE 和 MTTR?

因为 OEE 低的原因可能截然不同。如果您的可用率为 70%,平均无故障时间(MTBF)正确,但平均故障间隔时间(MTTR)较高(例如 5 小时),那么问题不在于故障频率,而在于维修时间。应对措施:技术人员培训、零部件储备、适当的工具。另一方面,如果平均故障间隔时间较低(30 分钟),但故障次数较多(每月 20 次),那么问题就出在可靠性上。措施:预防性维护、故障模式分析。

什么工具可用于实时监控 OEE、MTBF 和 MTTR?

TEEPTRAK 是一种工业监控解决方案,可自动实时收集停产数据。该平台可即时计算每台机器的 OEE、MTBF 和 MTTR,并可对这些关键性能指标进行交叉对比,以找出根本原因。通过传感器网络和持续的数据收集,TeepTrak 可将维护指标转化为具体的行动杠杆。该系统实施迅速,平均投资回报期不到 6 个月。

常见问题:OEE、MTBF 和 MTTR

OEE 和 MTBF 有什么区别?

OEE 结合可用性、性能和质量来衡量设备的整体性能。它揭示了您的损失程度。MTBF 通过计算平均故障间隔时间来衡量设备的可靠性。它可以解释您损失的原因(就可用性而言)。OEE 是结果指标,MTBF 是根本原因指标。将二者结合起来,您就能识别关键设备并确定维护行动的优先次序。

如何计算机器的 MTBF?

MTBF 的计算公式为:MTBF = 总运行时间/故障次数。例如,如果机器运行 500 小时,故障 5 次,则 MTBF = 500/5 = 100 小时。重要:只计算实际运行时间(不包括计划停机和周末)。按类型(机械、电气、液压)对故障进行分类,以完善分析并有针对性地采取预防措施。

在业内,什么是良好的 MTTR?

良好 “的 MTTR 取决于行业和设备类型,但这里有一些基准:MTTR< 2 小时 = 优秀(有效的反应性维护),MTTR 在 2-4 小时之间 = 复杂设备可以接受,MTTR> 4 小时(高 MTTR) = 有问题,需要采取行动(培训、备件、文档)。目标不仅仅是低 MTTR,而是稳定和可预测的 MTTR。如果平均维修时间差异很大,则表明干预措施缺乏标准化。

MTBF 与 MTTF:有什么区别?

平均故障间隔时间(MTBF)是指可维修设备(如电机、泵)的平均故障间隔时间。修复后又重新启动。MTTF(平均故障间隔时间)测量的是不可修复部件(如灯泡、保险丝、电子板)发生最终故障之前的时间。它将被全部更换。MTBF 用于计划预防性维护,而 MTTF 则用于确定备件库存的规模。

为什么要交叉参考 OEE 和 MTTR?

因为 OEE 低的原因可能截然不同。如果您的可用率为 70%,平均无故障时间(MTBF)正确,但平均故障间隔时间(MTTR)较高(例如 5 小时),那么问题不在于故障频率,而在于维修时间。应对措施:技术人员培训、零部件储备、适当的工具。另一方面,如果平均故障间隔时间较低(30 分钟),但故障次数较多(每月 20 次),那么问题就出在可靠性上。措施:预防性维护、故障模式分析。

保持联系

不要错过TEEPTRAK和工业4.0的最新动态,关注我们在LinkedInYouTube上的账号。同时,订阅我们的新闻简报,获取每月回顾!

优化与实际成果

探索行业巨头如何优化他们的OEE,减少停机时间并转变他们的绩效。切实的结果和经过验证的解决方案。

您可能也会喜欢…

了解机器监控,优化工业流程

了解机器监控,优化工业流程

在现代工业中,机器监控在优化性能和管理生产基础设施方面发挥着关键作用。得益于信息技术和监控解决方案的进步,企业可以提高可用性、预防故障并最大限度地提高效率。本文将探讨监控工具和软件及其在工业中的作用,以及它们在控制、安全和数据管理...

0条评论