MTBF简介 林和安 冯杰 vincent发表于《中无通讯》2005年第35期
笔者最近看到一款可用于伺服器的WD Caviar RE2 7200 RPM 硬碟,MTBF 高达 120万小时,保修5年。120万小时约为137年,并不是说该种硬碟每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬碟的平均年故障率约为0.7%,一年内,平均1000只硬碟有7只会出故障。
随着伺服器的广泛应用,对伺服器的可靠性提出了更高的要求。所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不能或将不能完成规定的功能是出故障。概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ表示。例如正在运行中的100只硬碟,一年之内出了2次故障,则每个硬碟的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time Between Failures),简称MTBF。即:
MTBF=1/λ
上图所示为著名的“浴盆”曲线,左边斜线部分为早期故障率,其故障率一般较高且随着时间推移很快下降。曲线中部为使用寿命期,其故障率一般很低且基本固定。最右部为耗损期,失效率急速升高。电子产品制造商一般通过测试、老炼、筛选等手段将早期故障尽量剔除,然后提供给客户使用。当使用寿命期将尽,产品也即将进入故障高发期,需要报废或更新换代了。
温度与器件的寿命
明白了MTBF和“浴盆”曲线的基本概念,我们对评估产品的使用寿命有了一定的掌握。在合适工作条件下器件使用寿命期内的故障率很低。广大电子爱好者都知道电子元器件的寿命,与工作温度是有密切关系的。以电脑主板上常用的也常出故障的电解电容器为例,其寿命会受到温度的影响。因此,应尽可能使电容器在较低的温度之下工作,如果电容器的实际工作温度超过了其规格范围,不仅其寿命会缩短,而且电容器会受到严重的损毁(例如电解液泄漏)。因此,在
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
电脑主板上电容器的工作温度时,不仅要考虑机箱内整体环境温度及电容器自身的发热,还要考虑机箱内其他发热元件的热辐射(特别是CPU、稳压器、电源供应器等)。
根据测试,通常2.0G的CPU消耗功率达56.7W,生成温度达70℃;而当频率提高至3.0G时, CPU温度往往超过90℃。在这样的高温烘烤下,主板上的电容器寿命会发生什么变化?
为简化起见,不考虑纹波、频率、ESR等因素,电容器的估计寿命可用下述公式表示:
其中,L0表示最高工作温度下的寿命,Tmax表示最高工作温度,Ta表示实际环境温度。由此可见,如果环境温度每升高10℃,电容器寿命将下降一倍!
由上图右面的曲线可明显看出,随着电容器工作环境温度的上升,其有效寿命急剧缩短。其中有效寿命(Useful life)是指该种电容器达到给定故障率的时间。
温度与电脑的可靠性
电源供应器对电脑来说,重要性不言而喻。影响电源供应器寿命的因素很多,如负载大小、振动和周边的环境温度等。其中,环境温度很重要,所以选择合适的风扇,排放出由电源供应器内部的热量非常关键。电源供应器的MTBF,在很大程度上是由其内部的电解电容器MTBF值所决定的。因随着温度的上升,电容器的寿命急剧缩短,所以电源供应器的工作温度如能得到降低,其寿命就会更长一些。
当评价电源供应器所标称寿命时,电源供应器是否运行在额定的满负载状况是另一重要考虑因素。如果电源供应器装有合适的散热器而散热风扇风量足够大,在低于满负载的情况下连续工作,电源供应器就能有更长的寿命。一般电脑电源供应器寿命按照3-5年计算元件的可能失效周期,MTBF在80,000-100,000小时之间。
不同的电源供应器厂家,其产品设计、用料也往往差别很大,工作寿命自然不同。在DIY 1U伺服器时,优质的电源供应器选择不多,台湾新巨Zippy 是一个不错的选择。中国内地一些名牌伺服器例如著名的曙光也采用该品牌电源供应器,在一些DIY市场可购到的P1H-6400P 400W电源供应器,随着双核心CPU推出,400W电源供应器可能不够用,推介使用H1H-6507P 、M1G-6500P 500W。
如上图所示,HG2-6400P采用了主动PFC,虽然增加了成本,但具有更高的效率,能够在90V-260V的任何电压环境下稳定工作。该电源供应器大量部采用稳定性和寿命是普通电容器的3倍以上的日本电容器。在一些劣质的电源供应器产品中,EMI电路往往是重点的省略对象。从这款HG2-6400P的EMI电路上可以看出,用料十分充足,符合电磁兼容标准,稳定的表现当然是情理之中。
除电源供应器外,硬碟的温度也不可小视。现在的硬碟动不动就7200rpm-15000rpm,想想看硬碟内的马达每天转24小时,平均工作温度在四、五十度的高热是免不了。笔者曾测量过一台散热不够好的伺服器硬碟,温度超过40℃。对硬碟来说,如果机壳内部的温度降低了,这将意味着减少主轴马达液态轴承的轴承润滑剂以及磁碟润滑剂的蒸发,这将大大降低其损坏的机率。据Seagate公司公开的某型号硬碟数据,在34℃时的MTBF为150,000小时,但在25℃时,会达到230,000小时。
MTBF的计算方法
MTBF值是可靠性指标的最通用表示方法。它是英文(Mean Time Between Failures)的缩写,有人把它译成中文“平均无故障工作时间”。 E. _% MTBF=1/(所有元件失效率之和)
* Y. @" {. H; ?; x2 g MTBF值的计算方法,目前最通用的权威性标准是MIL-HDBK-217和Bellcore,它们分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,其最新版本为217-F2。- j4 ~# |6 m1 _9 J% `1 R4 H
在整个产品开发过程利用可靠性预测工具评估产品是否可靠,为设计
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
修改提供技术依据,从而避免盲目实施具体设计,尽量将潜在的“不可行性”发现在早期。6 t' h- \6 \, k4 @9 h6 L
在电路功能基本相同,利用可靠性分析工具做出决定在条件允许时,一定采用高MTBF值的方案。 在电子产品调试过程中,利用可靠性分析定位产品中的潜在的“不稳定”因素。如过压、过流、过热等形成某个器件提前失效。衡量产品是否可靠的唯一标准就是MTBF值。 在质量管理方面,要求任何电气产品都必须有最终的MTBF
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
。- A* y) MTBF的计算方法和依据已经成为标准,其主体是考虑产品中每个元器件的失效率。但是由于电子产品的结构不同,应用环境不同等,会严重影响每个元器件失效率,从而导致总体MTBF值降低。因此在计算中:首先考虑的是环境因素。其次十分重要的因素是器件本身的可靠性参数。此外,是电子系统加工工艺和结构,如器件插座、焊接、过孔数、贴片器件、连线等等。
% c3 ~5 L$ ?; a+ [* f 根据每种器件参数(厂家提供),包括: 74系列等各种电路,FPGA、CPU、ASIC、晶体管、二极管、电阻、电容、保险丝,指示灯、开关、 供应商等。选用串行方式、并行方式和N中取K方式的计算方法采用计算机来计算系统的可靠性指标。并根据已订立的工业标准
连接器、接插件等。还有各种封装、 (MIL-HBK 217)来计算MTBF数值。并经过自己多年的设计生产研制的经验和统计数据资料得到各微波部件的MTBF如下表:
- ^, s$ H; ^8 m3 ~/ d4 [+ D$ t- c部件名称 代号 MTBF(小时)% p5 N7 ~# X n5 q; M5 V8 Z" ?* T
基带部分 Mtbf B 3500,000) X; F' V% c* H+ Y; m
调制解调 Mtbf M 3200,000
2 ], ^# F3 Q. a8 K" E. W切换部分 Mtbf Q 3000,0001 l( ^( z b* p7 V" @- [
电源部分 Mtbf P 1500,000$ _3 _) Y" V" c0 O
高频部分 Mtbf R 2200,000
/ Q c, r0 G! s0 C天馈部分 Mtbf A 4,000,000
2 f2 q: O% C, Z- M% @( d$ f# i: p+ a; K$ F7 M$ Z: D根据拓扑学的原理可以得到在微波系统的MTBF的计算方法: % M. B9 N1 }& G' C! r$ h% m9 |)
; j( [" T* {9 [; k7 y- V另外公司统计结果:
7 v& C& } N$ t- Z9 W/ p; f$ Q% M统计时间:1999年1月1日~2000年12月31日。* ^/ r; D' a" ~) w" U& r; `
生产设备:按500套1+0微波设备来统计
" e5 Y2 I. u7 F0 Q m共得到了35次的故障报告, 其中16次为高频部分故障,其中15次为中低频部分故障,4次天线方向偏移。1 u# |,总的来说, 其统计的MTBF为: Y9 M/ X" u( J5 I
500台 x 2年 x 365天/年 x 24小时/天÷35次故障3 a( T% X' f3 i3 r( u
所以MTBF=250,000小时;
% U: m; I; p4 U2 \其中天线部分其统计的MTBF为:
: n) C& e" a3 x4 P 500台 x 2年 x 365天/年 x 24小时/天÷4次故障2 `; `. p5 f# b' z c
所以MTBF=2,190,000小时;9 o5 R$ o. J: v* o1 g9 b; @
其中高频部分其统计的MTBF为:
0 G8 B/ H8 b( o% U 500台 x 2年 x 365天/年 x 24小时/天÷16次故障& w& w: {9 a7 {% P
所以MTBF=550,000小时;
/ u+ ^! ]3 H; |1 l. Y其中中低频部分其统计的MTBF为:
% a7 i5 {) e6 `/ r6 s! i1 b 500台 x 2年 x 365天/年 x 24小时/天÷15次故障
3 ?; \4 `* c) z6 P3 W 所以MTBF=580,000小时;
$ A; O7 p& s/ z% MMTBF、MCBF、MTTR是什么意思
MTBF:平均故障时间。一般指产品在两次故障之间的平均时间间隔,作为产品的平均寿命的指标之一。
MTTR:平均维修时间。一般指产品的故障维修所需的平均修复时间,作为产品可维修性的衡量指标。
MCBF Mean Cycles Between Failure 运行设备两次损坏之间的次数。