Как вычисляется среднее время до отказа и вероятность безотказной работы?05.04.2015 11:17

Понятиям MTTF (Mean Time To Failure — среднее время до отказа) и другим терминам теории надежности посвящено большое количество статей, в том числе на Хабре (см., например, тут). Вместе с тем, редкие публикации «для широкого круга читателей» затрагивают вопросы математической статистики, и уж тем более они не дают ответа на вопрос о принципах расчета надежности электронной аппаратуры по известным характеристикам ее составных элементов.В последнее время мне довольно много приходится работать с расчетами надежности и рисков, и в этой статье я постараюсь восполнить этот пробел, отталкиваясь от своего предыдущего материала (из цикла о машинном обучении) о пуассоновском случайном процессе и подкрепляя текст вычислениями в Mathcad Express, повторить которые вы сможете скачав этот редактор (подробно о нем тут, обратите внимание, что нужна последняя версия 3.1, как и для цикла по machine learning). Сами маткадовские расчеты лежат здесь (вместе с XPS- копией).1. Теория: основные характеристики отказоустойчивостиВроде бы, из самого определения (Mean Time To Failure) понятен его смысл: сколько (конечно, в среднем, поскольку подход вероятностный) прослужит изделие. Но на практике такой параметр не очень полезен. Действительно, информация о том, что среднее время до отказа жесткого диска составляет полмиллиона часов, может поставить в тупик. Гораздо информативнее другой параметр: вероятность поломки или вероятность безотказной работы (ВБР) за определенный период (например, за год).

Для того чтобы разобраться в том, как связаны эти параметры, и как, зная MTTF, вычислить ВБР и вероятности отказа, вспомним некоторые сведения из математической статистики.

Ключевое понятие теории надежности — это понятие отказа, измеряемое, соответственно, интервальным показателемQ (t) = вероятность того, что изделие откажет к моменту времени t.Соотвественно, вероятность безотказной работы (ВБР, в английской терминологии «reliability»): P (t) = вероятность того, что изделие проработает без отказа от момента t0=0 до момента времени t.По определению, в момент t0=0 изделие находится в работоспособном состоянии, т.е. Q (0)=0, а P (0)=1.

Оба параметра — это интервальные характеристики отказоустойчивости, т.к. речь идет о вероятности отказа (или наоборот, безотказной работы) на интервале (0, t). Если отказ рассматривать, как случайное событие, то, очевидно, что Q (t) — это, по определению, его функция распределения. А точечную характеристику можно определить, какp (t)=dQ (t)/dt = плотность вероятности, т.е. значение p (t)dt равно вероятности, что отказ произойдет в малой окрестности dt момента времени t.

И, наконец, самая важная (с практической точки зрения) характеристика: λ (t)=p (t)/P (t)=интенсивность отказов.Это (внимание!) условная плотность вероятности, т.е. плотность вероятности возникновения отказа в момент времени t при условии, что до этого рассматриваемого момента времени t изделие работало безотказно.

Измерить параметр λ (t) экспериментально можно путём испытания партии изделий. Он будет Если к моменту времени t работоспособность сохранило N изделий, то за оценку λ (t) можно принять процент отказов в единицу времени, происходящих в окрестности t. Точнее, если в период от t до t+dt откажет n изделий, то интенсивность отказов будет примерно равнаλ (t)=n/(N*dt).

Именно эта λ-характеристика (в пренебрежении ее зависимостью от времени) и приводится чаще всего в паспортных данных различных электронных компонент и самых разных изделий. Только сразу возникает вопрос:, а как вычислить вероятность безотказной работы и при чем здесь среднее время до отказа (MTTF).

А вот при чем.

2. Экспоненциальное распределениеВ терминологии, которую мы только что использовали, пока не было никаких предположений о свойствах случайной величины — момента времени, в который происходит отказ изделия. Давайте теперь конкретизируем функцию распределения значения отказа, выбрав в качестве нее экспоненциальную функцию с единственным параметром λ=const (смысл которого будет ясен через несколько предложений).

Дифференцируя Q (t), получим выражение для плотности вероятности экспоненциального распределения: , а из него — функцию интенсивности отказов: λ (t)=p (t)/P (t)=const=λ.

Что мы получили? Что для экспоненциального распределения интенсивность отказов — есть величина постоянная, причем совпадающая с параметром распределения. Этот параметр и является главным показателем отказоустойчивости и его часто так и называют λ-характеристикой.

Мало того, если теперь посчитать среднее время до первого отказа — тот самый параметр MTTF (Mean Time To Failure), то мы получим, что он равен MTTF=1/ λ.

Все это замечательные свойства экспоненциального распределения. Почему мы выбрали в качестве для описания отказов именно его? Да потому что это наиболее простая модель — модель пуассоновского потока событий, которая уже была нами рассмотрена в статье про анализ конверсии сайта. Поэтому-то в теории надежности наиболее часто используется показательное (экспоненциальное) распределение, для которого, как мы выяснили:

надежность элементов можно оценить одним числом, т.к. λ=const; по известной λ довольно просто оценить остальные показатели надежности (например, ВБР для любого времени t); λ обладает хорошей наглядностью λ нетрудно измерить экспериментально Но это еще не все, потому, что для экспоненциального распределения особенно легко делать расчет систем, состоящих из множества элементов. Но об этом — в следующей статье (продолжение следует).