Розробка

Приклад розрахунку коефіцієнта готовності» для IT-системи


Завдання: в Технічному Завданні на комплексну IT-систему був пункт – «виконати розрахунок коефіцієнта готовності системи».

Рішення: використовувати матеріали з ГОСТ, запитати додаткові дані у вендорів по елементам устаткування і використовувати просту математику для виконання підсумкового розрахунку.

Нормативні посилання:

ГОСТ Р 27.002-2009 («Надійність в техніці (ССНТ). Терміни та визначення»)

ГОСТ Р 27.003-2011 Надійність в техніці (ССНТ). Управління надійністю. Керівництво за завданням технічних вимог до надійності

ГОСТ 27.002-89 Надійність в техніці (ССНТ). Основні поняття. Терміни та визначення

Згідно ГОСТ Р 27.002-2009 («Надійність в техніці (ССНТ). Терміни та визначення») коефіцієнт готовності (в галузі надійності техніки) — це ймовірність того, що виріб в даний момент часу знаходиться в працездатному стані, визначена згідно з проектом при заданих умовах функціонування та технічного обслуговування.

Таким чином, готовність відображає здатність системи безперервно виконувати свої функції.

У загальному випадку, для інформаційних і комп’ютерних пристроїв, коефіцієнт готовності – це ймовірність того, що комп’ютерна система в будь-який довільний) момент часу буде перебувати в робочому стані.

Коефіцієнт готовності (K) визначається за формулою:

K = MTBF/(MTBF+MTTR),

де:
— MTBF (Mean Time Between Failure) — середнє час напрацювання на відмову (середнє напрацювання між відмовами);
— MTTR (Mean Time To Repair) — середній час відновлення працездатності (середній час до відновлення).

На відміну від надійності, величина якої визначається лише значенням MTBF, готовність залежить ще й від часу, необхідного для повернення системи в робочий стан.

Отже, у нас є певна IT-система (сервера стійкового виконання, блейд-сервера, система зберігання даних).

Відмовостійкість на рівні обладнання такої IT-системи дозволяє її сервісів продовжити роботу в разі апаратної несправності окремих компонентів серверного обладнання, системи зберігання даних або інфраструктури.

Відмовостійкість функціонування внутрішніх компонентів IT-системи досягається застосуванням наступних технологій:

  • резервування блоків живлення серверного обладнання, систем зберігання даних;
  • резервування мережних адаптерів серверів;
  • резервування оптичних адаптерів серверів;
  • резервування ліній кабельних з’єднань комутації серверів і мережі передачі даних і мережі зберігання даних;
  • дублювання модулів блейд-шасі: блоки живлення, модулі управління, вентилятори, модулі комутації;
  • розміщення інформації на дискових системах зберігання даних із застосуванням відмовостійких груп дисків (RAID).

У підсумку, всі основні компоненти обладнання IT-системи – сервера, блоки живлення, дискові накопичувачі, мережеві адаптери, комутатори — мають резервування з можливістю гарячої заміни.

Електроживлення обладнання IT-системи здійснюється від двох незалежних джерел. Підключення обладнання IT-системи до зовнішніх мереж передачі даних і мереж зберігання даних також дублюється.

Всі підсистеми IT-системи мають резервування, тому при відмові будь-якого елемента обладнання IT-системи в цілому залишиться в працездатному стані. Більш того, заміна який відмовив елемента можлива без зупинки обладнання IT-системи.

Ймовірність (P) виходу одного компонента з ладу протягом одного року становить:
P = 1/MTBF.

Відмова дубльованого компонента призведе до відмови обладнання тільки за умови, що компонент-дублер теж вийде з ладу протягом часу, необхідного для «гарячої» заміни компонента, який відмовив першим. Якщо гарантоване час заміни компонента становить 24 години (1/365 року) (що відповідає сформованій практиці обслуговування серверного обладнання), то ймовірність такого події протягом року:

Обчисливши ймовірність відмови всіх N компонентів обладнання IT-системи, можна розрахувати імовірність відмови обладнання IT-системи протягом одного року шляхом підсумовування кожної ймовірності відмови:

Так як відмови компонентів зазвичай розподілені в часі рівномірно, то, знаючи імовірність відмови обладнання IT-системи протягом року, можна визначити час його напрацювання на відмову:
MTBFs = 1/Ps.

Коефіцієнт готовності обладнання IT-системи буде дорівнює:
Kit = MTBFs/(MTBFs+MTTR).

Виконаємо розрахунок коефіцієнта готовності обладнання IT-системи з 26 компонентів (кожен з компонентів має декілька елементів).

Основна проблема в таблиці нижче – актуальні дані по параметру MTBF для кожного компонента. Ці дані дуже неохоче надають вендори. Часто доводиться вступати в листування з представниками вендорів для прохання надання та уточнення цих даних.

У таблиці нижче виконаний розрахунок для «застарілою» IT-системи, але зараз вона функціонує вже майже п’ятий рік у бойовому режимі без відмови компонентів, але вже Замовник планує міграцію на нові компоненти не чекаючи крайній термінів з підсумкових розрахункових даних.




(*) – вихідні дані за MTBF є оціночними, наданими за даними позиціями обладнання виробника або їх аналогів.

У підсумку розрахункові дані по устаткуванню нашої системи:

  • імовірність відмови обладнання системи протягом року: 0,0966;
  • MTBF обладнання системи (років): 10,35 (90666 годин);
  • середній час усунення несправності (годин): 24;
  • коефіцієнт готовності обладнання системи (%): 99,97;
  • середній час простою на рік (годин):2,61 (156 хвилин).

За підсумковими рядками з таблиці можна побачити, що у нас є не дубльовані елементи СГД і цей момент дуже сильно впливає на розрахункові дані. По можливості потрібно дублювати ці елементи (як рекомендація) або використовувати іншу компонування СГД.

Цей розрахунок, звичайно, дуже оцінний. Але основне розуміння, що система оптимальна або має потребу в додаткових елементах, може надати.

За фактом дані таблиці з розрахунками заносяться в потрібний розділ проектної документації і видаються Замовнику.

Цікаво виконати такий розрахунок для комплекти мережевого обладнання (з максимальним розбиттям на елементи до SFP-модуля і блоків живлення) і порівняти з різними вендорами підсумкові дані.

Related Articles

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Close