Из ленты Habr DevOps — кратко, чтобы не потерять.
Это вторая часть разбора того, как мы выстраивали SLA и инцидент-менеджмент в большом продукте. В этой части речь пойдёт о следующем этапе — масштабировании и удешевлении. О том, что происходит, когда SLA считается корректно, цифрам уже доверяют, но компания продолжает развиваться. У неё кратно растёт количество разработчиков, архитектура усложняется и количество сбоев тоже растёт. Инциденты и сбои это наши обиходные синонимы и по ITIL это не одно и тоже, уж простите. С ростом ограничением становится не математика и перегибы полиномов высоких порядков, а люди, ручной труд, коммуникации и скорость реакции. О том, что со всем этим делать и поговорим. Читать далее
Полный текст и контекст у первоисточника: https://habr.com/ru/companies/X5Tech/articles/1038776/?utm_campaign=1038776&utm_source=habrahabr&utm_medium=rss