Error Budget: зачем продукту бюджет ошибок? | «В SREду на кухне» | AvitoTech
Что такое Error Budget и почему без него нельзя развивать продукт? Разбираем, как считать бюджет ошибок, балансировать релизы и стабильность, и почему 100% надёжности — опасная иллюзия. Практика SRE из AvitoTech. Подписывайтесь в наш тг-канал: https://clc.to/0vdwJw Ведущие Александр Глухих, TeamLead IPM в Авито Михаил Савин, SRE Community Lead в Авито Егор Щапов, TCL Quality в Авито Гость Кирилл Борисов, TeamLead Incident Managment в VK 00:00 Интро 01:20 Простое объяснение: «кредит доверия» для системы 02:44 Конфликт бизнеса и инженеров 04:03 Философия и инструменты бюджета ошибок 06:10 Как объяснить Error Budget бизнесу 08:32 Можно ли жить без бюджета ошибок 10:04 Почему 100% надёжности — миф 11:29 Резервы и отказоустойчивость 12:18 Неожиданные факторы: магнитные бури и сбои 13:13 Почему идеальная надёжность невозможна 13:53 Чем опасны «идеальные» системы 15:28 Баланс: скорость релизов vs стабильность 16:58 Конкуренция и допустимый уровень ошибок 18:49 Error Budget как инструмент риск-менеджмента 22:35 Бюджет ошибок = инвестиция в развитие 24:54 Сколько стоит каждая «девятка» 25:27 Как считать бюджет ошибок 26:23 Метрики: не только аптайм 28:18 Почему бюджет всегда динамический 30:05 Техническая vs пользовательская надёжность 32:21 Контроль «сгорания» бюджета 35:08 Что считать ошибкой 36:31 Ошибка ≠ инцидент 37:12 Массовость и влияние на бизнес 37:50 Реальные кейсы инцидентов 38:24 Немного про «карму» и хаос 38:57 Автоматизация и Quality Gates 40:02 Когда Error Budget бесполезен 40:38 Плюсы «зелёного» бюджета 41:38 Баланс: качество, скорость, деньги 42:58 Метрики и упрощение расчётов 43:58 Итоги AvitoTech — это команда инженеров Авито. Подпишитесь на наш канал, соцсети и блоги, чтобы узнавать больше о технологиях Авито 👇🏻 ВК: https://clc.to/pFXRXg Телеграм: https://clc.to/ZVuXEA Хабр: https://clc.to/MTRSUg Гитхаб: https://clc.to/s6ut5g RuTube: https://clc.to/pnX9mg Дзен: https://clc.to/wpRodA Сайт: https://clc.to/Ipk61w
Что такое Error Budget и почему без него нельзя развивать продукт? Разбираем, как считать бюджет ошибок, балансировать релизы и стабильность, и почему 100% надёжности — опасная иллюзия. Практика SRE из AvitoTech. Подписывайтесь в наш тг-канал: https://clc.to/0vdwJw Ведущие Александр Глухих, TeamLead IPM в Авито Михаил Савин, SRE Community Lead в Авито Егор Щапов, TCL Quality в Авито Гость Кирилл Борисов, TeamLead Incident Managment в VK 00:00 Интро 01:20 Простое объяснение: «кредит доверия» для системы 02:44 Конфликт бизнеса и инженеров 04:03 Философия и инструменты бюджета ошибок 06:10 Как объяснить Error Budget бизнесу 08:32 Можно ли жить без бюджета ошибок 10:04 Почему 100% надёжности — миф 11:29 Резервы и отказоустойчивость 12:18 Неожиданные факторы: магнитные бури и сбои 13:13 Почему идеальная надёжность невозможна 13:53 Чем опасны «идеальные» системы 15:28 Баланс: скорость релизов vs стабильность 16:58 Конкуренция и допустимый уровень ошибок 18:49 Error Budget как инструмент риск-менеджмента 22:35 Бюджет ошибок = инвестиция в развитие 24:54 Сколько стоит каждая «девятка» 25:27 Как считать бюджет ошибок 26:23 Метрики: не только аптайм 28:18 Почему бюджет всегда динамический 30:05 Техническая vs пользовательская надёжность 32:21 Контроль «сгорания» бюджета 35:08 Что считать ошибкой 36:31 Ошибка ≠ инцидент 37:12 Массовость и влияние на бизнес 37:50 Реальные кейсы инцидентов 38:24 Немного про «карму» и хаос 38:57 Автоматизация и Quality Gates 40:02 Когда Error Budget бесполезен 40:38 Плюсы «зелёного» бюджета 41:38 Баланс: качество, скорость, деньги 42:58 Метрики и упрощение расчётов 43:58 Итоги AvitoTech — это команда инженеров Авито. Подпишитесь на наш канал, соцсети и блоги, чтобы узнавать больше о технологиях Авито 👇🏻 ВК: https://clc.to/pFXRXg Телеграм: https://clc.to/ZVuXEA Хабр: https://clc.to/MTRSUg Гитхаб: https://clc.to/s6ut5g RuTube: https://clc.to/pnX9mg Дзен: https://clc.to/wpRodA Сайт: https://clc.to/Ipk61w
