SRE практики и инструменты: решение проблемы надежности и доступности сервисов
Рассрочка
Рассрочка

SRE практики и инструменты

Научим как ориентироваться в SRE и разъяснить их принципы коллегам. И расскажем как выстраивать SRE-процессы

Длительность обучения:

5 месяцев

4 ак. часа в нед.

Что даст вам этот курс

Ваша система дорогая в обслуживании, плохо поддерживается и не отличается стабильностью? Возможно пришло время начать использовать новый подход. 

Site Reliability Engineering - это подход к организации эксплуатации информационных систем.   

SRE подход переосмысливает задачи, которые исторически выполнялись операторами и системными администраторами, часто вручную, и передает их операционным группам, которые используют программное обеспечение и автоматизацию для решения проблем эксплуатации и управления системами.  

SRE решает задачу управления надежностью используя набор техник: принятие решений на основе данных о состоянии системы,  работа с инцидентами и усовершенствованные регламенты, работа со стейкхолдерами и управление ожиданиями и конечно же  разумная автоматизация происходящего.
  
SRE - это прежде всего практики создания масштабируемых и высоконадежных программных систем. SRE помогает управлять большими системами с помощью подхода "инфраструктура как код (IaC)", который является масштабируемым, самодокументируемым и воспроизводимым, позволяющим управлять тысячами взаимосвязанных частей силами нескольких специалистов.

Курс подойдет для:
- Системных инженеров, администраторов и операторов, в задачи которых входит обеспечение надежности и доступности  
- Разработчиков, которые хотят понять что происходит в production окружениях
- Инфраструктурных и платформенных инженеров, которые предоставляют свои сервисы другим командам  
- Технических директоров, руководителей и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты

На курсе вы узнаете:

- Что такое SRE и какие существуют на сегодня SRE-практики  
- Как внедрить SRE практики в своей организации  
- Как управлять надежностью, доступностью и эффективностью сервисов  
- Управлять изменениями  
- Осуществлять мониторинг и улучшать наблюдаемость системы  
- Реагировать на инциденты и проблемы с производительностью

Курс проходит в формате интерактивных лекций. Мы верим, что расширение технического кругозора важно для работы в эксплуатации.

Практические домашние задания для закрепления теории выполняются  на базе следующего технологического стека: Linux, Kubernetes, Ansible, Terraform, Prometheus, Python.

Необходимые знания


- Опыт из разработки, тестирования или эксплуатации
- Будет плюсом один из пройденных курсов по разработке в ОТУС
- Будет плюсом пройденные курсы по DevOps практикам и инструментам и Linux

Корпоративное обучение для ваших сотрудников

>

Программа обучения

В процессе обучения вы получите комплексные знания и навыки.
Тема 1. Введение в SRE // ДЗ
Тема 2. GIT 101: совместная работа, CI, вендоринг
Тема 3. Основные принципы SRE // ДЗ
Тема 4. Практика управление конфигурацией. Ansible // ДЗ
Тема 5. Практика управление конфигурацией. Terraform // ДЗ
Тема 6. Linux 101: cgroups/namespaces/network/containers
Тема 7. Экосистема Kubernetes
Тема 8. Практика управление конфигурацией. Helm
Тема 9. QA-сессия
Тема 10. SLI, SLA, SLO и управление рисками // ДЗ
Тема 11. Автоматизация: Low-Code/No-Code
Тема 12. Автоматизация: CLI, Data transformation // ДЗ
Тема 13. Aвтоматизация: Runbook Automation (Jenkins/AWX/Rundeck) // ДЗ
Тема 14. Задачи мониторинга и алертинга
Тема 15. Observability
Тема 16. QA-сессия
Тема 17. Непрерывная поставка и управление изменениями // ДЗ
Тема 18. Управление релизами // ДЗ
Тема 19. Тестирование надежности систем // ДЗ
Тема 20. Управление нагрузкой предотвращения перегрузок и сбоев // ДЗ
Тема 21. Практика on-call и жизненный цикл SRE команды
Тема 22. Практика постмортемов
Тема 23. Практика диагностики и решения проблем
Тема 24. Customer Reliability Engineering
Тема 25. Как подсветить навыки в резюме. Шаблон резюме
Тема 26. Этапы собеседования: чего ждать? Live-собеседование с поведенческими вопросами
Тема 27. QA-сессия
Тема 28. Dashboard as a Code
Тема 29. Выбор темы и организация проектной работы
Тема 30. Консультация по проектам и домашним заданиям - промежуточная приемка
Тема 31. Защита проектных работ
Скачать подробную программу

Выпускной проект

Заключительный месяц курса посвящен проектной работе. Свой проект - это использование SRE практик и инструментов, которые были интересны слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе работы по проекту можно получить консультации преподавателей.

Примеры тем проекта:
- Повышение надежности своего сервиса
- Вывод сервиса в production окружение
- Покрытие мониторингом своего сервиса
- Создание процесса управления инцидентами и on-call
- Тестирование надежности своего сервиса

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в слаке курса, сдача домашних работ и получение обратной связи от преподавателя.
Вебинары идут дважды в неделю по 2 академических часа. Все вебинары сохраняются и в записи в вашем личном кабинете.
Выполнение домашнего задания занимает 3-5 часов.
Курс длится 5 месяцев, а финальный отводится для выполнения проектной работы, досдачи домашних заданий и вопросов преподавателям. Выполнение проектной работы помогает усвоению практических навыков, а тема проекта отдельно выносится в сертификат.

Получить консультацию

Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы

- Сможете ориентироваться в SRE-практиках и инструментах
- Поймете как выстраивать SRE-процессы в контексте взаимодействия с другими отделами компании
- Сможете применять полученные знания в своей ежедневной работе, улучшая жизнь себе, коллегам, проекту и компании
- Заберете с собой learn-материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач)
- Получите сертификат о прохождении курса
- Получите приглашение пройти собеседование в компаниях-партнерах (эту возможность получают самые успешные студенты).
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Зам. директора департамента образования
ООО “Отус Онлайн-Образование”
Вдовиченко М.M.

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Зам. директора департамента образования
ООО “Отус Онлайн-Образование”
Вдовиченко М.M.

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

Прошедшие открытые вебинары

Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Варианты отказоустойчивой архитектуры
День открытых дверей
25 января 2022 года в 20:00
Оставьте заявку, чтобы получить доступ к записям прошедших мероприятий. Записи всех мероприятий появятся в этом блоке

Партнеры ждут выпускников этого курса