Observability: мониторинг, логирование, трейсинг

Best Practice по мониторингу инфраструктуры и отдельных её компонентов: приложения, баз данных, etc.

Для кого этот курс?

Вам подойдет курс, если вы Администратор Linux, DevOps-инженер, разработчик и вам необходимо настроить мониторинг, логирование и трейсинг с помощью Prometheus, Grafana, ELK, Tempo.

Что даст вам этот курс?

Никакого хаоса и бессвязных метрик. После курса вы сможете правильно строить системы мониторинга и логирования, что позволит более точно понимать текущее состояние всех систем и быстрее реагировать на инциденты.

Вы научитесь:

  • строить сложные эффективные системы мониторинга и логирования инфраструктуры и приложений
  • следить за работой большого количества серверов и работать в связке c Prometheus, Grafana, ELK, etc.
  • обеспечивать визуализацию метрик и настраивать оповещения о критически важных событиях
Вы рассмотрите следующий стек технологий и инструментов: Prometheus, AlertManager, Grafana,  Thanos, VictoriaMetrics, Kube-prometheus-stack, ELK, EFK, Graylog2, Beats, Apache Kafka, Kibana, Loki, Tempo(Jaeger), Vector, Logstash

Процесс обучения

Всё обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Слаке курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары идут дважды в неделю по 1,5 часа. Все вебинары сохраняются и в записи в вашем личном кабинете.

Best Practice


Эксперты-практики поделятся своим уникальным успешным опытом и разберут с вами рабочие кейсы

Необходимые знания


Знание ОС Linux на уровне администратора

Помощь с трудоустройством


Комплексная система, которая поможет получить выгодные офферы в перспективных проектах

Партнеры

  • Получите помощь с оформлением резюме, портфолио и сопроводительного письма
  • Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
  • Пройдете карьерную консультацию с нашим HR-специалистом
  • Получите рекомендации, как искать работу, и советы по прохождению собеседования

DevOps / System Engineer

Перспективы направления
Средний уровень зарплат в Москве:
150 000Middle+ специалист
240 000Senior специалист
1072
актуальные вакансии
Формат обучения

Интерактивные вебинары

Два занятия по два академических часа в неделю. Доступ к записям и материалам остается навсегда

Проектная работа


Вы закрепите полученные знания проектной работой и сможете уверенно чувствовать себя на собеседованиях

Активное комьюнити


Общайтесь с преподавателями голосом на вебинарах и в Slack группы

Программа

Observability - и что он включает

Введение в мониторинг и алертинг.

Тема 1: Задачи мониторинга, логирования, трейсинга

GAP-stack (Grafana, Prometheus, Alertmanager)

Рассмотрим основу Gap-стека. Поговорим об устройстве и принципах работы Prometheus, о том как он собирает метрики и хранит их. Разберем основы работы с PromQl. Рассмотрим Alertmanager, обсудим его устройство и то как он работает с алертами.

Тема 1: Prometheus - как новый виток развития систем мониторинга // ДЗ

Тема 2: Prometheus - Exporters, Service Discovery

Тема 3: Отказоустойчивость Prometheus, хранилища метрик для Prometheus (VictoriaMetrics, Thanos, Grafama Mimir, etc.) // ДЗ

Тема 4: Prometheus, Alertmanager - работа с метриками (PromQL), написание алертов и их ротация // ДЗ

Тема 5: Grafana - основной инструмент визуализациии данных

Тема 6: Grafana - продвинутое использование // ДЗ

Тема 7: Kube-prometheus-stack - мониторинг Kubernetes при помощи Prometheus operator

Тема 8: Q&A сессия по разбору домашних заданий

Zabbix

Тема 1: Установка и конфигурация

Тема 2: Мониторинг порталов и баз данных

Тема 3: Настройка алертинга // ДЗ

Тема 4: Discovery Trapper

Тема 5: Графики и комплексные экраны

Логирование

В данном модуле: - сравним популярные стеки для логирования (EFK, ELK, Loki, Graylog), разберемся чем они отличаются; - подробно рассмотрим компоненты стеков по отдельности.

Тема 1: Классическое логирование в Linux

Тема 2: Централизованные системы логирования

Тема 3: Elasticksearch, Logstash, Kibana // ДЗ

Тема 4: Beats - инструменты доставки данных // ДЗ

Тема 5: Logstash

Тема 6: Vector как альтернатива Logstash // ДЗ

Тема 7: Q&A сессия по разбору домашних заданий

Тема 8: Apache Kafka в логировании

Тема 9: Kibana как инструмент визуализации логов

Тема 10: Grafana Loki - управление логами и доставка // ДЗ

Тема 11: Tempo(Jaeger) - построение систем распределенного трейсинга

Итоговый проект

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Консультация по проектам и домашним заданиям

Тема 2: Итоговый проект

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Выпускной проект


В рамках выпускного проекта вам предстоит применить все полученные знания на практике. Вы самостоятельно развернете инфраструктуру состоящую из нескольких ВМ и сервисов развернутых на них. Далее вы настроите систему мониторинга, алертинга, логирования.

Прошедшие
мероприятия

Открытый вебинар
Grafana - основной инструмент визуализациии данных
Открытый вебинар
Стратегии сбора метрик мониторинга ИТ-инфраструктуры
Оставьте заявку, чтобы получить доступ ко всем записям прошедших мероприятий. Записи всех мероприятий появятся в этом блоке

Корпоративное обучение для ваших сотрудников

Отус помогает развивать высокотехнологичные Команды. Почему нам удаётся это делать успешно:
  • Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
  • Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
  • OTUS проверяет знания студентов перед стартом обучения и после его завершения
  • Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
  • Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
  • OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год

Сертификат о прохождении курса

OTUS осуществляет лицензированную образовательную деятельность.
В конце обучения вы получите сертификат OTUS о прохождении курса

После обучения:

  • заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач), получите сертификат о прохождении курса
  • разовьете практические навыки в решении задач мониторинга и построите собственную систему мониторинга
  • получите глубокое представление о Prometheus, Grafana, ELK
  • обеспечите визуализацию метрик и настроите оповещения о критически важных событиях

Частые вопросы

Что если в середине курса я не смогу продолжать обучение?
У вас есть право одного бесплатного трансфера в другую группу.
Обязательно ли защищать проектную работу?
Для получения сертификата OTUS необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем.
С какого момента я могу заниматься трудоустройством?
Получить карьерную консультацию вы сможете уже в начале обучения. Остальные опции: помощь с резюме, добавление резюме в нашу базу специалистов и т.д. становятся доступны после выпуска.
Я могу вернуть деньги?
Да, вы можете сделать возврат средств пропорционально оставшимся месяцам обучения.