Специальная цена

MLOps

Покажем на практике как деплоить модели в production

30 августа 2023

5 месяцев

Онлайн

Пн/Ср 20:00 Мск

Для кого этот курс?

MLOps — это не человек, а набор практик, которым должны обладать различные специалисты. Поэтому знание MLOps для каждой роли открывает свои возможности в команде.

  • Для Data Scientist-ов: если вы уже умеете создавать модели, то научитесь деплоить их в прод.
  • Для ML Engineer-ов: сможете унифицировать управление несколькими моделями.
  • Для Data Engineer-ов: вам откроется остальная часть data-driven конвейеров: валидация, обучение, вывод ML моделей в прод и мониторинг.
  • Для Data Analytic-ов: сможете выйти за рамки графиков и дашбордов и запустить свои модели в онлайне.
  • Для Softwear Engineer-ов: будете понимать, что нужно делать, если на вашем продукте планируют внедрять ML.

Необходимые знания

Для обучения вам понадобятся базовые навыки работы с данными. Предлагаем посмотреть Карту курсов направления Data Science в OTUS, чтобы сориентироваться в необходимом уровне подготовки.

Мы ожидаем, что наши студенты уже владеют знаниями разработки на Python и ML. Цель нашего курса повысить квалификацию уже практикующих инженеров.

Программирование:


  • опыт разработки на python;
  • построение веб-сервисов на python.

ML:


  • понимание терминологии машинного обучения;
  • опыт использования python для решения задач ML.

Технологии:


  • Linux;
  • Git.
При поддержке
логотип партнера

Что вам даст этот курс?

Данный курс даст вам понимание того, как устроен процесс внедрения ML-решения от идеи до вывода его в прод. Преподаватели поделятся лучшими практиками и инструментами MLOps, которые устоялись в современной индустрии.

Примеры практических задач, рассматриваемых на курсе:

  • Как правильно организовать хранение исходников
  • Где и как хранить данные
  • Как сделать CI/CD
  • Как регулярно обновлять данные и переобучать модели
  • Как управлять инфраструктурой в облаках
  • Как упаковывать ML модели в микросервисы
  • Как разворачивать k8s
  • Как настраивать мониторинг и алертинг

Инструменты, которые используются на курсе: Яндекс клауд, Git hub, S3, Spark, Kafka, Airflow, DVC, ML Flow, Docker, K8s, Prometheus, Grafana и другие.

Каждый модуль вы будете закреплять на практике, выполняя домашнее задание. В конце обучения вас ждет финальный проект, который позволит обобщить все полученные знания и пополнить портфолио. Он может быть выполнен в рамках рабочих задач на вашем датасете или быть учебным проектом, основанным на данных, предоставляемых OTUS.

Почему стоить освоить?


Один из главных трендов в современном мире - автоматизация процессов обучения и валидации, которая, в некотором роде обесценивает работу классического Data Scientist. Все движется к тому, что даже неспециалист сможет сделать fit-predict. Поэтому уже сейчас в цене те, кто обладает инженерными навыки.

Процесс обучения

Всё обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в чате курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары идут дважды в неделю по 2 академических часа (то есть астрономических 1,5 часа). Все вебинары сохраняются и в записи в вашем личном кабинете. Домашнее задание выдается в среднем по 1 на модуль.

Воркшопы


Практические вебинары, где 80% времени вы будете решать задачи

Эксперты


Преподаватели из разных сфер, каждый со своим уникальным опытом.

Практика в Yandex Cloud


Партнер курса предоставит ресурсы, чтобы вы могли разворачивать настоящие кластера в облаке

Партнеры

Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности. Мы оказываем помощь в вопросах карьеры на протяжении всего обучения и спустя полгода после его завершения.

  • Получите помощь с оформлением резюме, портфолио и сопроводительного письма
  • Пройдете карьерную консультацию с нашим HR-специалистом
  • Получите рекомендации, как искать работу, и советы по прохождению собеседования

ML engineer

Перспективы направления
Средний уровень зарплат в Москве:
60 000Junior+ специалист
160 000Middle+ специалист
325 000Senior специалист
446
актуальных вакансий

Работодатели курса

Формат обучения

Интерактивные вебинары


2 занятия по 2 ак.часа в неделю
Доступ к записям и материалам остается навсегда

Обратная связь


Развернутый фидбэк по домашним заданиям от преподавателей

Активное комьюнити


Общайтесь с преподавателями голосом на вебинарах и в закрытой Telegram группе.

Программа

Процессы

С чего следует начинать любой проект по ML? Конечно с целей и метрик, а также с организации процессов взаимодействия в команде. Как организовать хранение кода, как вести задачи и много другое будет обсуждено в рамках этого модуля.

Тема 1: Вводное занятие

Тема 2: Цели и метрики ML проектов

Тема 3: Организация исходного кода

Тема 4: Взаимодействие с командой

Тема 5: Практика. Формирование процессов команды

Инфраструктура

В этом модуле мы начнем возводить кирпичики нашей системы с инфраструктурных блоков. Мы узнаем какие блоки стоит выделить, где хранить данных. Как автоматизировать периодические операции. Как эффективно и безопасно использовать облачные сервисы.

Тема 1: Базовые блоки инфраструктуры

Тема 2: Облачные провайдеры

Тема 3: Собственная инфраструктура

Тема 4: Изменение кода и CI/CD

Тема 5: Биллинг и Identity and Access Management

Тема 6: Практика. Настройка облачной инфраструктуры

Подготовка данных

Все начинается с данных. Их нужно собрать, сохранить, проанализировать, провести очистку и заполнение пропусков, извлечь признаки и внимательно следить за качеством данных и их версионированием. В этом модуле мы рассмотрим все эти темы.

Тема 1: Выбор хранилища. HDFS/S3/DataBase/etc

Тема 2: Сбор данных на потоке. Kafka

Тема 3: Сбор данных по расписанию. AirFlow

Тема 4: Валидация данных

Тема 5: Обнаружение сдвигов в данных

Тема 6: Подготовка и обогащение данных

Тема 7: Извлечение признаков

Тема 8: Версионирование данных. DVC

Тема 9: Практика. Конвейер подготовки данных

Моделирование

Наконец мы добрались до обучение моделей и самое время обсудить как сделать это обучение воспроизводимым. Как проводить обучение моделей в распределенной среде. Как хранить и версионировать артефакты с моделями.

Тема 1: Воспроизводимость и версионирование. MLFlow

Тема 2: Перенос ML алгоритмов в распределенную среду

Тема 3: Популярные фреймворки в распределенной среде

Тема 4: Подбор гиперпараметров и AutoML

Тема 5: Практика. Регулярное переобучение

Валидация

Перед запуском модели в production, её следует внимательно провалидировать и изучить. В этом модуле мы обсудим какие есть стратегии валидации, как проводить анализ моделей и интерпретировать их результаты. Как показать влияние модели на бизнес-метрики с помощью A/B тестирования.

Тема 1: Стратегии валидации моделей

Тема 2: Анализ моделей

Тема 3: Интерпретируемость

Тема 4: A/B-тестирование

Тема 5: Практика. Автоматическая валидация

Развертывание

Модель готова и проанализирована. Пришло время катить её в production. Какие есть стратегии инференса, какие инструменты помогут автоматизировать выкатку в production. Как подготовить веб-сервис с моделью и запустить его в k8s.

Тема 1: Пакетный режим работы

Тема 2: Асинхронный потоковый режим

Тема 3: Модель как сервис

Тема 4: Подготовка артефактов

Тема 5: Развертывание в k8s

Тема 6: Обновление моделей

Мониторинг

Модель работает в production, но как мы будем за ней следить. Как собирать и визуализировать метрики. Как узнавать о проблемах раньше всех и заранее вносить исправления.

Тема 1: Инструменты и метрики. Prometheus

Тема 2: Поиск отклонений и сдвигов в данных

Тема 3: Построение обратной петли

Тема 4: Алертинг

Проектная работа

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Выбор темы и организация проектной работы

Тема 2: Консультация по проектам и домашним заданиям

Тема 3: Защита проектных работ

Бонусные материалы

Тема 1: Что лежит в основе ChatGPT? (Бонус)

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Выпускной проект


Выпускной проект даст возможность закрепить навыки, наработанные в процессе обучения. Вам на выбор будет предоставлено 2 варианта:

  • взять свою задачу и свои данные;
  • разработать и развернуть на Spark рекомендательную систему.

Прошедшие
мероприятия

Открытый вебинар
ML System Design интервью // Демо-занятие курса «MLOps»
Открытый вебинар
DataFrame API: от Dask к PySpark
Для доступа ко всем прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Корпоративное обучение для ваших сотрудников

Отус помогает развивать высокотехнологичные Команды. Почему нам удаётся это делать успешно:
  • Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
  • Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
  • OTUS проверяет знания студентов перед стартом обучения и после его завершения
  • Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
  • Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
  • OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год

Сертификат о прохождении курса

OTUS осуществляет лицензированную образовательную деятельность.
В конце обучения вы получите сертификат OTUS о прохождении курса

После обучения:


  • Получите полноценный MLOps проект, который сможете разместить в портфолио
  • Получите материалы по всем занятиям (видеозаписи занятий, презентации, примеры кодов)
  • Получите сертификат об окончании курса

Частые вопросы

Что, если в середине курса я не смогу продолжать обучение?
У вас есть право одного бесплатного трансфера в другую группу
Обязательно ли защищать выпускной проект?
Для получения сертификата OTUS необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем.
С какого момента я смогу заниматься трудоустройством?
Получить карьерную консультацию вы сможете уже в начале обучения. Остальные опции: помощь с резюме, добавление резюме в нашу базу специалистов и т.д. будут доступны после окончания обучения.
Я могу вернуть деньги?
Да, вы можете сделать возврат средств пропорционально оставшимся месяцам обучения.