Reinforcement Learning

Обучение с подкреплением

Научим внедрять RL-алгоритмы на практике в играх, робототехнике, энергетике и финансах

Длительность обучения:

3 месяца

4 ак. часа в нед.

Что даст вам этот курс

Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем.

Для кого этот курс?

DS/ML/DL специалисты, которые хотят углубить знания в области обучения с подкреплением и получить практический опыт;
Разработчики с базовыми навыками Python и ML, которые хотят получить опыт работы с рекомендательными системами;
Выпускники курсов по машинному обучению

После обучения вы:

Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
Изучите такие алгоритмы, как Deep Q-Network (DQN), Policy Gradient (PG), Actor-Critic, и сможете реализовать их в своих проектах
Познакомитесь с продвинутыми темами в Reinforcement Learning, такими как оптимальное управление, методы обучения со скользящим горизонтом, Model-based RL
Научитесь применять RL для решения конкретных задач и понимать, как это применение работает на практике.

Особенности курса

Особенностью курса является его фокус на практических примерах и проектной работе. Студенты получат необходимые знания для реализации RL алгоритмов в своих собственных проектах и приложениях.

- базовое знакомство с Python;
- базовые знания линейной алгебры (матрицы, векторы, градиентный спуск);
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия).

Корпоративное обучение для ваших сотрудников

Поможем вашей компании развивать команду! Профиты данного курса для компании: Подробное изучение самых популярных баз данных с возможностью сосредоточиться на тех, которые используются в компании / Оптимизированные стабильные системы / Работа над промышленными задачами во время практики

Подробнее

Программа обучения

В процессе обучения вы получите комплексные знания и навыки.

Модуль 1 Введение в Reinforcement Learning

Тема 1. Знакомство с Reinforcement Learning

Тема 2. Ключевые понятия RL: агент, среда, награда, политика

Тема 3. Основные алгоритмы RL: Q-learning, SARSA, Monte Carlo

Тема 4. Построение модели среды и агента

Тема 5. Обучение на простых игровых сценариях

Модуль 2 Deep Reinforcement Learning

Тема 6. Введение в Deep Reinforcement Learning

Тема 7. Deep Q-Network (DQN) алгоритм

Тема 8. Policy Gradient (PG) алгоритм

Тема 9. Actor-Critic алгоритм

Тема 10. Использование нейронных сетей для аппроксимации функции награды и политики

Модуль 3 Продвинутые темы Reinforcement Learning

Тема 11. Оптимальное управление

Тема 12. Методы обучения со скользящим горизонтом

Тема 13. Model-based RL

Модуль 4 Применение RL в реальных задачах

Тема 14. Применение RL в игровой индустрии

Тема 15. Применение RL в робототехнике

Тема 16. Применение RL в управлении энергетическими системами

Тема 17. Применение RL в управлении финансовым портфелем

Модуль 5 Проектная работа

Тема 18. Выбор темы и организация проектной работы

Тема 19. Консультация по проектам и домашним заданиям

Тема 20. Защита проектных работ. Подведение итогов курса

Скачать подробную программу

Выпускной проект

Последний месяц отводится для проектной работы. Студенты могут выбрать одну из сфер, где будут реальзовывать алгоритмы обучения с подкреплением: игровая индустрия, робототехника, управление энергетическими системами, управление финасовым порфелем.

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя.

Вас ждут:

Интерактивные вебинары
Два занятия по два академических часа в неделю

Практика
Интересные домашние задания с обратной связью от преподавателя и выпускной проект, который станет частью портфолио

Активное комьюнити
Общайтесь с преподавателями голосом на вебинарах и в чате Telegram

Получить консультацию

Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.

После обучения вы

заберете с собой полный комплект обучающих материалов: видеозаписи всех вебинаров, презентации к занятиям и другие дополнительные материалы;

получите сертификат о прохождении курса;

пополните свое портфолио новыми работами для будущего работодателя;

получите все необходимые навыки для работы с алгоритмами обучения с подкреплением;

Ваш сертификат

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Reinforcement Learning»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Зам. директора департамента образования
ООО “Отус Онлайн-Образование”
Вдовиченко М.M.

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.