Reinforcement Learning

Reinforcement Learning

Обучение с подкреплением
Научим внедрять RL-алгоритмы на практике в играх, робототехнике, энергетике и финансах

Длительность обучения:

3 месяца

4 ак. часа в нед.

Что даст вам этот курс

Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем.


Для кого этот курс?


  • DS/ML/DL специалисты, которые хотят углубить знания в области обучения с подкреплением и получить практический опыт;
  • Разработчики с базовыми навыками Python и ML, которые хотят получить опыт работы с рекомендательными системами;
  • Выпускники курсов по машинному обучению

После обучения вы:

  • Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
  • Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
  • Изучите такие алгоритмы, как Deep Q-Network (DQN), Policy Gradient (PG), Actor-Critic, и сможете реализовать их в своих проектах
  • Познакомитесь с продвинутыми темами в Reinforcement Learning, такими как оптимальное управление, методы обучения со скользящим горизонтом, Model-based RL
  • Научитесь применять RL для решения конкретных задач и понимать, как это применение работает на практике.

Особенности курса

Особенностью курса является его фокус на практических примерах и проектной работе. Студенты получат необходимые знания для реализации RL алгоритмов в своих собственных проектах и приложениях.

Необходимые знания

- базовое знакомство с Python;
- базовые знания линейной алгебры (матрицы, векторы, градиентный спуск);
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия).

Корпоративное обучение для ваших сотрудников

Поможем вашей компании развивать команду! Профиты данного курса для компании: Подробное изучение самых популярных баз данных с возможностью сосредоточиться на тех, которые используются в компании / Оптимизированные стабильные системы / Работа над промышленными задачами во время практики
>

Программа обучения

В процессе обучения вы получите комплексные знания и навыки.
Тема 1. Знакомство с Reinforcement Learning
Тема 2. Ключевые понятия RL: агент, среда, награда, политика
Тема 3. Основные алгоритмы RL: Q-learning, SARSA, Monte Carlo
Тема 4. Построение модели среды и агента
Тема 5. Обучение на простых игровых сценариях
Тема 6. Введение в Deep Reinforcement Learning
Тема 7. Deep Q-Network (DQN) алгоритм
Тема 8. Policy Gradient (PG) алгоритм
Тема 9. Actor-Critic алгоритм
Тема 10. Использование нейронных сетей для аппроксимации функции награды и политики
Тема 11. Оптимальное управление
Тема 12. Методы обучения со скользящим горизонтом
Тема 13. Model-based RL
Тема 14. Применение RL в игровой индустрии
Тема 15. Применение RL в робототехнике
Тема 16. Применение RL в управлении энергетическими системами
Тема 17. Применение RL в управлении финансовым портфелем
Тема 18. Выбор темы и организация проектной работы
Тема 19. Консультация по проектам и домашним заданиям
Тема 20. Защита проектных работ. Подведение итогов курса
Скачать подробную программу

Выпускной проект

Последний месяц отводится для проектной работы. Студенты могут выбрать одну из сфер, где будут реальзовывать алгоритмы обучения с подкреплением: игровая индустрия, робототехника, управление энергетическими системами, управление финасовым порфелем.

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя.


Вас ждут:

Интерактивные вебинары
Два занятия по два академических часа в неделю

Практика
Интересные домашние задания с обратной связью от преподавателя и выпускной проект, который станет частью портфолио

Активное комьюнити
Общайтесь с преподавателями голосом на вебинарах и в чате Telegram

Получить консультацию

Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы

  • заберете с собой полный комплект обучающих материалов: видеозаписи всех вебинаров, презентации к занятиям и другие дополнительные материалы;

  • получите сертификат о прохождении курса;

  • пополните свое портфолио новыми работами для будущего работодателя;

  • получите все необходимые навыки для работы с алгоритмами обучения с подкреплением;
  • Ваш сертификат

    онлайн-образование

    Сертификат №0001

    Константин Константинопольский

    Успешно закончил курс «Reinforcement Learning»
    Выполнено практических заданий: 16 из 16

    Общество с ограниченной ответственностью “Отус Онлайн-Образование”

    Город:
    Москва

    Зам. директора департамента образования
    ООО “Отус Онлайн-Образование”
    Вдовиченко М.M.

    Лицензия на осуществление образовательной деятельности
    № 039825 от 28 декабря 2018 года.

    онлайн-образование

    Сертификат №0001

    Константин Константинопольский

    Успешно закончил курс «Reinforcement Learning»
    Выполнено практических заданий: 16 из 16

    Общество с ограниченной ответственностью “Отус Онлайн-Образование”

    Город:
    Москва

    Зам. директора департамента образования
    ООО “Отус Онлайн-Образование”
    Вдовиченко М.M.

    Лицензия на осуществление образовательной деятельности
    № 039825 от 28 декабря 2018 года.