Вы умеете
проводить качественную чистку данных, проводить восполнение данных.
Анализ данных на основе машинного обучения
Категория слушателей: граждане, имеющие высшее или среднее профессиональное образование.
Срок обучения: 2 недели (72 академических часа).
Группы приступают к занятиям по мере формирования.
Программа включает в себя 3 модуля, которые проводятся в открытом формате.
Программа курса «Анализ данных на основе машинного обучения» рассчитана на подготовку специалистов в области анализа данных и машинного обучения (Data Science) с использованием среды R Studio.
Для успешного прохождения курса слушатели должны на продвинутом уровне пользоваться компьютером, иметь базовые навыки в моделирование, знать основы теории вероятности и математической статистики, иметь представление о программировании на языках высокого уровня (на пороговом уровне). Для слушателей курсов предусмотрены входные контрольные задания по теории вероятности (теорема Байеса) и математической статистике (описательные дескриптивные статистики и проверка гипотез – ошибки первого и второго рода).
Дать систематизированное представление о современных подходах к анализу данных средствами машинного обучения, познакомить с основными принципами и этапами решения задач регрессии и классификации, научить навыкам применения технологий машинного обучения, в том числе ансамблированию алгоритмов, проверке качества алгоритмов с помощью процедур валидации и кросс-валидации, научить слушателей курса техникам сэмлирования в случае отсутствия сбалансированности классов во входной информации, проводить обучение алгоритмов машинного обучения в современных информационных средах (R Studio), в конечном итоге сформировать на базовом уровне компетенцию компетенции цифровой экономики: Управление информацией и данными.
Практико-ориентированный подход в обучении с применением специализированного программного обеспечения, применение дистанционных образовательных технологий.
программы составляет 15 000 рублей
проводить качественную чистку данных, проводить восполнение данных.
владеть техниками сэмплирования для восполнения баланса выборок, используя средства среды R Studio.
использовать алгоритмы машинного обучения для решения задач регрессии.