Вы умеете
проводить классификацию текста (например спам/неспам) с помощью наивного байесовского классификатора.
Интеллектуальный анализ данных на основе машинного обучения
Категория слушателей: граждане, имеющие высшее или среднее профессиональное образование.
Срок обучения: 2 недели (72 академических часа).
Группы приступают к занятиям по мере формирования.
Программа включает в себя 3 модуля, которые проводятся в открытом формате.
Для успешного прохождения курса слушатели должны на продвинутом уровне пользоваться компьютером, иметь базовые навыки в моделирование, знать основы теории вероятности и математической статистики, иметь представление о программировании на языках высокого уровня (на пороговом уровне). Для слушателей курсов предусмотрены входные контрольные задания по теории вероятности (теорема Байеса) и математической статистике (описательные дескриптивные статистики и проверка гипотез – ошибки первого и второго рода).
Цель курса дать систематизированное представление о современных подходах к интеллектуальному анализу текста средствами машинного обучения, познакомить с основными принципами лингвостатистики, научить навыкам применения технологий интеллектуального анализа текста, относящегося к неструктурированной информации, в современных информационных средах (RStudio), в конечном итоге сформировать на базовом уровне компетенцию компетенции цифровой экономики: Управление информацией и данными. В рамках изучения курса у слушателей будет сформирована компетенция на базовом уровне: Способность управлять неструктурированной информацией и данными.
Практико-ориентированный подход в обучении с применением специализированного программного обеспечения, применение дистанционных образовательных технологий.
программы составляет 15 000 рублей
проводить классификацию текста (например спам/неспам) с помощью наивного байесовского классификатора.
навыками оценки качества алгоритмов интеллектуального анализа текста.
проводить качественную чистку текста, избавляться от стоп-слов и проводить лемматизацию и стеминг текста.