Репозиторий содержит материалы и полезные ссылки по курсу машинного обучения в летней школе МТС Тета.
Slack Channel
МТС Тета Машинное обучение: https://www.teta.mts.ru/machine_learning_program_description
Стажирвка в МТС: https://job.mts.ru/youth
Модуль 1
- Обзор классических алгоритмов обучения с учителем и обучения без учителя
- Инструменты дата саентиста
Модуль 2
- Валидация моделей по историческим данным: CV, отложенная выборка, метрики (+ нестандартные), доп. разделы
- Разбор валидации в python: стандартные и кастомизированные метрики, baseline, стабильность по фолдам, автоматизированные отчеты
Модуль 3
- Онлайн валидация: пилот, АБ-тестирование, дизайн эксперимента
- Интервальные оценки метрик качества, применение стат. тестов для оценки результатов онлайн тестирования
Модуль 4
- Жизненный цикл проекта по анализу данных, предпроектное исследовнаие
- Постановка задачи и оценка экономического потенциала на ранней стадии
Модуль 5
- Запрос на данные, валидация и приемка данных, оценка потенциала датасета для моделирования
- Инструменты для EDA и визуализации данных: Seaborn, Plotly, Dash
Модуль 6
- Работа над проектом: воспроизводимые эксперименты, ревью
- Обзор инструментов для документирования изменений, автоматизации выполнения пайплайнов, менеджмента экспериментов
Модуль 7
- Data-based cервис: жизненный цикл, разработка и варианты deploy
- Разработка demo сервиса
Модуль 8
- Мониторинг ML моделей: input data, drift, performance, fairness etc
- Интерпретация моделей
Модуль 9
- Обзор курса и чек-лист дата-саентиста
- Data Science в МТС: Виктор Кантор про роль DS в большом бизнесе.
- General IT background (OS, bash, services, repositories, etc.)
- Programming Python
- Python for Data Analysis (Pandas, Numpy, Scipy, Sklearn)
- The Probability Theory and Mathematical Statistics
- Time Series Analysis (basics)
- Understanding of ML basic concepts and problem statements
- [просто] Специализация "Машинное обучение и анализ данных" на Coursera: https://www.coursera.org/specializations/machine-learning-data-analysis Специализация на русском языке, преподают в основном практикующие Data Scientist'ы из Яндекс.
Стоит обратить внимание на первые 3 курса:
1.1 Вводный/подготовительный курс: https://www.coursera.org/learn/mathematics-and-python/home/welcome
1.2 Обучение с учителем: https://www.coursera.org/learn/supervised-learning/home/welcome самый интересный курс, в нем рассказываем про алгоритмы классификации и регрессии.
1.3 Обучение без учителя: https://www.coursera.org/learn/unsupervised-learning/home/welcome курс про кластеризацию, уменьшение размерности и визуализацию.
-
[сложно] Видео-лекции от Факультета Компьютерных Наук ВШЭ по машинному обучению. Вводный технический курс, преподаватель - Евгений Соколов: https://www.youtube.com/watch?v=OBG6EUSRC9g&list=PLEqoHzpnmTfDwuwrFHWVHdr1-qJsfqCUX
-
[сложно] Открытые видео-лекции ШАД Яндекс по машинному обучению. Классический технический курс, преподаватель - Константин Вячеславович Воронцов: https://www.youtube.com/watch?v=SZkrxWhI5qM&list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK
- [сложно] Построение выводов по данным, преподаватель - Евгений Рябенко: https://www.coursera.org/learn/stats-for-data-analysis/home/welcome