Skip to content

Latest commit

 

History

History
82 lines (58 loc) · 5.25 KB

README.md

File metadata and controls

82 lines (58 loc) · 5.25 KB

Машинное обучение МТС Тета

Репозиторий содержит материалы и полезные ссылки по курсу машинного обучения в летней школе МТС Тета.

Полезные ссылки:

Slack Channel

МТС Тета Машинное обучение: https://www.teta.mts.ru/machine_learning_program_description

Стажирвка в МТС: https://job.mts.ru/youth

Темы курса:

Блок Basics

Модуль 1

  • Обзор классических алгоритмов обучения с учителем и обучения без учителя
  • Инструменты дата саентиста

Модуль 2

  • Валидация моделей по историческим данным: CV, отложенная выборка, метрики (+ нестандартные), доп. разделы
  • Разбор валидации в python: стандартные и кастомизированные метрики, baseline, стабильность по фолдам, автоматизированные отчеты

Модуль 3

  • Онлайн валидация: пилот, АБ-тестирование, дизайн эксперимента
  • Интервальные оценки метрик качества, применение стат. тестов для оценки результатов онлайн тестирования

Блок Cases

Модуль 4

  • Жизненный цикл проекта по анализу данных, предпроектное исследовнаие
  • Постановка задачи и оценка экономического потенциала на ранней стадии

Модуль 5

  • Запрос на данные, валидация и приемка данных, оценка потенциала датасета для моделирования
  • Инструменты для EDA и визуализации данных: Seaborn, Plotly, Dash

Модуль 6

  • Работа над проектом: воспроизводимые эксперименты, ревью
  • Обзор инструментов для документирования изменений, автоматизации выполнения пайплайнов, менеджмента экспериментов

Блок Services

Модуль 7

  • Data-based cервис: жизненный цикл, разработка и варианты deploy
  • Разработка demo сервиса

Модуль 8

  • Мониторинг ML моделей: input data, drift, performance, fairness etc
  • Интерпретация моделей

Модуль 9

  • Обзор курса и чек-лист дата-саентиста
  • Data Science в МТС: Виктор Кантор про роль DS в большом бизнесе.

Входные требования:

  • General IT background (OS, bash, services, repositories, etc.)
  • Programming Python
  • Python for Data Analysis (Pandas, Numpy, Scipy, Sklearn)
  • The Probability Theory and Mathematical Statistics
  • Time Series Analysis (basics)
  • Understanding of ML basic concepts and problem statements

Рекомендации по подготовке:

Машинное обучение

  1. [просто] Специализация "Машинное обучение и анализ данных" на Coursera: https://www.coursera.org/specializations/machine-learning-data-analysis Специализация на русском языке, преподают в основном практикующие Data Scientist'ы из Яндекс.

Стоит обратить внимание на первые 3 курса:

1.1 Вводный/подготовительный курс: https://www.coursera.org/learn/mathematics-and-python/home/welcome

1.2 Обучение с учителем: https://www.coursera.org/learn/supervised-learning/home/welcome самый интересный курс, в нем рассказываем про алгоритмы классификации и регрессии.

1.3 Обучение без учителя: https://www.coursera.org/learn/unsupervised-learning/home/welcome курс про кластеризацию, уменьшение размерности и визуализацию.

  1. [сложно] Видео-лекции от Факультета Компьютерных Наук ВШЭ по машинному обучению. Вводный технический курс, преподаватель - Евгений Соколов: https://www.youtube.com/watch?v=OBG6EUSRC9g&list=PLEqoHzpnmTfDwuwrFHWVHdr1-qJsfqCUX

  2. [сложно] Открытые видео-лекции ШАД Яндекс по машинному обучению. Классический технический курс, преподаватель - Константин Вячеславович Воронцов: https://www.youtube.com/watch?v=SZkrxWhI5qM&list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK

Статистика

  1. [сложно] Построение выводов по данным, преподаватель - Евгений Рябенко: https://www.coursera.org/learn/stats-for-data-analysis/home/welcome