Skip to content

ViktorPavlovA/digital_breakthrough2022

Repository files navigation

Код решения кейса Ростелеком

Решение представленно командой "Цикличность действий"

"Разработка модели машинного обучения для предсказания склонности клиента к покупке услуги на основе предоставленных и открытых данных"

  1. model
  2. Preprocessing_script
  3. Parsing_script
  4. Info
  5. Pred
  6. Person

>model

В данной папке находится скрипт (xgboost_nn.ipynb) для обучения ансамбля моделей машинного обучения, а также ее параметры.

  1. XGboost
  2. Простая модель нейронных сетей
  3. Кластеризация на основе K-means

>Preprocessing_script

В данной папке находятся скрипты для предварительной обработки данных и получения новых фич

Основная идея была:

  1. Создать таблицу hex_grace для гексагонов на основе тренировочной таблицы
  2. Выполнить джойн с таблицей теста для подстановки данных из таблицы hex_grace
  3. Выделение новых фич с использование K-means
  4. Добавление фич из открытых источников

>Parsing_script

В папке находятся скрипты для парсинга сайтов

>Pred

Топ предсказанных 1 и 0.

Так же для удобства находится в корне - "Цикличность действий.csv"

>info

В папке графики и диаграммы, которые дают представление о модели

>Person

Информация об участниках:

Анастасия Тимошина [email protected]

Богдан Барабанщиков [email protected] (https://github.com/bogdal1993)

Павлов Виктор [email protected] (https://github.com/ViktorPavlovA)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published