Этот репозиторий содержит программный код к книге "Предварительная подготовка данных в Python" Артема Груздева. Книга является коллекцией избранных материалов из первого модуля Подписки – обновляемых в режиме реального времени материалов по применению классических методов машинного обучения в различных промышленных задачах, которые автор делает вместе с коллегами и учениками. Детальную информацию о книге вы можете найти на веб-сайте издательства "ДМК-Пресс" том 1 и том 2.
Книга требует последние версии scikit-learn, pandas, NumPy, SciPy.
Для любопытных на обложке книги - стилизованное изображение любимицы автора, кошки Матильды, прожившей 22 года. Собственно ей книга и посвящена.
Данный репозиторий не содержит файлы данных размером свыше 100 мегабайт, папку со ВСЕМИ файлами (папка code), включая файл train_data.csv (программный код также прилагается), вы найдете по ссылке. Кроме того, папку с файлами и программный код (папка code2) вы можете скачать на веб-сайте издательства "ДМК-Пресс". Отсутствующий в папке code2 файл данных train_data.csv вы найдете на странице соревнования American Express - Default Prediction.
Всю информацию по опечаткам отправляйте на электронную почту. Если есть проблемы с кодом, пользуйтесь кнопкой New Issue раздела Issues.
В отличие от программного кода, выложенного по ссылке, программный код данного репозитория может обновляться (исправления).