Notebook d'un projet de Machine Learning pour estimer le prix d'une voiture d'occasion via une application
Je m'appelle Charles-Henri SAINT-MARS et je suis actuellement en recherche d'une entreprise d'accueil afin d'effectuer une formation d'Ingénieur en Machine Learning en alternance et bien entendu de faire profiter de mes connaissances et compétences à cette entreprise d'accueil. Entre-temps, je suis des MOOCs afin de progresser dans ce domaine et d'être mieux préparé pour les missions qui me seront confiées.
Vous avez une entreprise de développement d'applications mobiles et votre nouveau projet concerne la création d'une application qui met en relation des vendeurs de voitures d'occasion et des potentiels clients. Vous aimeriez ajouter une nouvelle fonctionnalité à cette application: celle de donner la possibilité aux utilisateurs de l'application de connaître le prix correct auquel ils peuvent acheter ou vendre une voiture d'occasion d'après les caractéristiques qu'ils souhaitent afin de ne pas se faire arnaquer par des vendeurs.
Ensuite l'application devra avertir un potentiel acheteur si la voiture qui l'intéresse est au prix "juste" et aussi avertir un vendeur si le prix auquel il veut vendre sa voiture est approprié.
Après avoir collecté des données de caractéristiques de plusieurs centaines de voitures d'occasion ainsi que leur prix de vente sur des plate-formes dédiées, vous décidez donc de construire un modèle de Machine Learning capable de prédire le prix d'une voiture en fonction de ses caractéristiques.
Lien du cours : https://www.youtube.com/watch?v=7-WsA_arUpg
- Notebook 1 : Modèle de régression linéaire crée avec SkLearn
- Notebook 2 : Modèle de régression linéaire crée avec une bibliothèque de classes et de méthodes personnalisées
Ce projet m'a permis de découvrir concrètement le Machine Learning dans un cas simple et de comprendre comment on peut l'implémenter dans une application Python dans un cas concret. Au cours de ce projet, j'ai appris à :
- utiliser les librairies Pandas, Numpy, Plotly Express, Matplotlib, SkLearn, et Joblib
- manipuler des données
- nettoyer les données
- visualiser les données
- créer et entraîner un modèle de régression linéaire avec une variable en entrée et une en sortie
- évaluer la performance du modèle à l'aide du coefficient de détermination R² et du coefficient de corrélation
- utiliser le modèle pour faire des estimations
- sauvegarder le modèle dans un fichier PKL pour pouvoir l'utiliser ultérieurement
- implémenter le modèle dans une application Python pour répondre au besoin métier (voir scénario du projet ci-dessus)