Ce projet avait pour objectif d'analyser les prix de location des appartements aux États-Unis à l'aide d'un jeu de données réelles. En utilisant des méthodes d'analyse statistiques et géographiques, nous avons étudié les corrélations entre les variables et créé un modèle de prédiction.
Fonctionnalités
Analyse des corrélations et visualisation des données
Création de cartes géographiques interactives pour représenter les prix
Régression multiple pour prédire les prix
Tests statistiques (t-Student, Mann-Whitney-U) pour valider les hypothèses
Développement d'une fonction prédictive basée sur les caractéristiques des biens
Défis
Traitement d'un grand volume de données (100 000 observations)
Gestion des données aberrantes pour la régression
Visualisation efficace des données géographiques
Validation des résultats avec des tests appropriés
Solutions
Utilisation de Python avec Pandas pour la manipulation des données
Mise en place de One Hot Encoding pour les variables qualitatives
Création de cartes avec Cartopy et Folium pour des visualisations interactives
Application de modèles de régression avancés et techniques de sélection de variables
Utilisation de tests statistiques robustes pour confirmer les hypothèses