Retour aux projets
Analyse de Données d'appartement

Analyse de Données d'appartement

Projet 2ème année
Analyse de donnéesPythonPandasMatplotlibNumpy

Collaborateurs

Nathan DupontAli Hamdani

Ce projet avait pour objectif d'analyser les prix de location des appartements aux États-Unis à l'aide d'un jeu de données réelles. En utilisant des méthodes d'analyse statistiques et géographiques, nous avons étudié les corrélations entre les variables et créé un modèle de prédiction.

Fonctionnalités

  • Analyse des corrélations et visualisation des données
  • Création de cartes géographiques interactives pour représenter les prix
  • Régression multiple pour prédire les prix
  • Tests statistiques (t-Student, Mann-Whitney-U) pour valider les hypothèses
  • Développement d'une fonction prédictive basée sur les caractéristiques des biens

Défis

  • Traitement d'un grand volume de données (100 000 observations)
  • Gestion des données aberrantes pour la régression
  • Visualisation efficace des données géographiques
  • Validation des résultats avec des tests appropriés

Solutions

  • Utilisation de Python avec Pandas pour la manipulation des données
  • Mise en place de One Hot Encoding pour les variables qualitatives
  • Création de cartes avec Cartopy et Folium pour des visualisations interactives
  • Application de modèles de régression avancés et techniques de sélection de variables
  • Utilisation de tests statistiques robustes pour confirmer les hypothèses