Retour aux projets
PAO Poids Plume - Classification d'Oiseaux par Vidéo

PAO Poids Plume - Classification d'Oiseaux par Vidéo

Projet Cycle Ingénieur
PythonPyTorchDeep-LearningCNN 3DConv2Plus1DComputer Vision

Collaborateurs

Angelo Bou TanousMatthieu RiggsMuriella Gevia

PAO Poids Plume est un système de reconnaissance automatique d'espèces d'oiseaux à partir de vidéos. Le projet utilise une architecture de réseaux neuronaux convolutifs 3D pour analyser les séquences vidéo et identifier les espèces. L'architecture combine des convolutions spatiales et temporelles (Conv2Plus1D) avec des blocs résiduels pour capturer efficacement les caractéristiques distinctives des oiseaux en mouvement. A notre arrivé le projet était un CNN 2D sur des images qui étaient extraites a la main depuis des video, notre role a été de passer à une architecture 3D en vidéo.

Fonctionnalités

  • Architecture CNN 3D avec blocs résiduels et convolutions 2Plus1D
  • Extraction intelligente de frames clés dans les vidéos
  • Génération de rapports d'analyse détaillés avec visualisations
  • Interface d'inférence simple pour analyser de nouvelles vidéos d'oiseaux

Défis

  • Traitement de séquences vidéo de grande taille
  • Variation importante entre les individus d'une même espèce
  • Conditions d'éclairage et d'environnement variables
  • Équilibrage des classes pour un apprentissage optimal (sur représentation de certaines espèces)
  • Gestion des variations saisonnières dans l'apparence des oiseaux

Solutions

  • Décomposition des convolutions 3D en convolutions spatiales puis temporelles pour une meilleure efficacité
  • Suivie de l'entrainement avec TensorBoard pour des entraînements de 5 jours
  • Utilisation de connexions résiduelles pour favoriser l'apprentissage de réseaux profonds
  • Implémentation d'une division stratifiée ou chronologique des données
  • Scripts d'évaluation automatique pour identifier les meilleurs modèles