PAO Poids Plume est un système de reconnaissance automatique d'espèces d'oiseaux à partir de vidéos. Le projet utilise une architecture de réseaux neuronaux convolutifs 3D pour analyser les séquences vidéo et identifier les espèces. L'architecture combine des convolutions spatiales et temporelles (Conv2Plus1D) avec des blocs résiduels pour capturer efficacement les caractéristiques distinctives des oiseaux en mouvement. A notre arrivé le projet était un CNN 2D sur des images qui étaient extraites a la main depuis des video, notre role a été de passer à une architecture 3D en vidéo.
Fonctionnalités
Architecture CNN 3D avec blocs résiduels et convolutions 2Plus1D
Extraction intelligente de frames clés dans les vidéos
Génération de rapports d'analyse détaillés avec visualisations
Interface d'inférence simple pour analyser de nouvelles vidéos d'oiseaux
Défis
Traitement de séquences vidéo de grande taille
Variation importante entre les individus d'une même espèce
Conditions d'éclairage et d'environnement variables
Équilibrage des classes pour un apprentissage optimal (sur représentation de certaines espèces)
Gestion des variations saisonnières dans l'apparence des oiseaux
Solutions
Décomposition des convolutions 3D en convolutions spatiales puis temporelles pour une meilleure efficacité
Suivie de l'entrainement avec TensorBoard pour des entraînements de 5 jours
Utilisation de connexions résiduelles pour favoriser l'apprentissage de réseaux profonds
Implémentation d'une division stratifiée ou chronologique des données
Scripts d'évaluation automatique pour identifier les meilleurs modèles