Minimisation du Temps de Réponse moyen d'une Cascade de Détection

Session : APP / Apprentissages
Mercredi 10 février 11:00 - 12:20 Salle : RP13
Francisco Rodolfo Barbosa Anda, Cyril Briand, Frédéric Lerasle et Alhayat Ali Mekonnen

La détection visuelle d'objets est importante dans de nombreux domaines d'application. L'objectif est de déterminer la présence et la position de certains types d'objets dans une image. Les approches existantes réalisent classiquement un échantillonnage de l'image en fenêtres, chacune étant analysée pour déterminer si elle contient l'objet recherché (échantillon positif) ou non (échantillon négatif). Cette approche induit un temps de traitement important parce qu'une image génère une grande quantité d'échantillons, surtout négatifs. Pour pallier ce problème, des architectures de classification en cascade ont été proposées dans lesquelles des classificateurs faibles sont utilisés à chaque étage. Un échantillon classifié négatif à un niveau de la cascade est définitivement rejeté (et ne traverse par les niveaux suivants). Les cascades construites avec la méthode AdaBoost comptent parmi les plus performantes. AdaBoost est basé sur un apprentissage supervisé d'un modèle de classification qui utilise une somme pondérée des résultats des classificateurs faibles. À chaque niveau de la cascade est associé un seuil de classification : si le score obtenu par un échantillon à un étage est supérieur ou égale au seuil, ce dernier est classé positif, sinon il est négatif et rejeté. Ces seuils sont choisis afin de respecter un taux de vrais positifs souhaité (TPR). La variante la plus récente de cascade est le modèle soft-cascade sue lequel est basé notre travail. La qualité d'une soft-cascade étant principalement mesurée en termes de TPR et de taux de faux positifs (FPR), les méthodes d'apprentissage classiques ne prennent pas en compte explicitement leur temps de réponse, pourtant central dans des applications où l'environnement est fortement dynamique. Dans ce travail, nous envisageons une technique de minimisation du temps de réponse qui consiste à optimiser les seuils de classification utilisés à chaque étage de la cascade. Nous produisons trois contributions : (1) nous prouvons tout d'abord que déterminer des seuils de classification qui minimise le temps de réponse d'une soft-cascade est NP-Difficile; (2) nous proposons ensuite des propriétés de dominance permettant de réduire de façon importante l'espace de recherche de solution; (3) exploitant ces propriétés, nous introduisons une formulation de programmation linéaire 0-1 originale pour résoudre ce problème; (4) nous validons enfin la méthode proposée de façon expérimentale sur un basée de données de la littérature.

Mots clés :