Caractéristiques pseudo-Haar

Caractéristiques pseudo-Haar

Les caractéristiques pseudo-Haar (Haar-like features en anglais) sont des caractéristiques utilisées en vision par ordinateur pour la détection d'objet dans des images numériques. Très simples et très rapides à calculer, elles ont été utilisées dans le premier détecteur de visages en temps réel, celui de la méthode de Viola et Jones.

Ces caractéristiques doivent leur nom à leur similarité avec les ondelettes de Haar.

Sommaire

Description générale

Les caractéristiques pseudo-Haar sont décrites pour la première fois dans un article de Paul Viola et Michael Jones paru en 2001 dans la revue scientifique International Journal of Computer Vision (IJCV), dans laquelle ils décrivent une nouvelle méthode de détection de visage[1]. Le cœur de cette méthode s'inspire des travaux de Papageorgiou, Oren et Poggio[2], qui ont décrit des caractéristiques construites à partir d'un ensemble d'ondelettes de Haar.

L'avantage déterminant des caractéristiques pseudo-Haar est la rapidité de leur calcul. Accouplées à la technique des images intégrales, elles peuvent être calculées en un temps constant d'environ 60 instructions de processeur pour une caractéristique à deux rectangles. En revanche, leur simplicité ne leur permet pas de retenir de l'information très complexe, à la différence de caractéristiques plus sophistiquées comme les filtres orientés (en) ou les filtres de Gabor.

Caractéristiques rectangulaires

Un exemple des premières caractéristiques pseudo-Haar utilisées par Viola et Jones en 2001.

Les caractéristiques proposées par Viola et Jones, très similaires à celle de Papageorgiou et al., considèrent des fenêtres de détection (ou masques) délimitant des zones rectangulaires adjacentes ; les intensités de pixels de ces rectangles sont additionnées, formant des sommes dont la différence constitue une caractéristique. La figure ci-contre donne des exemples de masques à 2, 3 ou 4 rectangles, dans lesquelles la somme de pixels délimités par la zone sombre est soustraite de la somme des pixels délimités par la zone claire. Ces masques ou fenêtres de détection, généralement de très petite taille au départ (typiquement 20 × 20 pixels), sont appliqués à toutes les positions de l'image, puis leurs tailles agrandies. Une caractéristique est donc un nombre réel qui code les variations du contenu pixellique à une position donnée dans la fenêtre de détection. La présence de contours ou un changement de texture dont ainsi traduits numériquement par les valeurs des caractéristiques pseudo-Haar. Par exemple, un masque à 2 rectangles permet d'indiquer où se situe la frontière entre une région sombre et une région claire.

Rapidité de calcul

Article détaillé : image intégrale.

Il est possible de calculer très rapidement les caractéristiques pseudo-Haar à l'aide des images intégrales. Une image intégrale est une table de correspondance 2D, construite à partir de l'image d'origine, et de même taille qu'elle. Elle contient en chacun de ses points la somme des pixels situés au-dessus et à gauche du pixel courant.

Une fois le calcul de l'image intégrale effectué, la somme des pixels dans n'importe quel rectangle situé dans l'image peut se calculer en seulement 3 opérations et 4 accès à l'image intégrale. Une caractéristique pseudo-Haar à deux rectangles peut alors être déterminée en seulement 6 accès (2 points sont partagés) à l'image, et une caractéristique à 3 rectangles en seulement 8 accès.

Caractéristique rectangulaires orientées

Illustration des caractéristiques pseudo-Haar proposées par Lienhart: 4 caractéristiques de bords, 8 de lignes, et 2 de centre-pourtour
L'extension des proposée par Lienhartet Maydt[3]

Lienhart and Maydt[3] ont introduit en 2002 le concept de caractéristiques pseudo-Haar orientées à 45° afin de mieux prendre en compte dans une image les structures inclinées (par exemple un contour à 45°). Ils ont montré que ce concept apportait une amélioration de près de 10 % des performances par rapport à l'ensemble de caractéristiques utilisées par Viola et Jones.

Ils ont également proposé une extension des images intégrales pour permettre le calcul rapide de ces caractéristiques à 45°.

Messom et Barczak ont étendu l'idée à des rotations d'angles quelconques, au prix toutefois d'erreurs d'arrondi[4].

Applications

On utilise le plus souvent les caractéristiques pseudo-Haar pour la reconnaissance visuelle dans des flux vidéos, puisque le traitement des images est très rapide. Leur application originale était la reconnaissance faciale en temps réel. On l'utilise maintenant couramment pour de nombreux types de détection d'objets, ce qui est facilité par l'adaptabilité de cette technique.

Notes et références

  1. Paul Viola et Michael Jones, Robust Real-time Object Detection IJCV 2001
  2. Papageorgiou, Oren and Poggio, A general framework for object detection, International Conference on Computer Vision, 1998.
  3. a et b Rainer Lienhart et Jochen Maydt, An Extended Set of Haar-like Features for Rapid Object Detection, In IEEE ICIP, 2002
  4. Messom, C.H. and Barczak, A.L.C., Fast and Efficient Rotated Haar-like Features Using Rotated Integral Images, Australian Conference on Robotics and Automation (ACRA2006), pp. 1-6, 2006

Annexes

Articles connexes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Caractéristiques pseudo-Haar de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Ondelette de Haar — L ondelette de Haar L ondelette de Haar, ou fonction de Rademacher, est une ondelette créée par Alfréd Haar en 1909[1]. On considère que c est la première ondelette connue. Elle est la plus simple …   Wikipédia en Français

  • Méthode de Viola et Jones — Un exemple de détection de visage par la méthode de Viola et Jones. La méthode de Viola et Jones est une méthode de détection d objet dans une image numérique, proposée par les chercheurs Paul Viola et …   Wikipédia en Français

  • Détection de personne — Un exemple de détection de personnes sur une voie de circulation La détection de personne est un domaine de la vision par ordinateur consistant à détecter un humain dans une image numérique. C est un cas particulier de détection d objet, où l on… …   Wikipédia en Français

  • Image intégrale — Calcul de la somme des pixels dans une zone rectangulaire arbitrairement située dans une image numérique: seuls 4 accès à l image intégrale (A,B,C,D) sont nécessaires. Une image intégrale (ou summed area table) est une représentation sous la… …   Wikipédia en Français

  • Éléments d'analyse — Les Éléments d analyse sont une série de 9 volumes écrits par le mathématicien français Jean Dieudonné. À l origine, seul le premier volume, Foundations of Modern Analysis, publié en 1960, était prévu. J. Dieudonné l écrit suite à une série de… …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • SYSTÈMES DYNAMIQUES DIFFÉRENTIABLES — Sans doute née avec le mémoire que Poincaré écrivit en 1881 «sur les courbes définies par des équations différentielles», où l’étude quantitative (analytique) locale des équations différentielles dans le champ complexe est remplacée par leur… …   Encyclopédie Universelle

  • Scale-invariant feature transform — Exemple de résultat de la comparaison de deux images par la méthode SIFT (Fantasia ou Jeu de la poudre, devant la porte d’entrée de la ville de Méquinez, par Eug …   Wikipédia en Français

  • Liste des articles de mathematiques — Projet:Mathématiques/Liste des articles de mathématiques Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou probabilités et statistiques via l un des trois bandeaux suivants  …   Wikipédia en Français

  • NORMÉES (ALGÈBRES) — Au point de rencontre de deux types de structures, structures algébriques et structures topologiques, les algèbres normées jouent un rôle important dans de nombreux domaines de l’analyse mathématique. Développée à partir de 1940 environ,… …   Encyclopédie Universelle

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”