Nouvel algorithme pour la perception de la profondeur dans des images statiques

, Partager

Une équipe de Stanford vient de proposer un nouvel algorithme d’analyse d’image permettant d’estimer les distances des différents objets sur une image unique statique. Le logiciel développé permet la perception de la profondeur sans faire appel à la disparité binoculaire, contrairement aux algorithmes traditionnels qui utilisent la vision stéréo et la triangulation. L’intérêt serait d’équiper des robots pour leur permettre de se déplacer à grande vitesse en évitant les obstacles, tout en n’étant équipé que d’une simple caméra monoculaire, la technique mise au point fournissant une détection des obstacles avec estimation de leur éloignement (du moins pour les obstacles ni trop petits ni trop plats). Ceci serait intéressant pour de très petits robots, ou des robots bon marchés, pour lesquels on ne peut envisager de multiplier les capteurs.
L’algorithme utilise plusieurs approches : analyse de la texture des objets (moins l’objet contiendra de détails plus il sera éloigné), analyse des contours (des lignes convergentes indiquent un accroissement des distances), comparaison de la netteté (plus un objet sera flou plus il sera loin). L’image est segmentée puis les secteurs sont analysés individuellement et comparativement pour déterminer les positionnements relatifs des objets détectés. Le processus est répété avec plusieurs niveaux de grossissement pour essayer de détecter tous les éléments présents dans l’image. Par ailleurs, l’approche repose sur un apprentissage supervisé de l’environnement, pour que l’algorithme estime correctement la décomposition de l’image. L’apprentissage permet d’initier un sous-système de bas niveau, très précis sur l’ensemble d’apprentissage, sous-système sur lequel un contrôleur s’appuie ensuite pour continuer d’apprendre par apprentissage par renforcement (maximisation d’une fonction d’apprentissage). L’approche est donc plus complexe que celles antérieurement développées, par exemple à CMU.
Le taux d’erreurs annoncé est de 35% ce qui d’après les chercheurs est suffisamment bon pour permettre à un robot de se mouvoir rapidement (par exemple à 30 ou 40km/h) et d’ajuster sa route au fur et à mesure de son déplacement.

Source :


- Stanford Report, 07/12/2005 - http://news-service.stanford.edu/news/2005/december7/robotsee-120705.html
- Andrew Y. Ng, Computer Science Department, Stanford University - http://ai.stanford.edu/~ang/

Pour en savoir plus, contacts :


- High speed obstacle avoidance using monocular vision and reinforcement learning. ACM International Conference Proceeding Series ; Vol. 1 Proceedings of the 22nd international conference on Machine learning, Bonn, Germany, 7-11/08/2005 - http://delivery.acm.org/10.1145/1110000/1102426/p593-michels.pdf?key1=1102426&key2=4881154311&coll=GUIDE&dl=GUIDE&CFID=62893273&CFTOKEN=29775644
- Appearance-Based Obstacle Detection with Monocular Color Vision - http://www.cs.cmu.edu/~illah/PAPERS/abod.pdf
Code brève
ADIT : 31166

Rédacteur :

Christophe Lerouge, christophe.lerouge@consulfrance-sanfrancisco.org

Voir en ligne : http://www.bulletins-electroniques….