Accueil || Parcours || Recherche || S'enregistrer || Mon Compte || Contacts || Aide || Langues
Nottale, Matthieu (2008) Ancrage d'un lexique partagé entre robots autonomes dans un environnement non-contraint. Doctorat Robotique Cognitive , Laboratoire Electronique et Informatique (ENSTA - UEI) p.115.
Plein texte disponible en tant que :
|
|
Autres Localisations: http://cogrob.ensta.fr/papers/nottale_these.pdf
Résumé
Les Talking Heads sont une expérience de robotique développementale menée par Luc Steels et Frédéric Kaplan en 1995. Dans cette expérience, des agents apprennent un lexique de mots associés à des propriétés visuelles d'objets extraits de leurs perceptions. Cet apprentissage est réalisé par le biais de jeux de langage dans lesquels les agents s'échangent des symboles.
L'interaction entre les agents est conçue de manière à ancrer ces symboles dans leur perception. Cette expérience apporte un début de réponse au problème de la sémantique des systèmes symboliques illustré par l'expérience de pensée de la chambre chinoise.
Les Talking Heads sont capables de faire converger un lexique de mots partagés au seins d'une population de plusieurs milliers d'agents de manière non supervisée, réalisant ainsi un début de solution au problème de l'émergence du langage.
Cette expérience a déjà été étendue dans plusieurs directions, par exemple en rajoutant une grammaire au lexique des agents et en étendant les perceptions des agents à des scènes montrant des objets en mouvement. Mais les restrictions que les expériences actuelles dérivant des Talking Heads posent sur l'environnement limitent certaines pistes de développement intéressantes.
Cette thèse a pour objectif de reproduire les Talking Heads en utilisant des robots autonomes et en se plaçant dans un environnement visuel non contraint: le laboratoire. L'intérêt de cette démarche est de confirmer dans un premier temps que le modèle des Talking Heads reste valide face à une perception plus complexe, pour pouvoir par la suite tester des modèles cognitifs plus complexes, donnant plus d'autonomie aux robots et qui n'auraient de sens que dans cet environnement suffisamment riche.
Nous nous intéressons dans un premier temps aux nouveaux problèmes introduits par la mobilité des robots : détection d'un autre robot, positionnement à ses côtés et pointage d'un élément de l'environnement.
Puis nous proposons un premier modèle de perception très proche des Talking Heads, utilisant des algorithmes de segmentation d'images. Ce modèle ne permet pas d'aboutir à la convergence des lexiques des agents dans ce cadre. Nous analysons les raisons de son échec, et proposons un second modèle basé sur les récentes avancées dans le domaine de la reconnaissance d'objets, utilisant des algorithmes de détection de points caractéristiques.
Ce modèle est tout d'abord testé sur une base de donnée d'images, pour vérifier sa capacité à catégoriser de manière supervisée, puis appliqué aux jeux de langage des Talking Heads. Les résultats montrent que les agents sont capables d'échanger des symboles représentant des zones de leur environnement, même si le taux de succès des jeux de langage reste encore faible.
| Type d'EPrint: | Thèse (Doctorat) |
|---|---|
| Directeur de Thèse: | Ganascia, Jean-Gabriel |
| Date: | 2008 |
| Jury de Thèse: | Steels, Luc et Baillie, Jean-Christophe et Sigaud, Olivier et Oudeyer, Pierre-Yves et Gaussier, Philippe et Dominey, Peter Ford |
| Ecole Doctorale: | ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE) |
| Discipline: | Robotique Cognitive |
| Fonds: | ENSTA ParisTech |
| Institution: | UPMC |
| Laboratoire: | Laboratoire Electronique et Informatique (ENSTA - UEI) |
| Sujets: | 2. Sciences et technologies de l'information et de la communication |
| Mots-clés libres: | Robotique développementale, Émergence du langage, Vision artificielle, Ancrage, Symbol grounding, Developmental robotics, Computer vision |
| Code ID: | 4260 |
| Déposé par : | Sophie Chouaf |
| Déposé le : | 21 Novembre 2008 |
Table des Matières
1 Introduction - 4
2 Les Talking Heads - 7
2.1 Présentation générale - 7
2.2 Les agents et leur environnement - 9
2.3 Perception - 10
2.4 Signifiant, arbres de discrimination - 11
2.5 Lexique - 12
2.6 Initialisation : le jeu de discrimination, le jeu de nommage - 12
2.7 Le Guessing Game - 14
2.8 Résultats, extensions et travaux connexes - 16
3 Les Talking Robots - 18
3.1 Cadre - 18
3.2 Objectifs - 19
3.2.1 Vers des agents mobiles, autonomes et incarnés - 19
3.2.2 Vers un environnement peu restreint - 20
3.3 Déroulement - 20
4 Talking Robots 1.0, segmentation a priori - 22
4.1 Présentation générale - 22
4.2 Mécanismes auxiliaires - 22
4.2.1 Synchronisation - 22
4.2.2 Synthèse et reconnaissance vocale - 23
4.2.3 Pointage - 23
4.2.3.1 Présentation du problème - 23
4.2.3.2 Premier algorithme : modélisation et agrégation - 25
4.2.3.3 Second algorithme : vitesse - 26
4.2.3.4 Performances et jeu de pointage - 27
4.2.4 Localisation des aibos - 29
4.2.4.1 SPOMF et FMI-SPOMF - 29
4.2.4.2 Marquage des aibos - 41
4.3 M´ecanismes fondamentaux - 43
4.3.1 Référents - 43
4.3.2 Signifiants et canaux perceptifs - 50
4.3.3 Arbres de discrimination - 51
4.3.4 Symbole et combinaison de nœuds - 51
4.3.5 Mots, lexique - 52
4.4 Jeu de discrimination - 52
4.5 Guessing Game - 53
4.6 Implantation - 54
4.7 Résultats - 54
4.8 Analyse - 59
5 Talking Robots 2.0, modèle d’objet - 61
5.1 Présentation - 61
5.2 La reconnaissance d’objets - 63
5.3 Algorithmes de détection de points caractéristiques - 66
5.3.1 Histogramme et distance EMD - 67
5.3.2 Corrélogramme - 67
5.3.3 SIFT - 67
5.3.4 K-Adjacent Segment - 68
5.4 Graphes de discrimination - 68
5.4.1 Premier dictionnaire : taille de rayon fixe - 69
5.4.2 Second dictionnaire : nombre de fils par nœud fixe - 71
5.5 Les objets - 73
5.5.1 Définition - 73
5.5.2 Comparaison - 74
5.5.2.1 Normes L1 et L2, TF-IDF - 74
5.5.2.2 Calcul probabiliste - 74
5.5.2.3 Vote - 75
5.5.2.4 Pondération entropique - 76
5.5.3 Reconnaissance, construction non supervisée - 76
5.5.4 Agrégation de multiples détecteurs de caractéristiques - 77
5.5.5 Fenêtrage - 78
5.6 Mots et lexique - 79
5.7 Initialisation : jeu de discrimination - 80
5.8 Guessing Game - 80
5.9 Implantation - 81
5.10 Résultats - 81
5.10.1 Paramétrage - 82
5.10.2 Catégorisation sur la base d’images GRAZ-02 - 83
5.10.3 Persistance des modèles d’objets - 85
5.10.4 Apprentissage supervisé d’associations entre sons et
objets - 87
5.10.5 Limites du modèle : suppression de fond - 89
5.10.6 Guessing Game - 90
5.11 Différence avec les Talking Heads - 91
5.12 Futurs développements - 92
6 Conclusions - 95
A Génération de graphes de comportement en C++ - 97
Administrateurs de l'archive uniquement : éditer cet enregistrement