indexation ou taggage?
fév 4th, 2009 by Gaby David
Pour nous, « apprentis chercheurs spécialistes de l’image » il s’agit aussi de déchiffrer des codes, de repérer des mœurs, des gestes, comment et qu’est-ce que les gens font avec leurs images.
Dans cet esprit, Amélie Segonds, entame une analyse typologique sur la problématique de l’indexation visuelle.
Compte rendu et quelques réflexions autour d’une séance fort intéressante :
Les problèmes de l’indexation visuelle empêchent – parfois - de trouver des images avec des contenus qui nous intéressent. Il est important de discuter et d’analyser les aspects formels de la recherche proprement dit, car finalement cela aura une incidence sur les contenus trouvés.
L’indexation visuelle pour l’instant (en février 2009) ne se fait pas par les caractères propres à l’image (par exemple les couleurs, les formes…) mais par les tags que chaque usager lui donne.
Il y a eu des essais pour faire autrement : ils ont jusqu’à présent plutôt échoué…
Mais puisque la toile est une base de donnés visuelle ouverte, qui grandit à tout moment, c’est très difficile de suivre une indexation correcte au jour le jour.
L’exemple Google Images (GI)
GI propose comme Google l’indexation par page rank, c’est-à-dire que les pages les plus visitées et les plus citées s’affichent en premier et non en fonction de la pertinence du résultat.
Pour chercher une image dans GI, il nous faut taper des mots clés : on fait alors appel au texte et à la subjectivité. De plus, on a des problèmes sémantiques : notamment pour les mots polysémiques ou selon les langues d’interface.
Google Image Labeler
Pour revenir aux images, aujourd’hui Google (aussi) est conscient des problèmes d’indexation des images et cherche à inciter tout le monde à tagger les images ensemble: http://images.google.com/imagelabeler/
“Many hands make light work”, plusieurs mains rendent la tâche plus facile, est le mot d’ordre que Google a lancé pour faire participer les gens au re-taggage. Comme un jeu presque addictif, la folksonomie se met en place. Avec fastr “a flickr game”, Flickr a fait pareil: à revoir ici.
Je me permets de vous renvoyer notamment aux recherches menées par Melanie Aurnhammer, Peter Hanappe et Luc Steels qui indiquent que l’expérience est encore plus évidente si on indexe “apples”, car on trouvera non seulement des images de pommes mais aussi des photographies de personnes avec leur ordinateur portable de la marque Apple. (voir en références)
Et bien sûr, ici en France à Nozha Boujemaa, de l’INRIA, (Institut national de recherche en informatique et en automatique) qui fait par exemple le même constat avec « avocat » et « voile ».
L’institut de recherche IMEDIA : Images et multimédia : indexation, navigation et recherche (équipe-projet) mène, parmi ces projets, une recherche sur comment trouver les photos par rapport à leur contenu, notamment en travaillant avec l’AFP (Agence France-Presse). Parmi les projets de l’équipe de Boujemaa, il faut voir aussi le CBIR demo.
Le geotagging
Avec le geotagging l’indexation se sur des caractères propres à l’image. Par exemple, les couleurs, les formes, etc.
- Panoramio est un site web de partage de photographies géopositionnées. Certaines photos mises en ligne par les utilisateurs sont visibles depuis Google Earth, elles viennent enrichir l’information visuelle du lieu : ce sont en général des photos prises au sol, créant une mise en perspective avec les vues satellite de Google. Les photos sélectionnées dans Google Earth sont choisies pour leurs qualités documentaires. Google a racheté Panoramio en juin 2007 pour la complémentarité avec Google Earth.
Aujourd’hui dans les nouveaux appareils photographiques et téléphones portables, le geotaggage est fait automatiquement. Il est possible de le faire manuellement mais c’est assez difficile.
- Il y a beaucoup de forums où les gens se plaignent.
- Des Flickr groupes style « guess where LA » ou « Paris 19e » : groupes qui fonctionnent comme des espaces d’échange et appropriation du lieu et du territoire. (mais lequel : virtuelle ou réel ?)
- Zoomandgo (mashup): site de recommandations touristiques… permet de géolocaliser l’image sur une carte, une innovation de navigation.
TinEye
Est un tout nouveau moteur de recherche d’images, original et innovant à plus d’un titre et qui devrait intéresser, voire pousser Google Images et Vidéos à faire évoluer la recherche traditionnelle par mots clé pour les contenus multimédias…
Proposé en version BETA privée et bientôt en version publique, TinEye apporte notamment une rupture en terme d’usage d’un moteur de recherche d’images puisque ce n’est plus en saisissant un mot clé mais en soumettant directement une image, ou son URL, que le moteur va rechercher dans sa base de 500 millions d’images et retrouver la liste des sites où se trouve l’image en question.
Pour l’essayer, rendez-vous sur leur site pour demander une invitation.
Quelques questions pour la suite :
-est-ce qu’on aura toujours besoin du texte pour trouver/chercher des images ?
- quelle est l’importance politique (cachée) derrière tous ces sites ?
- peut-on essayer de délimiter le corpus choisi en fonction d’une analyse typologique et des usagers, peut-être par leurs âges ?
Références
- Melanie Aurnhammer, Peter Hanappe et Luc Steels, “Integrating Collaborative Tagging and Emergent Semantics for Image Retrieval”, en ligne http://ecagents.istc.cnr.it/dllink.php?id=258&type=Document
- http://www.inria.fr/recherche/equipes/imedia.fr.html
- les publications de l’équipe de Nozha Boujemaa, en ligne ici
- http://www.panoramio.com/
- le excellent billet de Pierre Nobis, “Chercher des images par l’image”,Documentation Rouen, 15/11/2008, en ligne http://documentaliste.ac-rouen.fr/spip/spip.php?article205




