Liens aux anciens ERMITES Programme 2010 Actes 2010 avec liens video (30 Mo)

Soutenue par l'INRIA et l'UMR Sciences de l'Information & des Systèmes (LSIS), l'Université du Sud Toulon-Var, TPM, et le projet ANR COGNILEGO

5ième Ecole Recherche Multimodale d'Information -
Techniques & Sciences

[ ERMITES 2010 ]

COGNIVISION : VISION & COGNITION

28 - 30 Septembre 2010
Presqu'île de Giens

Club Belambra VVF La Badine

Proceedings, including the video links to the tutorials (428 pages 32Mo .pdf)

Ermites 2010 est dédiée à l'analyse des processus de vision, à leurs modélisations
et à leurs applications en recherche d'information multimodale

Détails sur les éditions précédentes : http://glotin.univ-tln.fr/ERMITES

Ouvert aux masters, élèves ingénieurs, doctorants, enseignants et chercheurs

LSIS - UMR CNRS 6168 -- Equipe DYNI

Programme ERMITES 2010

Presqu'île de Giens
28 septembre midi au 30 septembre midi

MODELES DE PERCEPTION & CATEGORISATION VISUELLES

--------

Jeanny Hérault Pr. (GIPSA Lab. / UJF)
Dernier ouvrage
" Perception Visuelle, faits et modèles " (3h)

Après une introduction basée sur quelques illusions visuelles, cet exposé donne une description de la rétine avec son architecture, son codage de la couleur et ses fonctions de filtrage et d'adaptation. Puis nous décrivons le cortex visuel primaire avec son analyse locale de l'image, et une application de son modèle à la catégorisation de scène et à l'estimation de la perspective monoculaire.

Réf. : "VISION: IMAGES, SIGNALS AND NEURAL NETWORKS Models of Neural Processing in Visual Perception" J. Herault, Ed. Worldscibooks 2010 march, 308 pages http://www.worldscibooks.com/compsci/7311.html#

---------

Petitot J. Pr. (EHESS / X)
http://www.crea.polytechnique.fr/JeanPetitot/home.html
" Modèles neurogéométriques de Vision " (2h)

On proposera un modèle géométrique de l'architecture fonctionnelle du cortex visuel primaire (aire V1) et on explicitera les algorithmes géométriques que cette dernière implémente, autrement dit la "neurogéométrie" immanente à la perception visuelle. Le filtrage du signal optique par les neurones visuels s'apparente à une analyse en ondelettes. La structure de contact de l'espace des 1-jets des courbes du plan (ici le plan rétinien) se trouve implémentée par l'architecture fonctionnelle.

L'intégration des contours à partir de données sensorielles éventuellement très lacunaires sont modélisables en termes de la géométrie sous-riemannienne associée à cette structure de contact.

---------

Ugo Boscain Pr. SISSA / Italie
http://www.cmapx.polytechnique.fr/~boscain/
" Anthropomorphic image reconstruction via hypoelliptic diffusion " (2h30)

We present a model of geometry of vision which generalizes one due to Petitot, Citti and Sarti. One of the main features is that the primary visual cortex V1 lifts the image from R2 to the bundle of directions of the plane P T R2 = R2 × P 1. In this model a corrupted image is reconstructed by minimizing the energy necessary to activate the orientation columns corresponding to regions in which the image is corrupted. The minimization process gives rise to an hypoelliptic heat equation on PTR^2. The hypoelliptic heat equation is studied using generalized Fourier transform.

---------

Touzet C. MC (LNIA / Univ. Med.)
http://www.univ-provence.fr/gsite/document.php?project=umr_6149&doc=perso_touzet
" Modèles cognitifs de l'attention visuelle " (2h)

Notre modélisation implique de multiples cartes corticales organisées au sein de hiérarchies, chaque carte corticale jouant le rôle d'un filtre de nouveauté, passant au niveau hiérarchique suivant (« bottom-up ») les événements imprévus : c'est l'attention exogène. Des connexions « top-down » suffisamment nombreuses permettent la mise en place d'une véritable pré-activation de l'ensemble de la hiérarchie en fonction du but identifié à un niveau quelconque de la hiérarchie : c'est l'attention endogène. Notons que la modélisation réussie du système attentionnel est un pas en avant majeur dans le cadre d'une théorie neuronale de la cognition.

---------

Gauthier J.-P. Pr. (LSIS / USTV)
http://iuf.amue.fr/author/jgauthier/

" Sur les mécanismes mis en oeuvre par le système nerveux central " (2h)

On prouve le "Théorème" suivant: Le système nerveux central minimise quelque chose comme le travail absolu, c'est à dire la dépense effective d'énergie non signée. Cette preuve repose sur 3 points: L'observation systématique de l'apparition de périodes de silence de l'activité musculaire (agoniste et simultanément antagoniste) dans les mouvements de pointage ; le principe du maximum de Pontriaguin ; et le théorème de transversalité (Thom).

Réf.: " The Inactivation Principle: Mathematical Solutions minimizing the Absolute Work and Biological Implications for the Planning of Arm Movements " Gauthier and al., PLoS Comput. Biol. 4 (2008), N10, http://www.lsis.org/gauthierjp/papers/114.pdf " A biomechanical inactivation principle ", Gauthier, Proceedings of the Steklov Mathematical Institute, Vol 268, 2010.

---------

Le Borgne H. IR (CEA-LIST)
http://elm.eeng.dcu.ie/~hlborgne/
" Analyse en composantes indépendantes visuelles " (3h)

De nombreuses études montrent que les détecteurs corticaux pourraient résulter de l'application d'un principe de réduction de redondance par indépendance statistique de leurs activités. Nous utilisons l'Analyse en Composantes Indépendantes (ACI) pour générer de tels détecteurs, et en effectuons une analyse quantitative mettant en valeur l'adaptation des détecteurs aux catégories d'images considérées. Les applications visées concernent l'indexation d'images et de vidéos, pour laquelle divers schéma de codage de l'information sont proposés. Ces travaux entrent dans le cadre plus large des rapports entre perception visuelle et sciences de l'ingénieur, dont les apports réciproques permettent une meilleure compréhension de chacun des domaines.

--------

Mairal J. (ENS / INRIA WILOW)
http://www.di.ens.fr/~mairal/publications.php
" Sparse Coding and Dictionary Learning " (2h)

La modélisation parcimonieuse de signaux consiste à représenter des données vectorielles comme une combinaison linéaire d'un petit nombre d'éléments d'un dictionnaire. Définir un dictionnaire adapté à une classe de signaux telle que les images naturelles, a donné lieu à de nombreux travaux. Nous nous intéresserons ici à une approche récente qui consiste à apprendre le dictionnaire à partir de données d'entraînement. Nous présenterons de récentes avancées utilisant cette technique en traitement d'image, apprentissage statistique et vision par ordinateur pour la reconnaissance d'objets.

--------

Jégou H. CR (INRIA / IRISA)
http://www.irisa.fr/texmex/people/jegou/
" Recherche d'image à grande échelle: procédés d'aggrégation & d'indexation " (3h)

Cet exposé sera axé sur la recherche d'image dans de très grandes bases d'images et de vidéos, pour lesquelles de nombreuses approches ont récemment été proposées tant du point de vue de la description que des stratégies d'indexation associées. Du point de vue de la description, nous nous intéresserons en particulier :
(i) à la comparaison de techniques d'aggrégation vectorielles de descripteurs locaux, où des alternatives aux approches par sac-de-mots ont récemment émergées pour la recherche et la classification d'images,
(ii) et aux techniques d'indexation récentes permettant d'indexer ces représentations.

--------

Paris S. MC (LSIS / Univ. Med.)
http://www.mathworks.com/matlabcentral/fileexchange/authors/13308
" Dynamique de la vision & auto-localisation robotique " (3h)

Cette présentation liée au challenge RobotVision@ICPR 2010 fait un tour d'horizon de la chaîne complète de traitement et des différentes techniques (basées sur de la vision et du machine learning) dédiées à la tache de catégorisation (dynamique) de scènes d'intérieur. Ce tour d'horizon commencera par une revue des descripteurs locaux/globaux utilisés ( LBP, spHOG, SIFT, etc... ), des techniques d'encodage des descripteurs en dictionnaires visuels (VQ, soft VQ, Sparse Coding, etc...), en passant par les classifieurs à vastes marges dédiés aux grandes échelles (FastIKSVM, Liblinear, etc...) sur noyaux potentiellement multiples (MKL, GMKL, etc...). Nous montrons comment intégrer à cet ensemble la dynamique de l'état (approche HMM, particulaire, etc...), et abouti au meilleur modèle [Paris & Glotin, IAPR Int. Conf Pattern Recognition 2010] de localisation robotique dans le challenge ImageClef ICPR 2010.

--------

Comité de programme :
H. Glotin (pres), S. Paris, J Razik, J.-P. Gauthier

Comité d'organisation:
S. Paris (pres), J. Razik, H. Glotin, A. Zidouni, F. Bénard, M. Chouchane

* BON d' INSCRIPTION *

Ecole Recherche Multimodale d'Information - Techniques & Sciences
Spéciale Cognition & Vision - http://glotin.univ-tln.fr/ERMITES10
du 28 au 30 sept 2010
avec les soutiens de l'INRIA, le l'UMR CNRS LSIS, et de l'USTV

Site : Club Belambra vvf La Badine 406 avenue de l'Esterel Presqu'ile de Giens 83400 Hyeres Web : www.belambra-vvf.fr Position GPS : 43.030792N 6.159554E voir http://glotin.univ-tln.fr/ERMITES pour informations sur le lieux et editions precedentes.
Inscription et paiement avant le 13 septembre (date limite), et limitée aux 32 premiers inscrits.

Envoyer ce bon par Email à ermites@gmail.com (sujet ERMITES10), et par courrier papier avec le paiement (bon de commande ou chèque à l'ordre du "Trésorier de l'AFCP"). Adresse du courrier papier : M. J. Razik, LSIS Univ. Sud-Toulon Var, Bat R, Av. de l'Université, BP 20132, 83957 La Garde Cedex France

Nom et Prénom de l'inscrit =

Université / Laboratoire / Entreprise =

Adresse =

Tél =

Email =

5ième Ecole Recherche Multimodale d'Information - Techniques & Sciences [ ERMITES 2010 ] COGNIVISION : VISION & COGNITION

28 - 30 Septembre 2010 Presqu'île de Giens

Ermites 2010 est dédiée à l'analyse des processus de vision, à leurs modélisations et à leurs applications en recherche d'information multimodale