Avec les soutiens du

CNRS, l'UMR LSIS, l'Association Francophone de la Commmunication Parlée, & l'Univ. du Sud Toulon-Var.

 

Ecole Recherche Multimodale d'Information

Techniques & Sciences
(ERMITES)

 

Spéciale Apprentissage Automatique et RI,


Proceedings complets ERMITES 2008 (130 pages 27Mo .pdf)

 

du 24 au 26 septembre 2008

à la Presqu'île de Giens – Var

 

(photos partielle du groupe ERMITES 2008)

 

 

ERMITES 2008 se centre sur l'apprentissage automatique pour la recherche d'information multimodale, en s'appuyant sur les campagnes d'évaluation dont Technolangue (parole), Technovision et CLEF, NIST, TREC dont la plupart des orateurs sont des acteurs. ERMITES 2008 présente les bases communes entre ces systèmes, et lance des ponts entre les différentes disciplines sollicitées. Cette dizaine de spécialistes d'analyses conjointes de textes, images, sons ou vidéos intervient sur 3 jours, avec discussions et démonstrations ouvertes. L'un des objectifs d'ERMITES, via ces exposés théoriques et empiriques, est de guider des chercheurs à concevoir des systèmes RI multimodaux incontournables de part la diffusion de plus en plus anarchique de l'information. L'originalité d'ERMITES est de mettre l'accent sur les analyses jointes de diverses modalités, démontrant l'intérêt de sortir d'un pré-carré spécifique. ERMITES se tient sur le superbe VVF de La Badine - Presqu'île de Giens-Var, (accès TGV Toulon), avec connection internet (voir http://glotin.univ-tln.fr/ERMITES pour accès). Le volume horaire total pourra être déduit de certaines sessions d’écoles doctorales.

 

 

Programme avec résumés

 

== Mercredi 24 septembre ==

 

11h - pot d’acceuil et présentation générale

 

12h - repas en terrasse mer

 

14h  - GRAVIER - CR CNRS IRISA http://www.irisa.fr/metiss

"Transcription automatique de la parole / Analyse de documents oraux"

* On présentera les fondements de base du traitement automatique de la parole, dans le cadre de l'analyse de la parole contenue dans des données multimédia. Après une présentation des différents constituants d'un système de transcription automatique de la parole, on évoquera l'évaluation, les niveaux de performances que l'on peut attendre de tels systèmes et les difficultés liées à la diversité des documents.

 

* Suite à l'exposé sur la transcription automatique de la parole, on présentera des travaux sur le traitement automatique des langues appliqué à des transcriptions automatiques dans le but de tendre à une analyse sémantique de documents contenant de la parole. On évoquera ainsi tour à tour l'analyse morphosyntaxique, la segmentation thématique, l'extraction de mots clés à l'aide de méthodes classiques de recherche d'information ainsi que la détection des entités nommés. On mettra en évidence les adaptations nécessaires des outils de traitement automatique des langues pour prendre en compte les spécificités des transcriptions automatiques.

 

16h - pause terrasse

 

16h30 - BESACIER L.- MC LIG http://www.liglab.fr

"Reconnaissance de la parole et traduction automatique pour l'interaction et le traitement de contenus multilingues"

Un des enjeux dans le domaine de l'interaction est le multilinguisme pour les communications entre humains ou entre l'homme et la machine. A ce titre, je présenterai un aperçu de l'état actuel des technologies de reconnaissance automatique de la parole multilingue et de traduction automatique probabiliste, qui ont aussi un potentiel intéressant pour le traitement de contenus audio. Des exemples de projets académiques et industriels récents sur ce thème (IBM MASTOR, projets GALE et TC-STAR) seront également présentés.

 

18h - pause

 

20h - dîner

 

== Jeudi 25 septembre ==

 

9h - FARINAS J. - MC IRIT http://www.irit.fr/recherches/SAMOVA

"Vérification Automatique de la langue/ Structuration automatique de documents AV"

* Structuration automatique de documents audiovisuels : de la recherche d'évènements saillants et de la caractérisation de l'environnement à la structuration du document. Exemple sur la caractérisation de l'environnement sonore à travers le projet ANR EPAC.

* Vérification automatique de la langue : un système automatique de classification de la parole au sein de la plateforme biométrique MISTRAL.

Les campagnes d'évaluation NIST seront également abordées dans ce cadre.

 

10h30 - pause

 

11h - MARCEL S.- Chercheur senior IDIAP / EPF Lausanne http://www.idiap.ch

"A tutorial on face detection and recognition: application to information retrieval"

In this tutorial, we will present state-of-the-art and advanced techniques in face detection and face recognition with a particular emphasis on applications such as information retrieval.

 

12h - repas terrasse

 

13h30 - TENENHAUS A. (Post-doc, CEA), NKENGNE A. (ingénieur de Recherche, J&J), FERTIL B. (DR CNRS, LSIS) http://www.lsis.org

"Un exemple de compression supervisée de données de grande dimension à l'aide de la regression PLS: prédire l'âge de personnes par photos du visage"

Nous présentons une étude qui s’intéresse aux signes du vieillissement et à leur impact sur l’âge apparent, étude réalisée afin de construire un algorithme capable de déterminer l’âge d’individus à partir de leurs photos. Dans un premier temps, sont déterminées et analysées les transformations anatomiques qui altèrent le visage à partir de l’âge adulte (au-delà de 20 ans). Puis les signes sur lesquels on se base pour prédire l’âge d’une personne sont examinés. En s’appuyant sur les observations précédentes, un modèle prédictif de l’âge est finalement construit et validé. Cette étude a été réalisée à l’aide d’une méthode linéaire de compression de données supervisée, la régression PLS (partial least squares) dont on pourra mesurer la puissance à cette occasion. En première partie, on présentera la méthode PLS, puis une  version ‘kernelisée’ de l’algorithme, à utiliser lorsque les relations entre variable à prédire et variables prédictives sortent du cadre linéaire.

 

14h45 - Susanne Still, Hawaii univ.

" Data mining and information theory : the case of robust clustering "
After some recall on information theory, we present K-means which is one of the most frequently used methods to preprocess data. One of the big problems with th is algorithm is that it gets trapped in local minima rather often. when one thinks about distance-based clustering using information theory and los sy compression, then a new algorithm emerges which produces the K-means solution , but it is much more robust to the choice of initial conditions then the K-mean s algorithm and much faster than deterministic annealing.
Reference : http://books.nips.cc/papers/files/nips16/NIPS2003_LT13.pdf

 

16h30 - pause / boissons terrasse

 

17h - KERMORVANT C. - manager R&D A2IA http://www.a2ia.com/Web_Bao/ACCUEIL-fr.aspx

"Entreprise Content Managment : extraction de données dans les documents numérisés"

Malgré l'usage croissant des documents numériques, les entreprises continuent à devoir traiter des volumes importants de documents papier : chèques, factures, fax, lettres de clients, dossiers, etc. Même si ces documents papier sont numérisés, leur traitement nécessite des techniques complexes : analyse de documents, reconnaissance de caractères (imprimés ou manuscrits), classification, extraction d'informations. Dans cet exposé, je présente un aperçu des différentes techniques mises en oeuvre dans les produits proposés par A2iA pour le traitement des documents numérisés ainsi que des exemples d'applications.

 

18h - MERIALDO B.- Pr. Eurecom Sophia http://www.eurecom.fr

"RI et indexation dans TRECVID"

Cette présentation fera le point des techniques récentes d'indexation multimédia, en particulier concernant la vidéo numérique. On s'intéressera également aux problèmes d'évaluation, et à la description des campagnes d'évaluation TrecVideo.


20h - dîner
 

== Vendredi  26 septembre ==

 

9h - QUENOT G.- CR CNRS LIG http://clips.imag.fr/mrim/

"Apprentissage actif et RI dans TRECVID"

La plupart des méthodes d'indexation par le contenu des images et des vidéos fonctionnent par apprentissage supervisé. La performance des systèmes dépend de la qualité des algorithmes d'apprentissage et de classification mais aussi de la quantité et de la qualité des annotations disponibles, lesquelles sont coûteuses à obtenir à cause de l'intervention hunaine qu'elle nécessitent. L'apprentissage actif consiste à utiliser un système de classification pour sélectionner les échantillons les plus informatifs pour l'entraînement de ce même système.

Ce cours comprend deux parties. L'introduction décrit les principes, l'histoire et les principales applications de l'apprentissage actif. Puis nous donnons une analyse détaillée d'une application de l'apprentissage actif à l'annotation de corpus et à l'indexation de concepts dans les vidéos dans le cadre de TRECVID.

 

10h30 - QUAFAFOU M.- Pr. LSIS http://www.lsis.org

"Web Multimedia Mining"

La démocratisation du web et des moyens d'acquisition, de stockage et de la diffusion de données multimédia fait émerger un univers global riche et complexe. Ce monde constitué de données multimédia distribuées sur le web est en perpétuelle évolution. Ce gisement de données hétérogène, dynamique et inconsistant par nature offre de nouvelles opportunités différentes de celles du web mining et multimédia mining. Le but de cette présentation est d'explorer ces nouveaux challenges notamment suivant la perspective de l'apprentissage automatique.

 

11h30 - LE MAITRE - Pr. LSIS http://www.lsis.org

"Indexation de page web par rapport à leur contenu et à leur rendu visuel"

Les concepteurs de page web organisent les informations qu'elles contiennent de façon à faciliter leur consultation par les utilisateurs. Une page web peut être vue comme un ensemble de blocs contenant des informations multimédia (texte, image, vidéo). L'apparence visuelle d'un bloc (fonte, couleur de fond...) et sa position dans la page fournit une information sur son importance. De plus, un bloc peut apporter de l'information à un autre bloc (voisin, englobant, etc.). Par exemple, le texte entourant une image ou la référençant peut être utilisé pour indexer cette image. Un autre avantage de la prise en compte du découpage d'une page en blocs est la possibilité de localiser les réponses à une requête : les blocs les plus similaires sont retournés plutôt que les pages dans leur totalité. La précision et l'exhaustivité des réponses à une requête à des pages web pourraient donc être significativement améliorées en prenant en compte le rendu visuel de ces pages en plus de leur contenu sémantique. Dans cet exposé seront présentés : les principales techniques de segmentation d'une page web à partir le leur arbre DOM, les techniques d'évaluation de l'importance d'un bloc dans une page et le modèle d'indexation d'une page web conçu dans le cadre d'un travail de recherche mené au sein de l'équipe INCOD du LSIS. Les premiers résultats de l'application de ce modèle à l'interrogation de journaux électroniques seront aussi présentés.

 

13h - repas terrasse mer

 

14h15 - table ronde de clôture.

 

****************

 INSCRIPTION 

 

Nb : Les premiers inscrits sont prioritaires. Nombre de participants limité à 32, il reste 8 places en cette fin juillet.
Paiement par chèque ou bon de Commande à l'AFCP.

3 BOURSES de 150 euros sont offertes par l'AFCP, en faire la demande lors de votre inscription.

 

** Tarifs ** (incluant 2 nuits, 7 repas, 6 pauses boissons / cafés, actes, connection internet...):

 

En chambre avec 2 lits simples séparés :

Doctorant, Postdoc, Master = 260 euros

Autres = 390 euros.

 

En chambre avec 1 lit simple :

Doctorant, Postdoc, Master = 300 euros.

Autres = 420 euros.

 

Formule avec seulement repas et actes (sans nuit ni pt. dej.) = 150 euros

 

==============================================

Bon d’inscription à découper et renvoyer par Email et poste.

 

BULLETIN  D’INSCRIPTION à ERMITES 2008

Ecole Recherche Multimodale d’Information - Techniques & Sciences

Spéciale Apprentissage   -  http://glotin.univ-tln.fr/ERMITES
du 24 au 26 sept 2008 - Presqu’île de Giens - Var
 avec les soutiens du CNRS, LSIS, DI  UFR ST USTV, USTV
et de l'Association Francophone de la Commmunication Parlée (AFCP)

 

A renvoyer par Email, et par la poste avec le chèque ou le bon de commande à :

H.     GLOTIN, LSIS

Univ. Sud Toulon-Var, 

Av. de l’Université, BP20132  83957 La Garde Cedex France

glotin@univ-tln.fr  (sujet email = ERMITES)

 

NOM PRENOM de l’inscrit:

UNIVERSITE / LABORATOIRE/ ENTREPRISE:
ADRESSE professionnelle:

 


TELEPHONE:                                                             FAX:

E-MAIL (en capitales) :


Tarifs incl. 2 nuits, 7 repas, pauses boissons / cafés, actes papier,…

* En chambre avec 2 lits simples (séparés):

 Doctorant, Postdoc ou Master = 260 euros.
 Autres = 390 euros.

* En chambre une seule personne:
 Doctorant, Postdoc ou Master = 300 euros.
 Autres = 420 euros.

* Formule avec seulement repas et actes (sans nuit ni petit déjeuner) = 150 euros.


TOTAL A PAYER =


[ ] Les frais d’inscription sont réglés par chèque à l’ordre du « Trésorier de  l’AFCP »,

ou

[ ]  par Bon de Commande pour l'AFCP (voir références ci-dessous).


 

ORGANISME RESPONSABLE  DU  REGLEMENT:

 

ADRESSE:

 

CODE POSTAL:                                          VILLE:                                                          PAYS:

Domiciliation : Société Générale – Grenoble

 

Les organisateurs

H. Glotin & J. Le Maitre