Avec
les soutiens du
CNRS,
l'UMR LSIS, l'Association Francophone de la Commmunication Parlée,
&
l'Univ.
du
Sud
Ecole
Recherche Multimodale d'Information
Techniques
& Sciences
(ERMITES)
Spéciale
Apprentissage Automatique et RI,
du
24 au 26 septembre 2008
à
la Presqu'île de Giens – Var
(photos partielle du groupe ERMITES 2008)
ERMITES
2008 se centre sur l'apprentissage automatique pour la recherche
d'information
multimodale, en s'appuyant sur les campagnes d'évaluation dont
Technolangue (parole),
Technovision et CLEF, NIST, TREC dont la
plupart des
orateurs sont des acteurs. ERMITES 2008 présente les bases communes
entre ces systèmes, et lance des ponts entre les différentes
disciplines
sollicitées. Cette dizaine de spécialistes d'analyses conjointes de
textes,
images, sons ou vidéos intervient sur 3 jours, avec discussions et démonstrations ouvertes. L'un des objectifs
d'ERMITES,
via ces exposés théoriques et empiriques,
est de
guider des chercheurs à concevoir des systèmes RI multimodaux
incontournables
de part la diffusion de plus en plus anarchique de l'information. L'originalité d'ERMITES est de mettre l'accent sur les
analyses
jointes de diverses modalités, démontrant l'intérêt de sortir d'un
pré-carré
spécifique. ERMITES se tient sur le superbe
VVF de La
Badine - Presqu'île de Giens-Var, (accès TGV Toulon), avec connection
internet
(voir http://glotin.univ-tln.fr/ERMITES
pour accès). Le volume horaire total pourra être déduit
de certaines
sessions d’écoles doctorales.
Programme
avec résumés
==
Mercredi 24 septembre ==
11h
- pot d’acceuil et
présentation générale
12h
- repas en terrasse mer
14h
-
GRAVIER
- CR CNRS IRISA http://www.irisa.fr/metiss
"Transcription
automatique de la parole / Analyse de documents oraux"
*
On
présentera les fondements de base du traitement automatique de la
parole, dans le
cadre de l'analyse de la parole contenue dans des données multimédia.
Après une
présentation des différents constituants d'un système de transcription
automatique de la parole, on évoquera l'évaluation, les niveaux de
performances
que l'on peut attendre de tels systèmes et
les
difficultés liées à la diversité des documents.
*
Suite
à l'exposé sur la transcription automatique de la parole, on présentera
des
travaux sur le traitement automatique des langues appliqué à des
transcriptions
automatiques dans le but de tendre à une analyse sémantique de
documents
contenant de la parole. On évoquera ainsi tour à tour l'analyse
morphosyntaxique, la segmentation thématique, l'extraction de mots clés
à
l'aide de méthodes classiques de recherche d'information ainsi que la
détection
des entités nommés. On mettra en évidence les
adaptations
nécessaires des outils de traitement automatique des langues pour
prendre en
compte les spécificités des transcriptions automatiques.
16h
-
pause terrasse
16h30
-
BESACIER L.- MC LIG http://www.liglab.fr
"Reconnaissance
de la parole et traduction automatique pour l'interaction et le
traitement de
contenus multilingues"
Un
des enjeux dans le domaine de l'interaction est le multilinguisme pour
les
communications entre humains ou entre l'homme et la machine. A ce titre, je présenterai un aperçu de l'état
actuel des
technologies de reconnaissance automatique de la parole multilingue et
de
traduction automatique probabiliste, qui ont aussi un potentiel
intéressant
pour le traitement de contenus audio. Des exemples de projets
académiques et industriels récents sur ce
thème (IBM MASTOR, projets
GALE et TC-STAR) seront également présentés.
18h
-
pause
20h
-
dîner
==
Jeudi 25 septembre ==
9h
-
FARINAS J. - MC IRIT http://www.irit.fr/recherches/SAMOVA
"Vérification
Automatique de la langue/ Structuration automatique de documents AV"
*
Structuration automatique de documents audiovisuels
:
de la recherche d'évènements saillants et de la caractérisation de
l'environnement à la structuration du document. Exemple sur la
caractérisation
de l'environnement sonore à travers le
projet ANR
EPAC.
*
Vérification automatique de la langue : un
système
automatique de classification de la parole au sein de la plateforme
biométrique
MISTRAL.
Les
campagnes d'évaluation NIST seront également abordées dans ce
cadre.
10h30
-
pause
11h
- MARCEL
S.- Chercheur senior IDIAP / EPF
"A
tutorial on face detection and recognition: application to information
retrieval"
In
this
tutorial, we will present state-of-the-art and advanced techniques in
face
detection and face recognition with a particular emphasis on
applications such
as information retrieval.
12h
-
repas terrasse
13h30 - TENENHAUS A.
(Post-doc, CEA), NKENGNE A. (ingénieur de Recherche, J&J), FERTIL
B. (DR
CNRS, LSIS) http://www.lsis.org
"Un exemple
de compression supervisée de données de grande dimension à l'aide de la
regression PLS: prédire l'âge de personnes par photos du visage"
Nous
présentons une étude qui s’intéresse aux signes du vieillissement et à
leur
impact sur l’âge apparent, étude réalisée afin de construire un
algorithme
capable de déterminer l’âge d’individus à partir de leurs photos. Dans
un
premier temps, sont déterminées et analysées les transformations
anatomiques
qui altèrent le visage à partir de l’âge adulte (au-delà de 20 ans).
Puis les
signes sur lesquels on se base pour prédire l’âge d’une personne sont
examinés.
En s’appuyant sur les observations précédentes, un modèle prédictif de
l’âge
est finalement construit et validé. Cette étude a été réalisée à l’aide
d’une
méthode linéaire de compression de données supervisée, la régression
PLS
(partial least squares) dont on pourra mesurer la puissance à cette
occasion.
En première partie, on présentera la méthode PLS, puis une
version ‘kernelisée’ de l’algorithme, à
utiliser lorsque les relations entre variable à prédire et variables
prédictives sortent du cadre linéaire.
14h45 - Susanne Still, Hawaii univ.
16h30
- pause / boissons terrasse
17h
- KERMORVANT C. - manager R&D
A2IA http://www.a2ia.com/Web_Bao/ACCUEIL-fr.aspx
"Entreprise
Content Managment : extraction de données
dans les
documents numérisés"
Malgré
l'usage croissant des documents numériques, les entreprises continuent
à devoir
traiter des volumes importants de documents papier
:
chèques, factures, fax, lettres de clients, dossiers, etc. Même si ces
documents papier sont numérisés, leur traitement nécessite des
techniques complexes : analyse de
documents, reconnaissance de
caractères (imprimés ou manuscrits), classification, extraction
d'informations.
Dans cet exposé, je présente un aperçu des différentes techniques mises
en
oeuvre dans les produits proposés par A2iA pour le traitement des
documents
numérisés ainsi que des exemples d'applications.
18h
- MERIALDO
B.- Pr. Eurecom Sophia http://www.eurecom.fr
"RI
et indexation dans TRECVID"
Cette
présentation fera le point des techniques
récentes
d'indexation multimédia, en particulier concernant la vidéo numérique.
On
s'intéressera également aux problèmes d'évaluation, et
à la description des campagnes d'évaluation TrecVideo.
==
Vendredi 26
septembre
==
9h
- QUENOT
G.- CR CNRS LIG http://clips.imag.fr/mrim/
"Apprentissage
actif et RI dans TRECVID"
La
plupart des méthodes d'indexation par le contenu des images et
des vidéos fonctionnent par apprentissage supervisé. La performance des
systèmes dépend de la qualité des algorithmes d'apprentissage et de classification mais aussi de la quantité et
de la
qualité des annotations disponibles, lesquelles sont coûteuses à
obtenir à
cause de l'intervention hunaine qu'elle nécessitent. L'apprentissage
actif
consiste à utiliser un système de
classification pour
sélectionner les échantillons les plus informatifs pour l'entraînement
de ce
même système.
Ce
cours comprend deux parties.
L'introduction décrit
les principes, l'histoire et les
principales
applications de l'apprentissage actif. Puis nous donnons une analyse
détaillée
d'une application de l'apprentissage actif à l'annotation de corpus et à l'indexation de concepts dans les vidéos
dans le cadre
de TRECVID.
10h30
-
QUAFAFOU M.- Pr. LSIS http://www.lsis.org
"Web
Multimedia Mining"
La
démocratisation du web et des moyens
d'acquisition, de
stockage et de la diffusion de données multimédia fait émerger un
univers global
riche et complexe. Ce monde constitué de données multimédia distribuées
sur le
web est en perpétuelle évolution. Ce
gisement de
données hétérogène, dynamique et
inconsistant par
nature offre de nouvelles opportunités différentes de celles du web
mining et
multimédia mining. Le but de cette présentation est
d'explorer ces nouveaux challenges notamment suivant la perspective de
l'apprentissage automatique.
11h30
-
LE MAITRE - Pr. LSIS http://www.lsis.org
"Indexation
de page web par rapport à leur contenu et à leur rendu visuel"
Les
concepteurs de page web organisent les informations qu'elles
contiennent de
façon à faciliter leur consultation par les utilisateurs.
Une page web peut être vue comme un
ensemble de blocs
contenant des informations multimédia (texte, image, vidéo).
L'apparence
visuelle d'un bloc (fonte, couleur de fond...) et
sa
position dans la page fournit une information sur son importance. De
plus, un bloc peut apporter de
l'information à un autre bloc
(voisin, englobant, etc.). Par exemple, le texte entourant une image ou
la
référençant peut être utilisé pour indexer cette image. Un autre
avantage de la
prise en compte du découpage d'une page en blocs est la possibilité de
localiser les réponses à une requête : les
blocs les
plus similaires sont retournés plutôt que les pages dans leur totalité.
La
précision et l'exhaustivité des réponses à
une requête
à des pages web pourraient donc être significativement améliorées en
prenant en
compte le rendu visuel de ces pages en plus de leur contenu sémantique.
Dans
cet exposé seront présentés : les
principales
techniques de segmentation d'une page web à partir le leur arbre DOM,
les
techniques d'évaluation de l'importance d'un bloc dans une page et le
modèle
d'indexation d'une page web conçu dans le cadre d'un travail de
recherche mené
au sein de l'équipe INCOD du LSIS. Les premiers résultats de
l'application de ce modèle à
l'interrogation de journaux électroniques seront
aussi présentés.
13h
-
repas terrasse mer
14h15
-
table ronde de clôture.
****************
INSCRIPTION
Nb
:
Les premiers inscrits sont prioritaires. Nombre de
participants limité à 32, il reste 8 places
en cette
fin juillet.
Paiement par chèque ou bon de Commande à l'AFCP.
3
BOURSES de 150 euros sont offertes par l'AFCP, en faire la demande lors
de
votre inscription.
**
Tarifs ** (incluant
2 nuits, 7 repas, 6 pauses boissons / cafés, actes, connection
internet...):
En
chambre avec 2 lits simples séparés :
Doctorant,
Postdoc, Master = 260 euros
Autres
= 390 euros.
En
chambre avec 1 lit simple
:
Doctorant,
Postdoc, Master = 300 euros.
Autres
= 420 euros.
Formule
avec seulement repas et actes (sans nuit ni
pt. dej.) = 150 euros
==============================================
Bon
d’inscription à découper et renvoyer par
Email et
poste.
BULLETIN
D’INSCRIPTION à ERMITES 2008
Ecole Recherche Multimodale
d’Information - Techniques
& Sciences
Spéciale
Apprentissage -
http://glotin.univ-tln.fr/ERMITES
du
24 au 26 sept
2008 - Presqu’île de Giens - Var
avec les soutiens du CNRS, LSIS, DI UFR ST
USTV, USTV
et
de l'Association Francophone de la Commmunication Parlée
(AFCP)
A
renvoyer par Email, et par la poste avec le chèque ou le bon de
commande à :
H.
GLOTIN,
Av. de
l’Université, BP20132 83957
La
Garde Cedex France
glotin@univ-tln.fr (sujet email = ERMITES)
NOM PRENOM de l’inscrit:
UNIVERSITE / LABORATOIRE/ ENTREPRISE:
ADRESSE professionnelle:
TELEPHONE:
FAX:
E-MAIL (en capitales) :
Tarifs incl. 2 nuits, 7
repas, pauses boissons / cafés, actes papier,…
* En chambre avec 2 lits simples (séparés):
Doctorant,
Postdoc ou Master = 260 euros.
Autres = 390 euros.
* En chambre une seule personne:
Doctorant, Postdoc ou Master = 300
euros.
Autres = 420 euros.
* Formule avec seulement repas et actes
(sans nuit ni
petit déjeuner) = 150 euros.
TOTAL A PAYER =
[ ] Les frais d’inscription sont réglés par chèque à l’ordre du « Trésorier de l’AFCP »,
ou
[ ] par Bon de Commande pour l'AFCP (voir références ci-dessous).
ORGANISME RESPONSABLE
DU
REGLEMENT:
ADRESSE:
CODE POSTAL:
VILLE:
PAYS:
Domiciliation :
Société Générale – Grenoble
Les
organisateurs
H.
Glotin & J. Le Maitre