Planning

8h30-9h00 Accueil des participants
9h00-9h10

Ouverture du séminaire

M. Ali Chérif (Directeur du LIASD)

M. Boulanger (Directeur de l'IUT)

9h10-9h20

Présentation de la recherche en Informatique à l'IUT de Montreuil

Pr. M. Lamolle

 

 SESSION 1 : Represéntation de connaissances et linguistique

Animateur : Aurélien Bossard

9h20-10h05

C. Fluhr  - Text mining de données personnelles, aspects techniques et déontologiques

Résumé: Les différents problèmes techniques à résoudre dans le cadre de l’extraction, à partir de textes en différentes langues, de données structurées concernant des personnes seront présentés à partir de l’expérience acquise par notre société dans le cadre de plusieurs projets. L’aspect technique n’est pas le seul à prendre en compte pour ce type de R&D. Les aspects légaux et déontologiques doivent être considérés tant lors de la phase de recherche que dans celle de la valorisation sous forme de produits

Bio: Christian Fluhr est un spécialiste du traitement des langues depuis 1971. Ses travaux ont porté au départ sur les moteurs de recherches utilisant des traitements linguistiques lors de l’indexation et de l’interrogation. Il a été à l’origine de l’un des premiers systèmes industriels de ce type (SPIRIT) et leader du premier projet européen d’interrogation interlingue (EMIR). Il se consacre depuis les années 2000 à l’extraction sémantique à partir de texte multilingues.

10h05-10h50

A. Nazarenko  -  Les défis de l'accès à l'information juridique

Résumé : Faciliter l'accès à l'information juridique est aujourd'hui à la fois un enjeu de société et un défi scientifique du fait de la complexité linguistique, structurelle et juridique des sources du Droit. Cette présentation souligne l'importance de l'intertextualité et de la règle dans le raisonnement juridique et montre comment les outils d'accès sémantique au contenu peuvent les prendre en compte.

Bio : Spécialiste du traitement automatique des langues, Adeline Nazarenko est Professeur d'informatique à l'Université Paris 13 -- Sorbonne Paris Cité. Elle s'intéresse en particulier aux problèmes de l'ingénierie des connaissances textuelles : acquisition de connaissances à partir de textes, annotation sémantique et accès au contenu. Elle a été longtemps responsable de l'équipe "Représentation des Connaissances et Langage Naturel" du LIPN et elle est directrice adjointe du Labex "Fondements empiriques de la linguistique" où elle coordonne notamment les activités de traitement automatique des langues.

Pause Café de 10h50-11h15

SESSION 2 : Forum Jeunes Chercheurs

Animateur : Mario Cataldi

11h15-12h15

Présentation en 5' des auteurs

+

LearningCafé, Démo d'une application d'e-learning fondée sur des vidéos pour des métiers manuels

Déjeuner de 12h15 à 13h45

<======== SESSION POSTER ==============>

SESSION 3 : Applications

Animateur : Myriam Lamolle

13h45-14h30

 F.-P. Servant - Utilisation des techniques du Semantic Web chez Renault

Résumé: Les techniques du web de données sont utilisées par Renault dans un certain nombre d’applications qui ont pour point commun de publier les données qu’elles gèrent. En ce qui concerne les SI de l'entreprise, la mise en œuvre des principes des Linked Data, associée à la modélisation des données en RDF, facilite l’agrégation, l’échange, la réutilisation et l’enrichissement des données, tout en améliorant leur pérennité. Ces méthodes permettent ainsi de diminuer le coût de l’accès aux données (une composante majeure du prix des développements des SI). A titre d’illustration, une application dans le domaine de la documentation technique sera présentée. Ces techniques sont aussi utilisées pour publier, sur le web, une description de l’offre commerciale Renault sous forme de données liées, qui permettent d’implémenter simplement un configurateur véhicule (“configuration as linked data”). En dépit du nombre de configurations différentes (plus de 10^20), nous montrerons comment les moteurs de recherche pourraient utilement indexer ces données, dans le cadre de schema.org.

Bio : Diplômé de l'École des Mines de Nancy, il travaille actuellement pour Renault au sein de l’équipe « Intelligence Artificielle Appliquée » qui développe des logiciels de raisonnement. Il a introduit le Semantic Web chez Renault où il a mis en exergue les bénéfices possibles au travers de plusieurs prototypes, notamment à partir des notions liées au domaine du « Linked Data ». Il a publié dans diverses conférences internationales telles que ESWC, LDOW, EC-Web (cf. dblp).

14h30-15h15

G. Atemezing (Mondeca) - Making Sense of Content

Résumé : cette   présentation   a   pour   but   principal   de   montrer   l’importance   du   Web   sémantique   dans   les   choix   technologiques   de   Mondeca,   une   PME   d’édition   de   solutions  sémantiques   basée   à   Paris.   En   partant   des   problèmes   concrets   en   entreprise,   avec des   sources   de   données   hétérogènes;   nous   montrons   que   des   solutions   basées   sur les   ontologies   apportent   de   la   valeur   ajoutée   pour   une   gestion   efficace  de l’information.  Des  applications   dans   divers   domaines   (santé,   média,   géographie, tourisme)  montrent que l’avenir dans la gestion de l’information en entreprise passe par la   maîtrise des métadonnées. Pour cela, les standards du W3C apportent de la souplesse dans la   transformation de la donnée brute en connaissances pour de nouvelles applications innovantes.

Bio: Diplômé en Master Informatique en Intelligence Artificielle à l’Université Polytechnique de Madrid., Il a ensuite obtenu son Ph.D en 2015 de Telecom ParisTech sur le sujet “La représentation et la publication des données géographiques sur le Web des données”. Depuis 2012, il participe et collabore à plusieurs groupes de travail du W3C, W3C Data On the Web Best Practices Working Group, W3C Locations and Addresses Community Group, W3C Government Linked Data Working Group (GLD). Il a contribué activement au projet DATALIFT, projet de mise en place d’outils pour l’élévation et la sémantisation des données comme au projet LOV (Linked open Vocabularies). Au sein de Mondeca il est responsable du labs de Mondeca ( labs.mondeca.com ).

15h15-16h00

B. Safar - Annotation sémantique de documents

Résumé : Dans notre contexte où les concepts utilisés pour l'annotation traduisent des besoins utilisateurs et sont donc très spécifiques, la tâche d'annotation est confrontée à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas présentes dans les documents mêmes. La solution proposée s'appuie sur une ontologie, la recherche d'information sur le LOD et des techniques d'apprentissage.

Bio

Pause Café de 16h00-16h30

TABLE RONDE et Remise du Prix WORKS-Web, AFIA - Jeunes Chercheurs de 16h30 à 17h30

                                                  Animateurs : Myriam Lamolle / Ernesto Exposito                                              

Clôture de la journée à 17h30