Planning
8h30-9h00 | Accueil des participants |
9h00-9h10 |
Ouverture du séminaire M. Ali Chérif (Directeur du LIASD) M. Boulanger (Directeur de l'IUT) |
9h10-9h20 |
Présentation de la recherche en Informatique à l'IUT de Montreuil Pr. M. Lamolle |
SESSION 1 : Represéntation de connaissances et linguistique Animateur : Aurélien Bossard |
|
9h20-10h05 |
C. Fluhr - Text mining de données personnelles, aspects techniques et déontologiques Résumé: Les différents problèmes techniques à résoudre dans le cadre de l’extraction, à partir de textes en différentes langues, de données structurées concernant des personnes seront présentés à partir de l’expérience acquise par notre société dans le cadre de plusieurs projets. L’aspect technique n’est pas le seul à prendre en compte pour ce type de R&D. Les aspects légaux et déontologiques doivent être considérés tant lors de la phase de recherche que dans celle de la valorisation sous forme de produits Bio: Christian Fluhr est un spécialiste du traitement des langues depuis 1971. Ses travaux ont porté au départ sur les moteurs de recherches utilisant des traitements linguistiques lors de l’indexation et de l’interrogation. Il a été à l’origine de l’un des premiers systèmes industriels de ce type (SPIRIT) et leader du premier projet européen d’interrogation interlingue (EMIR). Il se consacre depuis les années 2000 à l’extraction sémantique à partir de texte multilingues. |
10h05-10h50 |
A. Nazarenko - Les défis de l'accès à l'information juridique Résumé : Faciliter l'accès à l'information juridique est aujourd'hui à la fois un enjeu de société et un défi scientifique du fait de la complexité linguistique, structurelle et juridique des sources du Droit. Cette présentation souligne l'importance de l'intertextualité et de la règle dans le raisonnement juridique et montre comment les outils d'accès sémantique au contenu peuvent les prendre en compte. Bio : Spécialiste du traitement automatique des langues, Adeline Nazarenko est Professeur d'informatique à l'Université Paris 13 -- Sorbonne Paris Cité. Elle s'intéresse en particulier aux problèmes de l'ingénierie des connaissances textuelles : acquisition de connaissances à partir de textes, annotation sémantique et accès au contenu. Elle a été longtemps responsable de l'équipe "Représentation des Connaissances et Langage Naturel" du LIPN et elle est directrice adjointe du Labex "Fondements empiriques de la linguistique" où elle coordonne notamment les activités de traitement automatique des langues. |
Pause Café de 10h50-11h15
SESSION 2 : Forum Jeunes Chercheurs Animateur : Mario Cataldi |
|
11h15-12h15 |
Présentation en 5' des auteurs + LearningCafé, Démo d'une application d'e-learning fondée sur des vidéos pour des métiers manuels |
Déjeuner de 12h15 à 13h45
<======== SESSION POSTER ==============>
SESSION 3 : Applications Animateur : Myriam Lamolle |
|
13h45-14h30 |
F.-P. Servant - Utilisation des techniques du Semantic Web chez Renault Résumé: Les techniques du web de données sont utilisées par Renault dans un certain nombre d’applications qui ont pour point commun de publier les données qu’elles gèrent. En ce qui concerne les SI de l'entreprise, la mise en œuvre des principes des Linked Data, associée à la modélisation des données en RDF, facilite l’agrégation, l’échange, la réutilisation et l’enrichissement des données, tout en améliorant leur pérennité. Ces méthodes permettent ainsi de diminuer le coût de l’accès aux données (une composante majeure du prix des développements des SI). A titre d’illustration, une application dans le domaine de la documentation technique sera présentée. Ces techniques sont aussi utilisées pour publier, sur le web, une description de l’offre commerciale Renault sous forme de données liées, qui permettent d’implémenter simplement un configurateur véhicule (“configuration as linked data”). En dépit du nombre de configurations différentes (plus de 10^20), nous montrerons comment les moteurs de recherche pourraient utilement indexer ces données, dans le cadre de schema.org. Bio : Diplômé de l'École des Mines de Nancy, il travaille actuellement pour Renault au sein de l’équipe « Intelligence Artificielle Appliquée » qui développe des logiciels de raisonnement. Il a introduit le Semantic Web chez Renault où il a mis en exergue les bénéfices possibles au travers de plusieurs prototypes, notamment à partir des notions liées au domaine du « Linked Data ». Il a publié dans diverses conférences internationales telles que ESWC, LDOW, EC-Web (cf. dblp). |
14h30-15h15 |
G. Atemezing (Mondeca) - Making Sense of Content Résumé : cette présentation a pour but principal de montrer l’importance du Web sémantique dans les choix technologiques de Mondeca, une PME d’édition de solutions sémantiques basée à Paris. En partant des problèmes concrets en entreprise, avec des sources de données hétérogènes; nous montrons que des solutions basées sur les ontologies apportent de la valeur ajoutée pour une gestion efficace de l’information. Des applications dans divers domaines (santé, média, géographie, tourisme) montrent que l’avenir dans la gestion de l’information en entreprise passe par la maîtrise des métadonnées. Pour cela, les standards du W3C apportent de la souplesse dans la transformation de la donnée brute en connaissances pour de nouvelles applications innovantes. Bio: Diplômé en Master Informatique en Intelligence Artificielle à l’Université Polytechnique de Madrid., Il a ensuite obtenu son Ph.D en 2015 de Telecom ParisTech sur le sujet “La représentation et la publication des données géographiques sur le Web des données”. Depuis 2012, il participe et collabore à plusieurs groupes de travail du W3C, W3C Data On the Web Best Practices Working Group, W3C Locations and Addresses Community Group, W3C Government Linked Data Working Group (GLD). Il a contribué activement au projet DATALIFT, projet de mise en place d’outils pour l’élévation et la sémantisation des données comme au projet LOV (Linked open Vocabularies). Au sein de Mondeca il est responsable du labs de Mondeca ( labs.mondeca.com ). |
15h15-16h00 |
B. Safar - Annotation sémantique de documents Résumé : Dans notre contexte où les concepts utilisés pour l'annotation traduisent des besoins utilisateurs et sont donc très spécifiques, la tâche d'annotation est confrontée à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas présentes dans les documents mêmes. La solution proposée s'appuie sur une ontologie, la recherche d'information sur le LOD et des techniques d'apprentissage. Bio : |
Pause Café de 16h00-16h30
TABLE RONDE et Remise du Prix WORKS-Web, AFIA - Jeunes Chercheurs de 16h30 à 17h30 Animateurs : Myriam Lamolle / Ernesto Exposito |
Clôture de la journée à 17h30