Thème 4 : Données Hétérogènes et Distribuées

De GDR I3
Aller à : navigation, rechercher
Responsables : Florence Sèdes (IRIT) , Thierry Delot (LAMIH) et Pierre Gançarski (ICUBE)

Contexte général et cadre des recherches

L’objectif du thème 4 du GdR i3 est de faire se rencontrer et collaborer des chercheur(se)s travaillant dans les domaines des Bases de Données, de la Recherche d’Information et de la Fouille de Données, créant ainsi le « continuum » depuis la données non structurée (masses de données) jusqu’aux collections distribuées de données (semi-)structurées hétérogènes afin de promouvoir les échanges entre les trois communautés qui ont des préoccupations (et compétences) souvent complémentaires dans ce domaine.

Le développement de l’usage des téléphones portables, les assistants personnels communicants, des capteurs et autres « smart devices », a en effet provoqué de profondes mutations des applications et services proposés aux utilisateurs, de plus en plus souvent nomades. Nous sommes aujourd’hui dans l’ère de l’informatique pervasive, de l’« ambiant computing », avec pour enjeu de proposer des services adaptés et de rendre les données disponibles « n’importe où et n’importe quand ».

Le Système d’Information n’échappe pas à cette évolution et devient lui aussi pervasif. L’information y est stockée partout, dans différents formats et sur différents types de terminaux interconnectés via des réseaux sans fil. Ces systèmes dits « ambiants » évoluent dans un contexte particulièrement dynamique du fait de la mobilité des utilisateurs et des sources de données. Les techniques traditionnellement utilisées, pour accéder aux données par exemple, doivent ainsi être revisitées ou totalement remises en cause, et de nouveaux paradigmes se font jour afin de supporter ces nouveaux environnements, et en particulier les contraintes des terminaux utilisés (autonomie limitée, connectivité intermittente, etc.).

Parallèlement, pour faire face à l'augmentation vertigineuse du volume des données disponibles (bases de données, WEB, images/vidéos, etc.) de ces dernières années et pour répondre aux besoins en « compréhension » de ces masses de données, l'un des principaux défis de la recherche en fouille de données est de concevoir un système capable de traiter un tel volume de données mais aussi (et peut-être surtout) de prendre en compte leur complexité croissante. De fait, la recherche sur cette problématique de l'exploitation de ces masses de données s'est considérablement développée, tant au point de vue des méthodes de fouille et de leur formalisation que des outils permettant de les mettre en œuvre et ce dans de très nombreux domaines d'applications.

Pour aborder ces problématiques et faire se rencontrer les chercheurs et chercheuses de la communauté des Bases de Données et celle de la fouille de données, mais aussi les utilisateurs de ces données, de ces nouvelles méthodes et outils afin de partager leurs connaissances et leurs avancés dans ce domaine et participer à leur diffusion vers tous les domaines (linguistique, médecine, géographie, ...) où la gestion,, le traitement et la fouille de donnée peuvent s'avérer pertinents et prometteurs, le GDR I3, thème 4, propose d'organiser des journées, manifestation et autres rencontres à finalité prospective permettant d'identifier les défis et verrous scientifiques et technologiques actuels et futurs.

Organisation

Historiquement, le thème 4 du GdR s’est construit par le rapprochement de différents groupes de travail :

  • Fouille de données, sujet porté par l’ancien GT 3.4 dirigé par J.-M. Petit et P. Poncelet,
  • Bases de données, sujet fortement représenté dans les anciens GT 3.1 (Infrastructures de médiation) dirigé par A. Doucet et G. Vargas-Solar et GT 3.7 Sécurité des systèmes d’information dirigé par Danielle Boulanger et Alban Gabillon
  • Indexation et Recherche d’information, sujet porté par l’ancien GT 3.5 dirigé par Catherine Berrut et Philippe Joly.

Sur la période 2009-2012, l’activité du thème s’est plus centrée sur les aspects fouille de données et recherche d’information. Néanmoins, il n’y a pas eu de structuration forte sous forme de GT, pôle ou axe. Notre volonté est maintenir cette « non-structuration » afin de favoriser les échanges entre ces différentes communautés.
Enfin, afin d’équilibrer l’animation de ce thème, un(e) nouveau responsable issu(e) de la communauté Bases de Données devrait prendre la co-responsabilité de ce thème

Animation du thème du thème 4

L'animation du thème se fait principalement à travers :

  • l’organisation de journées dédiées à deux ou trois aspects : par exemple des journées sur la fouilles de données et les entrepôts de données
  • la participation aux Assises du GdR I3 sur les aspects Social, Local et Mobilité (SoLoMo)
  • la participation active à l’organisation de l’école ETIA du GdR i3

L’accent sera mis sur l’organisation d’actions conjointes avec d’autres thématiques ou d’autres GDR.
Ainsi seront maintenus les journées JIGOT ainsi que les ateliers dans les conférences INFORSID et EGC. D’autres collaborations seront développées. Ainsi, par exemple l’organisation d’une l’École thématique portant sur les aspects théoriques et pratiques de la fouille de données avec applications en Géosciences est d’ores et déjà programmée en Juillet 2013. Cette école est soutenu par 4 instituts du CNRS : INS2I, INSIS, INSU, INEE, par le GdR i3 et GdR MAGIS et par le programme européen FORM-OSE ‘Training in Risk Sciences’ du Conseil de l’Europe.

Intégration et liens avec la communauté scientifique du thème 4

Les membres du thème 4 sont impliqués dans les différentes instances (CNU, CoNRS, ...), associations et sociétés savantes (EGC, SFC, INFORSID) permettant ainsi de d'interagir avec elles pour expliquer les spécificités, importance et enjeux de cette thématiques mais aussi de la promouvoir et préconiser des sujets d’étude. A titre d'exemple, Pierre Gançarski membre du CA de la société savante SIF et de l’association thématique EGC.

Mots clé

Fouille de données Bases de données Informatique ambiante
Accès aux données Données réparties Données complexes Extraction de connaissances


Equipe d'animation

Florence Sèdes (IRIT) , Thierry Delot (LAMIH), Pierre Gançarski (ICUBE)
Marc Platevit (LIRIS, Lyon) Chedy Raissi (LORIA, Nancy) Elisa Fromont (IHC, Saint-Etienne) Baptiste Jeudy (IHC, Saint-Etienne) ...