Geoffrey Brun

Dans l'équipe COGIT de 2011 à 2015

Téléphone actuel : 33 1 43 98 80 00 + 72 19

-

Sujet de recherche au laboratoire COGIT :

L’« emprise géographique » d’une carte correspond à la surface comprenant la totalité des données thématiques de la carte. La méthode proposée dans le cadre de cette thèse consiste à déterminer une emprise géographique « pertinente » à partir d'un texte, c'est-à-dire prenant en compte la localisation des informations relatives au sujet principal du texte. La méthode mise au point repose sur l'analyse des noms de lieu présents dans le texte en fonction de leur nombre d’occurrences et de leur localisation, et s'articule en trois étapes successives.

Dans un premier temps, les noms de lieu du texte sont identifiés. Ceux-ci peuvent s’avérer complexes à identifier, selon qu'ils contiennent des concepts géographiques et des indirections : Madrid, la Chine méridionale, l’est de la Russie, l’archipel des Kouriles ou encore l’ouest du plateau de Sibérie orientale. Ces noms de lieu sont extraits sous la forme d'entités nommées spatiales et d'organisation : nous jugeons pertinent, par exemple, de toujours exploiter le nom de lieu Paris, que celui-ci fasse référence à la ville ou à la municipalité de manière indifférenciée dans le texte. Cette étape d'extraction repose sur des dictionnaires et des patrons morpho-syntaxiques modélisés via le logiciel Unitex.

La seconde étape consiste à lever les ambiguïtés résidant sur ces noms de lieu – lesquels ne sont que de simples chaînes de caractères – en leur associant un toponyme. Vienne peut par exemple faire référence à une ville en France ou en Autriche, et Niger à un fleuve ou un pays. Cette étape de désambiguïsation s'appuie sur le gazetier GeoNames : les noms de lieu non ambigus, c'est-à-dire ne possédant qu'un seul toponyme possible dans le gazetier, sont utilisés afin de trouver le meilleur toponyme possible pour chaque nom de lieu ambigu.

Enfin, une emprise géographique est générée à partir des toponymes identifiés. Cependant, tous les noms de lieu d’un texte ne sont pas toujours utiles à la création d’une emprise géo-graphique illustrant ce texte. Celui-ci peut par exemple traiter de puits de pétrole en Irak et citer néanmoins quelques noms de lieu extérieurs à ce pays, comme Washington et Etats-Unis. Afin de prendre en compte cette difficulté, la méthode proposée consiste à regrouper les topo-nymes dans des clusters (algorithme DBSCAN) en se fondant sur leurs coordonnées géogra-phiques. Selon la proximité spatiale des clusters et les nombres d'occurrences des toponymes qui les composent, certains clusters sont ensuite sélectionnés pour générer une première em-prise. Afin de générer une seconde emprise plus précise, les toponymes des clusters sélec-tionnés sont appariés à des entités géographiques de type polygonal provenant de la base de données spatiales Natural Earth.

Formation :

  • 2005-2007 : Licence 1 et 2 en géographie à l’Université de Tours.
  • 2007-2008 : Licence 3 en urbanisme au IATU de Bordeaux.
  • 2008-2010 : Master professionnel 1 et 2 en urbanisme à l’Institut d’Urbanisme de Grenoble (deuxième année : semestre erasmus et stage professionnel à Vienne, en Autriche).
  • 2010-2011 : Master 2 SIGMA en géomatique à Toulouse.

Parcours professionnel :

  • Février-mai 2010 : stage professionnel en urbanisme au Central European Institute of Technology (CEIT ALANOVA) à Schwechat (Autriche). Participation au projet ICT-ENSURE (étude sur les TIC appliqués au domaine de l’urbanisme).
  • Mars-septembre 2011 : stage professionnel en géomatique au Parc naturel régional du Haut-Languedoc. Analyse des besoins en information géographique du Parc naturel régional et élaboration d’une application cartographique web (utilisant PostGreSQL/GeoServer/GeoWebCache/GeoExt).

Compétences :

  • Cartographie et sémiologie graphique.
  • Logiciels de SIG et bases de données spatiales.
  • Webmapping : serveurs et clients cartographiques, webservices WMS et WFS.
  • Traitement Automatique du Langage Naturel (Unitex, TreeTagger)
  • Statistiques textuelles (iRaMuTeq, RTmétis)
  • Algorithmique et programmation (HTML, CSS, PHP, JavaScript, Java).
  • Bases de données spatiales.
  • Langues : anglais, allemand.

Publications :

- Toutes les publications de Geoffrey Brun

Enseignements donnés au COGIT :

  • Mini-projets en SIG : ArcGIS, QGIS,
    M2 DDMEG, ENSG. 2013.
  • Mini-projets de cartographie internet : OpenLayers, PostGIS, GeoServer,
    Master Géomatique/Carthagéo, ENSG. De 2012 à 2014.
  • Cartographie et sémiologie graphique,
    Formation continue, ENSG. De 2012 à 2013.
  • Introduction aux SIG et TP de MapInfo et ArcGIS,
    M2 Géorisques, Université Marne-la-Vallée. 2012.
  • Introduction aux SIG et TP d’ArcGIS,
    M2SIAW, Université Marne-la-Vallée. 2012.
  • TP QGIS,
    Master Géomatique/Carthagéo, ENSG. 2012.
--
-
Site internet de la recherche à l'IGN