4
22 juin 2010

Le monde du GeoBI OpenSource a été, ces derniers jours, particulièrement actif. En effet, entre la sortie de nouvelles versions de logiciels et la création de nouveaux partenariats ce sont au total quatres nouvelles qui seront présentées dans ce billet. Tout d'abord, nous commencerons par le projet GeoBi initiative. Ensuite, nous aborderons les évolutions des deux ETLs spatiaux Geokettle et Spatial Data Integrator.

GeoBI Initiative


GeoBI.pngInitié par cinq compagnies1 et une université2, l'initiative GeoBI vise à regrouper l'ensemble des personnes évoluant dans le monde du géodécisionnel OpenSource. Ce projet est d'autant plus important qu'il allie recherche appliquée et partenariat industriel. Cette information a été largement commentée aussi bien sur les blogs francophones qu'internationaux.

Mais, le géodécisionnel qu'est-ce donc ? Ce domaine réuni deux mondes qui jusqu'alors se côtoyaient peu, celui de l'informatique décisionnelle (aussi appelée Business Intelligence) et celui des Systèmes d'information Géographiques (SIG). Nous avions déjà eu l'occasion d'aborder ce sujet au cours de deux précédents billets : Les ETL spatiaux OpenSource, à pieds joints dans l'informatique Géodécisionnelle3 et la géomatique décisionnelle, l'avenir du SIG?4. Si vous souhaitez plus d'informations, je vous renvoie donc à ces derniers ou au site SpatialOLAP qui représente une des meilleures ressources disponibles sur le WEB.

Néanmoins, si le domaine du SOLAP porté par le docteur Yvan Bédard, commence à être relativement mature, son incursion dans le domaine de l'Open Source est récente. Mais, les potentialités sont nombreuses. En effet, selon une étude menée par Gartner, le marché de la Business Intelligence Open Source, et par extension celui du GeoBI, devrait être multiplié par 5 d’ici 20125. C'est pourquoi, l'initiative GeoBI est un premier pas important vers une consolidation des acteurs et des projets orientés géomatique décisionnelle.

En effet, pour le moment arriver à comprendre l'univers du GeoBI relève du parcours du combattant. Ce constat s'explique tout d'abord en raison de l'évolution rapide que celui-ci a connu en l'espace de quelques mois. Mais aussi par la difficulté à identifier clairement qui fait quoi du fait que chacun développe sa propre solution en empruntant des briques logiciels à l'un ou l'autre des acteurs.

C'est pourquoi, pour le marché comme les utilisateurs cette iniative est à saluer. Celle-ci permettra je l'espère une harmonisation des développements et un regroupement des acteurs autour d'objectifs communs qui sont :

  • une meilleure coordination des travaux
  • faire connaitre la BI au monde des SIG et inversement
  • promouvoir une meilleure intégration entre la BI et les SIG
  • créer d'une base de connaissance libre
  • travailler en collaboration avec Open Geospatial Consortium (OGC) afin de définir de nouveaux standards (geoMDX)
  • ...

Si vous souhaitez plus de détails sur ce projet, je vous invite à consulter le manifeste qui est disponible également en français si l'anglais vous fait peur :)

Spatialytics


Passons maintenant aux nouveautés concernant les outils D'extraction, de Transformation et de Chargement (en anglais ETL).

Spatialytics est le nom de l'entreprise fondée par Luc Vaillancourt, le fondateur de l'agrégateur de nouvelles media baliz geospatial, et Thierry Badard, le créateur de l'une des premières suite décisionnelles OpenSource (GeoKettle, GeoMondrian et SolapLayers). Spatialytics est également le tout premier revendeur de la suite OpenGeo (en fr).

L'un de leurs produits phares est GeoKettle, un ETL spatial OpenSource basé sur Pentaho Data Integration (anciennement Kettle). ETL est l'acronyme d'Extract, Transform and Load, c'est-à-dire un outil permettant de charger, en entrée, des flux de données provenant de différentes sources, de leur faire subir des traitements (filtrage, agrégation...) et de les réinjecter ensuite en base de données (ou dans un des nombreux formats disponibles). Habituellement, cet outil sert à alimenter un cube de données (data warehouse) mais vous pouvez également l'utiliser au sein de votre activité habituelle. Comme le souligne vector1media, l'un des challenges des 10 prochaines années, dans le domaine de la géomatique, sera l'extraction et la gestion automatique des données. C'est dire l'importance que vont prendre ce genre d'outils dans notre paysage actuel.

A titre de comparaison, nous pourrions rapprocher GeoKettle de FME. Mais, jusqu'à récemment, GeoKettle ne disposait qu'une d'une faible gamme de formats (en entrée et en sortie) disponibles. Ce qui est plutôt embêtant pour un logiciel souhaitant être affilié à un ETL...

C'est pourquoi, c'est avec plaisir que j'ai appris (via tweeter) l'intégration d'Ogr2Ogr. D'abord disponible uniquement en lecture, le Docteur Badard a semble-t-il réussi à utiliser cette librairie en lecture et en écriture au sein de GeoKettle. Je dis semble-t-il car cette nouvelle version ne devrait être disponible que dans les jours prochains. Je n'ai donc pas pu encore tester cette nouvelle fonctionnalité et il ne me reste qu'à prendre mon mal en patience.

Spatial Data Integrator


La présentation des ETLs n'est pas finie car c'est maintenant avec celui initié par CampToCamp que je reviens. Celui-ci, nommé Spatial Data Integrator (SDI), ajoute à Talend Open Studio la possibilité d'utiliser des données spatiales. Petite anecdote, Talend est une société française, en ces temps où notre "équipe nationale" fait grise mine est au fond du trou c'est le moment de lancer un petit cocorico. Petit clin d'oeil à nodeatweet qui a su trouver les mots justes : "Et si on misait sur l'innovation, plutôt que sur le football pour la fierté nationale ?".

J'ai eu l'opportunité de suivre pendant deux jours une formation sur SDI dans les locaux de CampToCamp à Chambéry. Moi qui avais, jusqu'alors, manipulé essentiellement GeoKettle, je dois avouer que j'ai été très agréablement surpris. Bien évidemment, chacun de ces outils possède sa propre logique mais ils sont tout à fait comparables dans leurs fonctionnalités (il faudra voir si l'intégration d'Ogr2Ogr ne donne pas un léger avantage à GeoKettle, même si certaines "astuces" existent).

Néanmoins, jusqu'à récemment, le développement de Spatial Data Integrator se faisait parallèlement à celui de Talend Open Studio. Cela posait notamment des problèmes lors de changements de version. Conscient de cette contrainte l'équipe de CampToCamp a revu l'architecture de SDI afin de l'intégrer directement dans TOS sous la forme de plugins. Cette information, de François-Xavier Prunayre publiée sur neogeo-online, permettra, j'en suis certain, à une plus grande majorité d'utilisateurs de se pencher sur cet ETL spatial.

En conclusion, je pense que les mouvements auxquels nous assistons en ce moment dans le domaine du GeoBI ne sont que les prémices d'une incursion à plus large échelle de la géomatique décisionnelle au coeur de nos activités traditionnelles. Bien évidemment, toutes les facettes de ce domaine ne seront pas forcément utilisées, mais certaines d'entre elles feront partie de la boite à outils du géomaticien moderne.

A propos de l'auteur: 
GeoTribu

Toute l'actualité de la géomatique Open Source ! Mais aussi des tutoriels, des billets de blog, des tests et surtout une bonne humeur géographique !

Commentaires

C'est plutôt François-Xavier Prunayre, de l'équipe de Neogeo et auteur de l'article en question, qui a réalisé la modification de l'architecture SDI. Merci de le corriger.

Bonjour Arnaud,

Je te confirme que la lecture/écriture des formats supportés par OGR sera disponible sous très peu dans GeoKettle. Nous étions la semaine passée à Saguenay pour le 1er rendez vous OSGeo-Quebec (http://rendez-vous-osgeo-qc.org) et le colloque Vision Géomatique (http://www.visiongeomatique.com/), événements durant lesquels Spatialytics a réalisé des présentations et démonstrations des nouvelles fonctionnalités de GeoKettle dont entre autres le support OGR. Les transparents et vidéos des présentations faites au 1er rendez-vous OSGeo-Quebec seront disponibles sur le site de l'événement dans les prochains jours. Mais pour revenir à GeoKettle, nous sommes en train de finir de nettoyer le code et de réaliser de nombreux tests pour s'assurer que tout fonctionne bien. Une release candidate devrait être disponible sous peu pour test par la communauté, avant la sortie d'une version jugée stable de GeoKettle.

Au plaisir,

Th.

Bonjour à vous deux,

@Thierry

Je suis heureux d'apprendre que vous avez pu organiser autant de démonstrations. GeoKettle est vraiment un outil formidable qui mérite à être mieux connu.

Il me tarde de pouvoir tester cette nouvelle release. Beau travail en tout cas !

@Guillaume Sueur (NeoGeo)

La correction est effectuée. Merci de me l'avoir fait remarquer.

Arnaud

Pour information : http://www.talendforge.org/wiki/doku.php?id=sdi:MainPage#community
Je tiens à preciser que Camptocamp n'intervient plus au sein de la communauté de Talend spatial ou SDI. Merci de mettre à jour l'article ou de le renommer.