Big Data : mieux vaut bien sourcer ses données


Le décisionnel transforme les données en connaissances
Après la vague du Big Data toujours pas digérée, voici surgir les bases de données en mémoire. En plus d'un décisionnel qui se généralise en entreprise, pour concerner tous les décideurs à partir de sources d'informations de plus en plus variées, la DSI doit aussi affronter l'exigence de temps réel...
DécouvrirInvités à une table ronde lors de la matinée stratégique CIO Décisionnel du 23 septembre 2014, Joël Boutet, DSI d'Ellisphere, et Jean-François Paccini, directeur technique de Solocal, ont livré leur vision du Big Data, notamment sur le stockage.
PublicitéSuite à son rachat par Natixis en 2013, Ellisphere (ex-Coface Services) voit son métier se transformer par le Big Data. Son DSI, Joël Boutet est venue raconter cette transition lors d'une table ronde organisée lors de la matinée CIO Décisionnel du 23 septembre 2014 en compagnie de Jean-François Paccini, directeur technique de Solocal.
« Ellisphere était la filiale dédiée à la collecte d'informations sur les entreprises. Nous nous en servions pour estimer leur solvabilité et anticiper les défaillances », rappelle Joël Boutet au sujet de Coface Services. Suite au rachat par Natixis, Ellisphere a pour objectif de devenir un partenaire privilégié des entreprises pour tout ce qui ressort de l'intelligence économique.
« Nous nous appuyions déjà sur des équipes de statisticiens pour restituer à nos clients un condensé des 15 milliards d'informations élémentaires que nous récoltions à travers de multiples sources », explique Joël Boutet. Il reconnaît que ces volumes correspondaient plus à du small Big Data.
Mais avec le virage qu'Ellisphere est en train de prendre, ils devraient être au moins multipliés par dix. Ainsi, Joël Boutet déclare : « nous anticipons cette explosion en basculant vers une infrastructure Big Data ». L'objectif est de délivrer aux clients les informations primordiales avec la plus grande instantanéité, via le site web.
Miser sur la vélocité
Pour l'infrastructure, Ellisphere a fait le choix d'une solution entièrement logicielle, Parstream. « C'est une jeune entreprise allemande innovante. Nous sommes dans une vraie logique de partenariat », précise Joel Boutet. Les deux sociétés collaborent ainsi pour l'amélioration de la solution.
À noter que la technologie Parstream ne s'appuie pas sur du Hadoop mais sur du Bitmap. Alliée au fonctionnement d'Hellisphere basé sur un système de datawarehouse, elle permet une réponse quasi instantanée au requêtage. « L'expérience client s'en trouve très largement améliorée », déclare le DSI dont la principale préoccupation est la vélocité.
En compagnie de Joël Boutet, Jean-François Paccini a présenté l'expérience de Solocal dont il est le directeur technique. Le groupe, notamment propriétaire de Pages Jaunes, est spécialisé dans la mise en relation entre personnes, qu'il s'agisse de professionnels ou de particuliers. « Sur nos moteurs de recherche, nous analysons surtout la pertinence des informations délivrées à nos utilisateurs », déclare Jean-François Paccini. Il poursuit : « grâce l'approche Big Data, nous pouvons vérifier efficacement ces indicateurs ».
Avec une solution de BI classique, il était en effet impossible au groupe de savoir si les utilisateurs étaient vraiment satisfaits des réponses qu'ils obtenaient. Par exemple, Solocal s'est lancé dans une approche Hadoop pour analyser l'ensemble des requêtes et détecter lesquelles était reformulées par les utilisateurs. « Cela nous a permis d'affiner notre vocabulaire et d'améliorer nos résultats de recherche », déclare Jean-François Paccini.
Publicité
Stocker d'abord, utiliser ensuite
La démarche Big Data de Solocal est ainsi partie d'une conviction technique. « Nous sommes dans le numérique nous avons d'abord fait le choix d'amasser un maximum de données sans distinction. Elles avaient forcément un potentiel » estime Jean-François Paccini. Il précise que le stockage des données brutes n'a pas d'impact sur son utilisation dans un second temps.
« Dans l'usage que nous en faisons, nous n'avons pas forcément besoin de données normalisées et certifiées », déclare Jean-François Paccini. Sur cet aspect, Joël Boutet note toutefois que la qualité des données est un vrai sujet. « Le stockage génère un bruit massif qu'il va falloir filtrer pour en extraire la substantifique moelle », explique le DSI d'Ellisphere.
Miser sur les quick win
Une fois ces données stockées par Solocal, il a ensuite fallut intéresser les métiers. Les équipes techniques ont alors lancer de petits projet pour démontrer le potentiel du Big Data. « Nous devions montrer aux métiers que tout était possible. C'est un peu de notre faute. Les contraintes que nous leurs imposions auparavant avaient tendance à freiner leurs ardeurs », avouent le directeur technique.
Après avoir débuté l'aventure en SaaS, Solocal a souhaité rapatrier ses systèmes Big Data en interne. « C'est finalement très simple d'installer un cluster Hadoop dans son infrastructure », commente Jean-François Paccini. Il reconnaît toutefois que les technologies adoptées dans le cadre de cette démarche ont nécessité une adaptation et un peu de développement. Sur certains aspects, il y a eu une marche culturelle à franchir.
Aujourd'hui, la tendance est donc bien de stocker d'abord et d'utiliser après. « Il y a un lourd effort à fournir pour nettoyer cette manne d'informations. Les clients veulent accéder à la données mais aussi la dater et la qualifier », explique Joël Doutet. Pour lui, il faut une stratégie de sourcing pour avoir une donnée relativement propre à la base.
Article rédigé par

Oscar Barthe, Journaliste
Suivez l'auteur sur Linked In, Twitter
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire