Advanced Analytics, indissociable partenaire du Big Data

Né avec le Big Data, le terme Advanced Analytics est autant galvaudé et peut-être aussi peu clair que son indissociable partenaire. Pourtant, c’est bien l’Advanced Analytics qui va permettre de donner de la valeur (voire de l’intelligence) aux données et de les rendre accessibles aux utilisateurs métiers de l’entreprise. On fait le point sur ce qu’est exactement l’Advanced Analytics et ce qu’il peut apporter dans votre organisation.

Advanced Analytics : c’est quoi ?

Advanced Analytics, indissociable partenaire du Big Data

Advanced Analytics, indissociable partenaire du Big Data

L’Advanced Analytics c’est la partie émergée de l’iceberg Big Data. Sous le terme Advanced Analytics se cachent en réalité les disciplines et outils qui visent à exploiter, rendre visibles, intelligibles, voire intelligentes la masse de données du Big Data.

Le terme d’Analytics existe depuis bien longtemps. Il était déjà utilisé sur les systèmes de business intelligence (Décisionnel)  pour désigner les activités d’analyse réalisées sur les données. Avec l’ajout du terme « Advanced », on passe à la vitesse supérieure, celle des 3V . On fait ainsi de l’analyse à grande vitesse, sur des gros volumes d’information et sur une grande variété de types de données.

Avec l’Advanced Analytics, on apporte surtout plus de valeur ajoutée et d’intelligence aux données. C’est grâce à l’Advanced Analytics qu’on passe dans l’ère des usages  et que les données vont révéler toute leur valeur pour l’entreprise.

 

L’Advanced Analytics regroupe 3 disciplines

On peut le constater avec cette définition, l’Advanced Analytics est un domaine assez large qui couvre des disciplines très différentes.

Pour y voir plus clair, je propose une classification en 3 familles  :

Advanced Analytics, un savant mélange de Data Discovery, de DataViz et de Data Science

Advanced Analytics, un savant mélange de Data Discovery, de DataViz et de Data Science
Extrait de l’état de l’art du Big Data par Business & Decision

 

L’Advanced Analytics par la Data Discovery

L’objectif de la Data Discovery est de mettre l’Advanced Analytics à la portée des utilisateurs métiers. Pour gagner en productivité et en souplesse, ceux-ci doivent pouvoir exploiter les données en toute autonomie.

La Data Discovery est venue combler un manque important dans les solutions d’entreprise. En effet, les utilisateurs « consommateurs » de chiffres ont depuis longtemps des solutions adaptées avec la mise en œuvre de tableaux de bord paramétrés et automatisés. Mais pour les utilisateurs analystes (10% des data-users d’après les cabinets d’étude), une souplesse plus importante est nécessaire.

Pour ceux-là, il faut par exemple avoir la capacité de travailler sur les données sans savoir la question qu’on se pose a priori. Dans les outils de Data Discovery, de nombreuses fonctionnalités sont mises à disposition pour simplifier l’utilisation : navigation graphique, forte interactivité, performance (grâce à l’in-memory), fonctions de préparation et de mise en qualité des données, capacité à croiser les données stockées dans des bases de données d’entreprise avec des données stockées en local (sous Excel par exemple), etc.

Sur le marché, les pure-players de cette discipline sont (par ordre alphabétique) : MicrostrategyQlik, Tableau Software et Tibco. Beaucoup d’autres acteurs leur ont emboîté le pas et tous les éditeurs de solutions proposent des outils de Data Discovery dans leur offre. L’open-source propose aussi une alternative avec Kibana (qui est intégré dans la suite ELK : Elastic Search-Kibana).

 

L’Advanced Analytics par la Data Visualisation (Dataviz)

An illustration of the human genome showing location of genes implicated in disease, regions of with self-similarity and those with structural variation within populations. This graphic layers a variety of data types (links, heat maps, tiles, histograms) and is a good example of a Circos image. This graphic appeared in the Conde Nast Portfolio. (zoom).

Représentation Dataviz du génome humain.
Source : http://circos.ca/intro/genomic_data/

« Un schéma vaut mieux qu’un long discours ». C’est probablement l’adage qui a mené à la Dataviz. Celle-ci cherche ainsi à apporter de la valeur ajoutée par la représentation graphique des données. Là, c’est le mode de représentation lui-même qui amène l’intelligence.

A l’ère du Big Data, où les données sont nombreuses, variées et complexes, il faut trouver de nouveaux moyens de les représenter. La Dataviz propose de sortir des sempiternels tableaux, camemberts ou autres histogrammes pour parvenir à faire passer en un coup d’œil des messages complexes basés sur des données objectives et bien souvent très volumineuses (et donc complexes à appréhender de façon brute pour un esprit humain).

C’est ainsi par exemple que la dataviz innovante ci-contre a totalement révolutionné la façon d’analyser le génome humain.

 

Trois types de solutions de Dataviz sont disponibles sur le marché :

La Dataviz pour les infographistes avec Photoshop, Illustrator et consorts

Et oui, les premières solutions de Dataviz sont celles des graphistes. Cela semble tellement évident qu’on n’y pense pas au premier abord. Pourtant, de nombreuses entreprises font appel à des graphistes pour mieux présenter leurs chiffres, parfois même pour des besoins internes. Le gros inconvénient est qu’à chaque mise à jour des chiffres, il faut refaire appel au graphiste. Cette solution est donc plutôt à privilégier pour des Dataviz « one-shot » nécessitant un haut niveau de graphisme.

La Dataviz pour les analystes business avec les outils de Data Discovery

Les outils de Data Discovery décrits précédemment présentent de fortes capacités graphiques. Ces capacités alliées à la souplesse d’utilisation font de ces outils d’excellentes solutions pour réaliser des Dataviz simples, actualisables automatiquement et maintenables par les utilisateurs métiers.

La Dataviz pour les informaticiens avec les librairies JavaScript

C’est certainement la solution la plus puissante… Les capacités graphiques sont infinies, la Dataviz est accessible sur le web et se rafraîchit automatiquement lors de mise à jour de données. Cette solution ultime est proposée grâce à des librairies JavaScript telles que D3.js ou encore canvas.js. Cela demande toutefois de la programmation informatique et peut donc constituer un projet en tant que tel.

 

L’Advanced Analytics avec la Data Science

La Data Science est la discipline qui apporte le plus d’intelligence aux données. Bien mise en œuvre, elle permet de comprendre et modéliser des comportements complexes et de prédire l’avenir. Là, on est dans le domaine des algorithmes.

Cette discipline n’est pas récente. Ce sont les mathématiciens qui l’ont développée les premiers avec les Statistiques. Les premiers algorithmes ont ainsi été conçus dès les années 50. En parallèle, les informaticiens ont travaillé sur l’intelligence artificielle qui a donné naissance au Machine Learning. Cette pratique permet ainsi à l’ordinateur d’apprendre par lui-même et d’améliorer de façon autonome son comportement suivant le résultat attendu.

La Data Science est le carrefour entre la Statistique et le Machine Learning. Elle exploite ainsi le meilleur de ces deux mondes très complémentaires. Sur les derniers projets que nous avons réalisés, nous avons ainsi eu une approche mixant des algorithmes de Statistiques et de Machine Learning. C’est en prenant le meilleur de chacune de ces approches, qu’on obtient les résultats les plus robustes.

Cette discipline est toutefois réservée à des spécialistes : les Data Scientists, Statisticiens et autres Dataminers. Et ces spécialistes ont leurs propres outils tels que (par ordre alphabétique) Dell Statistica, IBM SPSS, Knime, R, SAS ou encore SAP Predictive Analytics

 

Alors, on se lance ensemble dans l’Advanced Analytics ?

Une chose est sûre, pour faire de l’Advanced Analytics, il faut des données. Toutefois, il ne faut pas forcément avoir construit une architecture Big Data complète pour activer le potentiel de l’Advanced Analytics… et il ne faut pas forcément disposer d’énormément de données pour se lancer !

Nous avons déjà réalisé des projets en Advanced Analytics avec un volume de données réduit (même en Data Science !) et sur lesquels une forte valeur a été apportée… Alors, pourquoi pas chez vous ?!

 

Cet article vous a intéressé ?

Réagissez en commentaire ou contactez-moi directement pour échanger sur vos projets.

  • A propos
  • Derniers articles

Mick LEVY

Directeur de l'Innovation Business à Business & Decision

Data Maniac !! 15 ans d'expérience dans la valorisation du capital des données de l'entreprise au sein de Business & Decision. Acteur engagé, Mick conseille de nombreuses organisations sur leur stratégie Data et sur l’adoption des nouveaux usages digitaux.

Il n'existe pas de commentaire pour le moment.

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*