Les billets de Stéphane WALTER

  • A propos
  • Derniers articles



[TUTORIEL] Premiers pas avec Zeppelin

Zeppelin est le compagnon idéal de toute installation Spark. Ce notebook permet de faire des analyses interactives au travers d’un navigateur web. Zeppelin permet d’exécuter du code Spark et de visualiser les résultats dans des tableaux ou graphiques.

Il était une fois le SQL sous Hadoop – 1 an après

Dans l’article Il était une fois le SQL sous Hadoop, je décrivais le foisonnement de solutions existantes pour travailler en SQL dans le Big Data. Plus d’un an s’est écoulé. L’occasion pour moi de vous dresser un premier bilan.

Miss France 2016

Miss France : quelle miss aurait été élue sur Twitter ?

L’élection Miss France génère nombre de commentaires sur les réseaux sociaux, notamment sur Twitter. Ces contenus offre de nombreuses possibilités d’analyse pour répondre à la question : « Quelle Miss aurait été élue par Twitter ? »

spark traitements big data reactive

5 raisons de choisir Spark pour les traitements de vos Big Data

Rapide, efficace, riche, adaptable… Spark a le vent en poupe pour tout ce qui concerne les traitements Big Data ! Voici 5 bonnes raisons pour lesquelles Spark n’est pas une mode…

Faut-il tomber amoureux de MongoDB ?

Faut-il tomber amoureux de MongoDB ?

A l’occasion d’un projet d’analyse des logs de web services réalisé pour un client, nous avons été amené à tester MongoDB… […]

Analyse sémantique de Twitter avec Qlik Sense

Tutoriel: visualiser les données twitter avec Qlik Sense

Après avoir vu dans l’article précédent comment récupérer les données Twitter avec Flume et Hive, j’ai voulu aller jusqu’à la visualisation des […]

Flume & Hive Big Data

Tutoriel : Analyser les données Twitter avec Flume et Hive

L’objectif de ce tutoriel est de vous montrer comment utiliser Flume et Hive pour analyser des données en provenance de […]

Il était une fois dans l'ouest... SQL sous Hadoop

Il était une fois dans le SQL sous Hadoop

Si MapReduce s’impose pour traiter de grands volumes de données en mode batch, si Storm apparait comme le meilleur moteur d’intégration temps-réel, les choses […]

Tutoriel : Installer soi-même un cluster Hadoop (1 nœud)

Tutoriel : Installer soi-même un cluster Hadoop (1 nœud)

Vous avez sûrement lu de nombreux articles sur Hadoop et vous souhaitez maintenant vous familiariser avec. Mais comment faire pour apprivoiser cette […]

Apache Hadoop

Trois tutoriels pour démarrer avec Hadoop

On trouve énormément d’articles sur le Big Data mais il est parfois frustrant de n’aborder que les concepts. Certains ont besoin de visualiser les outils pour appréhender de nouvelles technologies. A cette fin, j’ai compilé 3 courtes vidéos sur Hadoop pour démystifier la chose.