Spark

[TUTORIEL] Premiers pas avec Zeppelin

Zeppelin est le compagnon idéal de toute installation Spark. Ce notebook permet de faire des analyses interactives au travers d’un navigateur web. Zeppelin permet d’exécuter du code Spark et de visualiser les résultats dans des tableaux ou graphiques.

Il était une fois le SQL sous Hadoop – 1 an après

Dans l’article Il était une fois le SQL sous Hadoop, je décrivais le foisonnement de solutions existantes pour travailler en SQL dans le Big Data. Plus d’un an s’est écoulé. L’occasion pour moi de vous dresser un premier bilan.

Miss France 2016

Miss France : quelle miss aurait été élue sur Twitter ?

L’élection Miss France génère nombre de commentaires sur les réseaux sociaux, notamment sur Twitter. Ces contenus offre de nombreuses possibilités d’analyse pour répondre à la question : « Quelle Miss aurait été élue par Twitter ? »

spark traitements big data reactive

5 raisons de choisir Spark pour les traitements de vos Big Data

Rapide, efficace, riche, adaptable… Spark a le vent en poupe pour tout ce qui concerne les traitements Big Data ! Voici 5 bonnes raisons pour lesquelles Spark n’est pas une mode…

Il était une fois dans l'ouest... SQL sous Hadoop

Il était une fois dans le SQL sous Hadoop

Si MapReduce s’impose pour traiter de grands volumes de données en mode batch, si Storm apparait comme le meilleur moteur d’intégration temps-réel, les choses […]

Gordon Moore and Robert Noyce chez Intel (1970)

De la loi de Moore aux technologies Big Data et Spark

Dès 1965, Gordon Moore (cofondateur de la société Intel) affirmait que le nombre de transistors par circuit de même taille […]