En octobre dernier, j’ai eu l’occasion de montrer comment analyser des donn%u00e9es venant de logs Web et Twitter avec PIG et HIVE dans Hadoop, puis de croiser les r%u00e9sultats dans Excel, ce qui permet de d%u00e9cliner le r%u00e9sultat dans Power BI.

Je mets ici les diapos et les vid%u00e9os (les vid%u00e9os sont les vid%u00e9os de secours que j’avais, et non la pr%u00e9sentation live qui a %u00e9t%u00e9 faite, mais c’est %u00e9videmment tr%u00e8s proche).

Cela permet d’avoir une premi%u00e8re vision rapide de ce qu’on peut faire avec un cluster HDInsight. C’est un moyen tr%u00e8s abordable (autant en termes financiers que technique) de d%u00e9marrer avec Hadoop.

Les diapos compl%u00e8tes sont disponibles sur OneDrive.

La probl%u00e9matique:
image

Si vous voulez tester par vous-m%u00eame, vous pouvez aller %u00e0 http://aka.ms/tester-mon-azure o%u00f9 vous aurez 150 de ressources Windows Azure pour tester pendant 1 mois.

Voici les vid%u00e9os:

Pr%u00e9sentation des donn%u00e9es

Cr%u00e9ation du cluster
Jobs PIG et Hive
Excel et suite de l’ex%u00e9cution des jobs
Suppression du cluster

Smile

Benjamin (@benjguin)


Blog Post by: Benjamin GUINEBERTIERE