oracle linux @fr

Hadoop pour les DBAs (4/13) : Introduction à HDFS

HDFS est le système de fichiers distribué de Hadoop. Sa disponibilité en cas de panne est assurée par des mécanismes de réplication et de bascules automatiques des processus et connexions. Ce 4e article consacré à Hadoop pour les DBAs décrit plusieurs concepts de fonctionnement de HDFS. C’est, soit dit en passant, probablement la partie la …

Hadoop pour les DBAs (4/13) : Introduction à HDFS Lire la suite »

Hadoop pour les DBAs (3/13) : Construire un cluster Hadoop

L’article précédent présente comment compiler et créer une distribution Hadoop sur Oracle Linux 7 à partir du code source d’Apache. Il s’agit maintenant d’installer et d’utiliser cette distribution. Cet article met donc logiquement en oeuvre un cluster de 3 serveurs. Son fonctionnement en ensuite validé en accédant aux différentes consoles et lançant un job MapReduce …

Hadoop pour les DBAs (3/13) : Construire un cluster Hadoop Lire la suite »

Hadoop pour les DBAs (2/13) : Compiler Hadoop pour Oracle Linux 7

De manière générale, vous préfèrerez installer Hadoop à partir de distributions comme celles de Cloudera ou Hortonworks… Mieux, vous utiliserez Hadoop dans le Cloud ou avec une appliance comme celles de Netapp ou d’Oracle. Ces solutions assistent la mise en oeuvre, la gestion opérationnelle et sont pasckagées pour la plupart des systèmes d’exploitation. Ce n’est …

Hadoop pour les DBAs (2/13) : Compiler Hadoop pour Oracle Linux 7 Lire la suite »