Big Data

Apache Pig-installatie op Linux

Deze blog is een stapsgewijze handleiding voor de installatie van Apache Pig in een Linux-omgeving. We zullen Apache Pig 0.16.0 installeren en het in verschillende modi uitvoeren.

Inleiding tot Spark met Python - PySpark voor beginners

Apache Spark heeft de Big Data & Analytics-wereld overgenomen en Python is een van de meest toegankelijke programmeertalen die tegenwoordig in de industrie worden gebruikt. Dus hier in deze blog leren we over Pyspark (vonk met python) om het beste uit beide werelden te halen.

Hadoop YARN-zelfstudie - Leer de grondbeginselen van YARN-architectuur

Deze blog richt zich op Apache Hadoop YARN dat werd geïntroduceerd in Hadoop versie 2.0 voor resource management en taakplanning. Het legt de YARN-architectuur uit met zijn componenten en de taken die door elk van hen worden uitgevoerd. Het beschrijft de indiening van applicaties en de workflow in Apache Hadoop YARN.

Hoe essentieel is Hadoop-training?

Deze blog bespreekt de voordelen van Hadoop-implementatie, Hadoop-initiatieven, Hadoop in kleine en grote organisaties en carrièrevoordelen van Hadoop-training.

Het profiel van Hadoop-leerlingen

Hadoop is een populaire vaardigheid geworden die moet worden verworven in het IT-circuit, het profiel van Hadoop-leerlingen neemt met de dag drastisch toe.