Big Data

Spark vs Hadoop: wat is het beste big data-framework?

Deze blogpost gaat over apache spark vs hadoop. Het geeft u een idee over welk Big Data-raamwerk het juiste is om in verschillende scenario's te kiezen.

Scala-applicatie uitvoeren in Eclipse IDE met Sbteclipse

Deze blog helpt je te begrijpen hoe je de sbteclipse-plug-in kunt installeren en instellen met stapsgewijze instructies voor het uitvoeren van de Scala-applicatie in Eclipse IDE.

Hadoop onder de knie? Tijd om aan de slag te gaan met Apache Spark

Deze blogpost legt uit waarom je na Hadoop aan de slag moet met Apache Spark en waarom het leren van Spark na het beheersen van hadoop wonderen kan doen voor je carrière!

Meer informatie over Apache Drill, de New Age Query Engine

Deze Apache Drill-zelfstudie geeft je alle informatie die je nodig hebt om aan de slag te gaan met de Apache Drill-queryengine, gebruik met Hadoop, Big Data en Apache Spark.

Apache Spark combByKey uitgelegd

Deze Spark Hadoop-blog vertelt je alles wat je moet weten over Apache Spark combByKey. Zoek de gemiddelde score per leerling met de methode CombByKey.

Apache Falcon: nieuw gegevensbeheerplatform voor het Hadoop-ecosysteem

Apache Falcon is een nieuw datamanagementplatform voor het Hadoop-ecosysteem dat onboarding feedverwerking en feedbeheer op hadoop-clusters vereenvoudigt. Leer hoe u het instelt.

Vonkaccumulatoren uitgelegd: Apache Spark

In dit Apache Spark-blog worden Spark-accumulatoren in detail uitgelegd. Leer het gebruik van de Spark-accumulator met voorbeelden. Vonkaccumulatoren zijn als Hadoop Mapreduce-tellers.

Apache Flink: het nieuwe generatie big data-analysekader voor stream- en batchgegevensverwerking

Leer alles over Apache Flink en het opzetten van een Flink-cluster in deze blog. Flink ondersteunt realtime en batchverwerking en is een onmisbare Big Data-technologie voor Big Data Analytics.

Gedistribueerde caching met uitzendvariabelen: Apache Spark

Deze blogpost bespreekt gedistribueerde caching met uitzendvariabelen en helpt je op weg met het efficiënt distribueren van grote waarden in Spark-programmering.

CCA- en CCP-certificeringen door Cloudera: alles wat u moet weten

CCA- en CCP-certificeringen door Cloudera hebben de CCDH- en CCSHB-examens vervangen. In deze blog leest u alles wat u moet weten over de nieuwe certificeringen.

Stateful Transformations met Windowing in Spark Streaming

Deze blogpost bespreekt stateful transformaties met windowing in Spark Streaming. Leer alles over het bijhouden van gegevens in batches met behulp van geavanceerde D-Streams.

Cumulatieve stateful transformatie in Apache Spark-streaming

Deze blogpost bespreekt stateful transformaties in Spark Streaming. Leer alles over cumulatieve tracking en bijscholing voor een Hadoop Spark-carrière.

Big data in de gezondheidszorg: hoe Hadoop een revolutie teweegbrengt in de analyse van de gezondheidszorg

Hadoop & Big Data-technologieën zorgen voor een revolutie in de analyse van de gezondheidszorg. Deze blog over big data in de gezondheidszorg bespreekt hoe big data-analyse medische zorg kan verbeteren.

Hadoop Streaming: een Hadoop MapReduce-programma schrijven in Python

Deze blogpost over Hadoop Streaming is een stapsgewijze handleiding om te leren hoe je een Hadoop MapReduce-programma in Python kunt schrijven om gigantische hoeveelheden Big Data te verwerken.

Big Data-zelfstudie: alles wat u moet weten over big data!

Deze blog over Big Data Tutorial geeft je een compleet overzicht van Big Data, de kenmerken, toepassingen en uitdagingen met Big Data.

HDFS-zelfstudie: inleiding tot HDFS en zijn functies

Deze HDFS-zelfstudieblog zal u helpen het HDFS of Hadoop Distributed File System en zijn functies te begrijpen. Je zult ook kort de kerncomponenten verkennen.

Splunk vs. ELK vs. Sumo Logic: welke werkt het beste voor u?

In deze Splunk-tutorial begrijpt u de verschillen tussen Splunk versus ELK versus Sumo Logic en bepaalt u welke van deze tools het beste bij u past.

Splunk Use Case: Domino's succesverhaal

In deze Splunk use case blog, zult u begrijpen hoe Domino's Pizza Splunk gebruikte om inzicht te krijgen in consumentengedrag en hun bedrijfsstrategieën te formuleren.

Hadoop installeren: een Hadoop-cluster met één knooppunt opzetten

Deze zelfstudie is een stapsgewijze handleiding om het Hadoop-cluster te installeren en op een enkel knooppunt te configureren. Alle Hadoop-installatiestappen zijn voor CentOS-machine.

HDFS-opdrachten: Hadoop-shell-opdrachten om HDFS te beheren

Deze blog gaat over de verschillende HDFS-commando's zoals fsck, copyFromLocal, expunge, cat etc. die worden gebruikt om het Hadoop-bestandssysteem te beheren.

Top Artikelen

Categorie

Interessante Artikelen