Apache Falcon: nieuw gegevensbeheerplatform voor het Hadoop-ecosysteem



Apache Falcon is een nieuw datamanagementplatform voor het Hadoop-ecosysteem dat onboarding feedverwerking en feedbeheer op hadoop-clusters vereenvoudigt. Leer hoe u het instelt.

Apache Falcon is een raamwerk voor het beheren van de gegevenslevenscyclus in Hadoop-clusters. Het legt een relatie tussen verschillende gegevens- en verwerkingselementen in een Hadoop-omgeving, en biedt ook feedbeheerservices zoals feedretentie, replicaties tussen clusters, archivering enz.





Laten we eerst bespreken hoe u Apache Falcon instelt. Voer de onderstaande opdracht uit om de git-repository van Falcon te downloaden:

Opdracht: git clone https://git-wip-us.apache.org/repos/asf/falcon.git falcon



git-command-apache-falcon

Om Falcon te runnen, moet je het eerst bouwen.

Opdracht: cd valk



Opdracht: export MAVEN_OPTS = ”- Xmx1024m -XX: MaxPermSize = 256m -noverify” && mvn schone installatie -DskipTests

Opdracht: mvn schone montage: assembly -DskipTests -DskipITs

Als je eenmaal falcon hebt gebouwd, zul je een falcon-pakket vinden in / falcon / distro / target / directory.

De commando's voor het bouwen van falcon zien er erg eenvoudig uit, maar je zult veel problemen tegenkomen voordat je het bericht Build Success ziet. Ik kreeg veel problemen tijdens het bouwen voor Hadoop-2.2.0

Dus om de pijn van het bouwen van Falcon over te slaan, geef ik je een succesvol gebouwd Falcon-pakket, dat je kunt downloaden via de onderstaande link.

https://edureka.wistia.com/medias/xw5cfzqmho/download?media_file_id=124642564

Pak het bestand uit om de map falcon-0.10 te krijgen.

Opdracht: unzip falcon-0.10-SNAPSHOT.zip

Stel flacon-omgevingsvariabelen in .bashrc-bestand in.

Opdracht: sudo gedit .bashrc

Opdracht: bron .bashrc

U kunt naar de falcon-map gaan en de bestanden en mappen erin zien.

Opdracht: cd falcon-0.10-SNAPSHOT /

Opdracht: ls

U kunt falcon-scripts vinden in de bin-directory.

Voer het onderstaande commando uit om Falcon te starten.

ssis tutorial stap voor stap

Opdracht: ./bin/falcon-start

Je zult nu een nieuwe daemon FalconServer zien draaien.

Opdracht: jps

Opdracht: ./bin/falcon admin -version

Open uw browser en ga naar localhost: 15000 . U kunt de webinterface van Falcon zien.

Heeft u een vraag voor ons? Noem ze in het commentaargedeelte en we nemen contact met u op.

Gerelateerde berichten:

Drilling op Apache Drill