Hoe Hive-scripts uitvoeren?



Dit is een zelfstudie over het uitvoeren van Hive-scripts. Het uitvoeren van dit script zal de tijd en moeite die we steken in het schrijven en handmatig uitvoeren van elke opdracht verminderen.

Omdat het een datawarehousing-pakket is dat bovenop Hadoop is gebouwd, wordt Apache Hive steeds meer gebruikt voor data-analyse, datamining en voorspellende modellering. Organisaties zoeken professionals met een stevige houvast . Laten we in dit bericht eens kijken hoe u Hive-scripts kunt uitvoeren. Over het algemeen gebruiken we de scripts om een ​​reeks instructies tegelijk uit te voeren. Hive-scripts worden vrijwel op dezelfde manier gebruikt. Het vermindert de tijd en moeite die we steken in het schrijven en handmatig uitvoeren van elke opdracht.

hoe db browser te gebruiken voor sqlite

Hive-scripts worden ondersteund in de Hive 0.10.0 en hogere versies. Omdat Hive 0.90-versie is geïnstalleerd in CDH3, kunnen we Hive-scripts niet uitvoeren in CDH3. U kunt de onderstaande stappen in CDH4 proberen, aangezien er Hive 0.10.0-versie in is geïnstalleerd. Weet u hoe u een Hive-script maakt? Zo nee, klik op om meer duidelijkheid te krijgen.





Master-Hive-Now

Laten we nu eens kijken hoe we de scripts in Hive kunnen schrijven en ze in CDH4 kunnen uitvoeren:



Stap 1: een Hive-script schrijven.

Om het Hive-script te schrijven, moet het bestand worden opgeslagen met de extensie .sql. Open een terminal in uw Cloudera CDH4-distributie en geef de volgende opdracht om een ​​Hive-script te maken.
Opdracht: sudo gedit sample.sql

Bij het uitvoeren van de bovenstaande opdracht, wordt het bestand geopend met de lijst met alle Hive-opdrachten die moeten worden uitgevoerd.



In dit script wordt een tabel gemaakt, beschreven en worden gegevens uit de tabel geladen en opgehaald.

1. De tabel maken in Hive:

Opdracht: maak tabelproduct (productid: int, productname: string, price: float, category: string) rijen formaat gescheiden velden afgesloten met ‘,’

Hier is product de tabelnaam en {productid, productname, price, category} zijn de kolommen van deze tabel.

Velden die eindigen met ‘,’ geven aan dat de kolommen in het invoerbestand worden gescheiden door het symbool ‘,’.

Standaard worden de records in het invoerbestand gescheiden door een nieuwe regel.

2. Beschrijving van de tabel:

Opdracht: beschrijf product

3. De gegevens in de tabel laden.

Om de gegevens in de tabel te laden, moeten we eerst een invoerbestand maken met de records die in de tabel moeten worden ingevoegd.

Laten we een invoerbestand maken.

Opdracht: sudo gedit input.txt

Bewerk de inhoud van het bestand zoals weergegeven in de afbeelding.

4. Ophalen van de gegevens:

Om de gegevens op te halen, wordt het select-commando gebruikt.

Opdracht: Selecteer * uit product

Het bovenstaande commando wordt gebruikt om de waarde van alle kolommen in de tabel op te halen. Het script zou moeten zijn zoals het wordt weergegeven in de onderstaande afbeelding.

Nu zijn we klaar met het schrijven van het Hive-script. Het bestand sample.sql kan nu worden opgeslagen.

Stap 2: Het Hive-script uitvoeren

Het volgende is de opdracht om het Hive-script uit te voeren:

Opdracht: bijenkorf –f /home/cloudera/sample.sql

Zorg er bij het uitvoeren van het script voor dat het volledige pad naar de locatie van het scriptbestand aanwezig is.

We kunnen zien dat alle opdrachten met succes worden uitgevoerd.

Dit is hoe Hive-scripts worden uitgevoerd en uitgevoerd in CDH4.

Hive is een cruciaal onderdeel van Hadoop en uw expertise in Hive kan u de bestbetaalde Hadoop-banen opleveren! Edureka heeft een speciaal samengestelde Hadoop-cursus die je helpt concepten zoals MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume en Sqoop onder de knie te krijgen. Klik op onderstaande knop om aan de slag te gaan.

Heeft u een vraag voor ons? Vermeld ze in het opmerkingengedeelte en we nemen contact met u op.

hashmap en hashtabel in java

Gerelateerde berichten:

Hive-opdrachten

Hive-gegevensmodellen