Hive-gegevensmodellen



De Hive-datamodellen bevatten de volgende componenten, zoals databases, tabellen, partities en buckets of clusters. Hive ondersteunt primitieve typen zoals gehele getallen, drijvers, dubbels en strings.

Hive is een datawarehouse-systeem voor Hadoop dat eenvoudige gegevenssamenvatting, ad-hocquery's en de analyse van grote datasets die zijn opgeslagen in Hadoop-compatibele bestandssystemen mogelijk maakt. Hive structureert gegevens in goed begrepen databaseconcepten zoals tabellen, rijen, kolommen en partities. Het ondersteunt primitieve typen zoals gehele getallen, drijvers, dubbels en strings. Hive ondersteunt ook associatieve arrays, lijsten, structuren en serialiseren en gedeserialiseerde API wordt gebruikt om gegevens in en uit tabellen te verplaatsen.





Laten we de Hive-gegevensmodellen eens in detail bekijken

wat doet init in python

Hive-gegevensmodellen:

De Hive-datamodellen bevatten de volgende componenten:



  • Databases
  • Tabellen
  • Partities
  • Emmers of clusters

Partities:

Partitie betekent het verdelen van een tabel in grofkorrelige delen op basis van de waarde van een partitiekolom zoals ‘data’. Dit maakt het sneller om query's uit te voeren op gegevenssegmenten

Hive-gegevensmodellen

Dus, wat is de functie van partitie? De partitiesleutels bepalen hoe gegevens worden opgeslagen. Hier definieert elke unieke waarde van de partitiesleutel een partitie van de tabel. De partities zijn gemakshalve vernoemd naar datums. Het is vergelijkbaar met ‘Block Splitting’ in HDFS.



c ++ hoe naamruimten te gebruiken

Emmers:

Buckets geven extra structuur aan de gegevens die kunnen worden gebruikt voor efficiënte queries. Een samenvoeging van twee tabellen die op dezelfde kolommen zijn geplaatst, inclusief de samenvoegkolom, kan worden geïmplementeerd als een Map-Side Join. Bucketing op basis van gebruikte ID betekent dat we snel een op gebruikers gebaseerde zoekopdracht kunnen evalueren door deze uit te voeren op een willekeurige steekproef van de totale set gebruikers.

Heeft u een vraag voor ons? Vermeld ze in het opmerkingengedeelte en we nemen contact met u op.

datastructuren en algoritmen java

Gerelateerde berichten:

Handige Hive-opdrachten