OLTP versus OLAP



In de volgende blog wordt kort ingegaan op OLTP versus OLAP en de verschillende use-cases.

OLTP versus OLAP

OLTP zou meer een online transactiesysteem of gegevensopslagsysteem zijn, waarbij de gebruiker veel online transacties doet met behulp van de datastore. Er wordt ook gezegd dat er meer ad-hoc lees- / schrijfbewerkingen plaatsvinden in realtime.





OLAP is meer een offline gegevensopslag. Het is toegankelijkaantal kerenop offline manier. Bulklogboekbestanden worden bijvoorbeeld gelezen en vervolgens teruggeschreven naar gegevensbestanden. Enkele van de algemene gebieden waar OLAP wordt gebruikt, zijn logboekopdrachten, dataminingopdrachten, enz.

Er wordt gezegd dat Cassandra meer van OLTP is, omdat het realtime is, terwijl Hadoop meer van OLAP is, omdat het wordt gebruikt voor analyses en bulkschrijven.



Waarom OLAP en OLTP integreren?

Als u op zoek bent naar de goedkoopste prijs voor hotelboekingen in de komende 365 dagen, u hier een enorme dataset voor Cassandra heeft en aanbevelingen wilt hebben over de realtime database, wordt er een promo uitgevoerd op basis van de prijs.

wat is het nut van socketprogrammering

In een dergelijk scenario moeten we alle records herhalen en er analyses op houden, wat een enorme offline klus is die vaak moet worden opgestart. Hier komt Hadoop in het spel voor het verwerken van bulkgegevens.

Het andere voordeel is dat we één cluster kunnen draaien en het uitvoeren van een ander Hadoop-cluster kunnen afbreken.



Het derde voordeel is dat men ook veel bedrijfskosten kan verlagen.

Gegeven een scenario waarin, als een gebruiker goed thuis is in verschillende Hadoop Eco-systemen, zoals Hive, Pig Latin en er gegevens in moet integreren, men een gegevensbron in Cassandra moet inpluggen en moet proberen Map Verminder ook banen.

Er is een merkbaar patroon tussen OLTP en OLAP. In OLTP is er minder aantal schrijfbewerkingen, bijv. Hotel informatie. Ervan uitgaande dat de prijswijzigingen elke 5000 keer per seconde plaatsvinden, kunnen de reads hier meer zijn. In een dergelijk scenario kan er 1 keer per seconde worden geschreven, maar kunnen er honderden en duizenden worden gelezen. Dus de verhouding hier is ongeveer 1: 1000.

Het is een interessante observatie dat Cassandra gemakkelijk in dit model past, dat modellen bevat waarbij lezen / schrijven gelijk is. Ook als het gaat om OLTP, zelfs als men in een afstembare en sterk consistentiemodel komt, kan men een milliseconde kloof zien tussen uiteindelijke consistente modellen en sterkste consistente modellen. Cassandra past dus in OLTP.

Als je naar OLAP komt, kun je verschillende OLAP-patronen zien, wat betekent dat er meerdere schrijfbewerkingen tegelijkertijd plaatsvinden. In OLAP dumpen we gegevens in één keer, d.w.z. alle logbestanden worden in de gegevensopslag geplaatst en vervolgens beginnen we met verwerken. Het datapatroon of toegangspatroon is precies het tegenovergestelde van een OLTP-applicatie. Hier zal de Hadoop of MapReduce nuttig zijn.

Heeft u een vraag voor ons? Noem ze in het opmerkingengedeelte en we nemen contact met u op.

matrix vermenigvuldigingsprogramma in java

Gerelateerde berichten:

Top 5 redenen om Cassandra te leren