Ik heb gegevens in mijn juwelendoos

Deze blog probeert het gebruik en de functies van datawarehouse en het belang ervan voor alle bedrijven te beschrijven.

Elke vrouw heeft een probleem met het beheer van haar bezittingen. Van kleding tot accessoires, ze heeft dat ene ding nodig dat haar helpt al haar spullen op één plek op te bergen. Ik kan me niet voorstellen dat ik ongeorganiseerd ben en ik weet zeker dat de meesten van jullie die dit lezen het met me eens zijn. Waarom is het zo moeilijk om georganiseerd te zijn? Meestal was ik haveloos vanwege die reden dat ik een obsessief-compulsieve persoon was.



De reden dat ik dit ter sprake bracht, was omdat ik toevallig verschillende artikelen over datawarehousing las en ik aan mezelf moest denken. Net als mijn fundamentele obsessie om al mijn bezittingen op één plek in de juiste volgorde te hebben, verwachten bedrijven tegenwoordig hetzelfde. Er is een kans dat uw ideeën over datawarehousing wazig zijn. Er zijn veel mensen die nog steeds geen idee hebben van hetzelfde.

Datawarehouses worden tegenwoordig veel gebruikt binnen organisaties. Aangenomen wordt dat het gebruik ervan in de komende jaren geleidelijk zal toenemen. In uitdagende tijden wordt het nemen van slimme beslissingen en het efficiënt beheren van gegevens erg cruciaal, en dat is wanneer datawarehouse er perfect in past. Het concept van datawarehousing is niet moeilijk te begrijpen. Het idee is om een ​​permanente opslagruimte te creëren voor de gegevens die nodig zijn om rapportage, analyse en andere BI-functies te ondersteunen.

Het concept van datawarehousing is eenvoudig. Gegevens worden periodiek uit de applicaties gehaald die bedrijfsprocessen ondersteunen en naar speciale computers gekopieerd. Daar kan het worden gevalideerd, opnieuw geformatteerd, gereorganiseerd, samengevat, geherstructureerd en aangevuld met gegevens uit andere bronnen (The Data Warehouse is mijn accessoirebox. Net zoals het beheren van mijn reeks verspreide accessoires in miniboxen, die op hun beurt worden opgeslagen in één grote doos) . Het datawarehouse wordt de belangrijkste informatiebron voor het genereren, analyseren en presenteren van rapporten via ad-hocrapporten, portals en dashboards. (Het wordt voor mij gemakkelijker om te vinden welk accessoire in welke doos wordt bewaard)

Functies van een datawarehouse

1. Draait op computers die speciaal voor deze functie zijn bedoeld. (Mijn gedachten)

2. Draait op een databasebeheersysteem (DBMS) (reeks andere miniboxen waarin mijn accessoires zijn opgeslagen)

3. Bewaart gegevens gedurende een lange periode. (Bewaart mijn accessoires voor een lange periode)

4. Combineert gegevens die uit veel bronnen zijn verkregen (slaat een reeks accessoires op die op verschillende plaatsen zijn verspreid)

5. Gebouwd rond een zorgvuldig ontworpen datamodel dat productiegegevens transformeert van een ontwerp voor gegevensinvoer met hoge snelheid naar een ontwerp dat het ophalen van gegevens met hoge snelheid ondersteunt. (Mijn keuze om de perfect ontworpen doos te kiezen voor al mijn accessoires en het onderscheid te maken tussen een goede en een middelmatige doos)

Het moeilijkste aan het maken van een goed datawarehouse is het ontwerp van dat model waarrond het is gebouwd. Er moeten beslissingen worden genomen over de namen die aan elk veld moeten worden gegeven, of elk gegevensmodel opnieuw moet worden geformatteerd en welke metagegevensvelden moeten worden berekend en toegevoegd. Als een datawarehouse eenmaal operationeel is, is het belangrijk dat het datamodel stabiel blijft. Als dit niet het geval is, moeten rapporten die op basis van de gegevens zijn gemaakt, worden gewijzigd wanneer het gegevensmodel verandert.

twitter sentimentanalyse met behulp van spark

Als er eenmaal een datawarehouse is en goed gevuld is met gegevens, beginnen goede dingen te kraken. Sommigen van hen zijn als volgt:

1. Genereren van geplande rapporten

2. Verpakte analytische toepassingen

3. Ad-hocrapportage en analyse

4. Dynamische presentatie via dashboards

5. Drill-down mogelijkheid

6. Datamining

7. Beveiliging

Deze voordelen maken BI op basis van datawarehousing tot een cruciale beheertool voor bedrijven die een bepaald niveau van complexiteit hebben bereikt.

Enkele van de grote merken met datawarehouse

appel

Apple heeft een Teradata-systeem van meerdere petabytes. Apple gebruikt het datawarehouse om een ​​beter begrip te krijgen van zijn klanten in verschillende productgroepen. Nu genereert elk stukje identificeerbare informatie en die i Tunes-interacties veel gegevens die het systeem ingaan, zodat het bedrijf weet wie wie is en wat ze van plan zijn.

Walmart

De retailgigant implementeerde in 1992 de allereerste database op terabyte-schaal van Teradata en is sindsdien een beetje gegroeid. Het operationele systeem bedroeg vanaf 2008 2,5 petabyte en is nu zeker een sprong en een groter bereik - waarschijnlijk ver in de dubbele cijfers als je bedenkt dat het aparte versies voor Walmart en Sam's Club gebruikt, evenals een back-upsysteem. De analyse-inspanningen hebben er in wezen toe geleid dat Walmart een enorme consignatiewinkel is geworden.

ebay

eBay heeft twee systemen en ze zijn allebei groot. Het primaire datawarehouse is 9,2 petabytes en het 'singulariteitssysteem' dat webclicks en andere 'big' data opslaat is meer dan 40 petabytes. Het heeft een enkele tabel met 1 biljoen rijen. Ja, dit is kleiner dan de 50 petabytes aan Hadoop-capaciteit die eBay vorig jaar heeft toegevoegd, maar Teradata wijst er snel op dat al zijn systemen gegevens van en naar Hadoop ondersteunen, dus het is niet alsof eBay twee volledig verschillende gegevens gebruikt omgevingen.

Starbucks

Sinds 1971 zet Starbucks Coffee Company zich in voor het ethisch inkopen en branden van koffie van de hoogste kwaliteit ter wereld. Ze gebruiken een krachtig datawarehouse voor ondernemingen met verkoop-, marketing-, winkelbeheer-, verkooppunt-, klantloyaliteits- en toeleveringsketengegevens om beter geïnformeerde zakelijke beslissingen te nemen op bedrijfs-, regionaal en winkelniveau.

Hier zijn een paar interessante gebruiksscenario's:

Continental Airlines besloot dat het haar klanten tevreden wilde houden en begon ze te beoordelen op basis van hun levenslange waarde en begon alternatieve regelingen voor hen te treffen zodra de luchtvaartmaatschappij zich realiseerde dat vluchten zouden worden vertraagd.

wat is een token in java

Een luxeautobedrijf gebruikte Aster Data om het patroon van defecten voor verschillende componenten in zijn auto's te analyseren. Het ontdekte dat verlichting, stoelen en infotainment vaak samen faalden (ze bevinden zich op hetzelfde circuit) en begon ze alle drie te inspecteren wanneer een klant op een van hen voor service kwam.

Waarom mag u een datawarehouse niet missen?

De waarde van datawarehouse neemt in de loop van de tijd toe en het loont om alles op één plek neer te zetten. Een vertraging bij het hebben ervan kan u kosten, aangezien uw concurrenten de kans hebben gegrepen.

1. Harde besparingen komen van zaken als het ontdekken van verloren kortingen op schulden of dat verkopers kortingen aanbieden die verder gaan dan de goedgekeurde limieten.

2. Real-time consolidatie van financiële gegevens wordt praktisch en debatten over welke gegevensbron de juiste is.

3. De IT-kosten en het personeel dat zich met rapportage bezighoudt, worden aanzienlijk verminderd.

verschil tussen ansible en chef

4. Door gegevens uit verschillende bronnen te verstrekken, hoeven managers en leidinggevenden niet langer zakelijke beslissingen te nemen op basis van beperkte gegevens of hun buik.

5. Een datawarehouse slaat grote hoeveelheden historische gegevens op, zodat u verschillende tijdsperioden en trends kunt analyseren om toekomstige voorspellingen te doen.

6. Datawarehouse werkt eraan om u zoveel tijd te besparen. Ze besparen tijd door de informatie van een bedrijf op één locatie op te slaan. In plaats van het op verschillende locaties te hebben, maakt een gecentraliseerde het beter.

Heeft uw bedrijf een datawarehouse nodig?

De gegevens die uw bedrijf genereert, zijn van grote waarde voor uw bedrijf. U wilt ervoor zorgen dat al uw gegevens veilig zijn en op elk moment toegankelijk zijn. Maar tegenwoordig zijn de gegevens enorm gegroeid en vinden bedrijven een manier om ze te beheren. Datawarehouse lijkt in dit geval een goede gok. Maar de echte vraag is: heeft uw bedrijf er echt een nodig?

1. Afhankelijkheid van spreadsheets

Het gebruik van spreadsheets is van grote waarde geworden omdat het tegenwoordig een van de belangrijkste zakelijke tools is. In deze spreadsheets kan een enorme hoeveelheid gegevens worden opgeslagen. Het probleem doet zich voor wanneer de omvang van de gegevens begint toe te nemen. Elke afdeling heeft spreadsheets waaruit u gegevens moet halen om een ​​rapport te genereren. Als dit het geval is, moet u handmatige rapporten maken, wat veel tijd kan kosten. Wanneer dit gebeurt, komt het datawarehouse in beeld om het gemakkelijker te maken, omdat het moeilijk is om de gegevens te vinden omdat deze over verschillende bladen zijn verspreid.

2. Lange wachttijd

Als u een rapport aan het ontwikkelen bent en u erachter komt dat u moet wachten tot collega's de informatie in hun spreadsheets verstrekken of om hun gegevens te analyseren, kan het zijn dat u langer moet wachten. Het implementeren van een datawarehouse kan helpen om gegevens te centraliseren en deze effectiever beschikbaar te maken voor alle teamleden. Dit vermindert de tijd die nodig is om het daadwerkelijk op te sporen en te communiceren met collega's.

3. Verschillen in gegevens en rapporten

Wanneer teamleiders of leden van verschillende afdelingen rapporten maken, zijn de gegevens of bevindingen anders dan die van u of andere rapporten. Dit is niet alleen frustrerend, het is ook tijdrovend om uit te zoeken en kan tot kostbare fouten leiden. Als u op enig moment het gevoel heeft dat er inconsistentie in uw gegevens zit, kunt u misschien overwegen om een ​​datawarehouse aan te schaffen.

4. Tijd besteed aan het genereren van rapporten

Idealiter zouden we in staat moeten zijn om vrijwel onmiddellijk een rapport te genereren met bestaande gegevens. Als u bij het genereren van een rapport merkt dat u steeds naar verschillende bronnen moet gaan om te controleren of de gegevens zijn bijgewerkt, of als u andere bronnen handmatig moet blijven bijwerken, zult u merken hoeveel tijd er nodig is om een ​​rapport te ontwikkelen.

Omdat datawarehouses gegevens consolideren, hoeft u zich maar naar één bron voor gegevens te wenden. Combineer met het feit dat veel datawarehouses kunnen worden ingesteld om automatisch te updaten als brongegevens worden bijgewerkt of gewijzigd, en u kunt garanderen dat de gegevens die u gebruikt altijd correct zijn.

Heeft u een vraag voor ons? Vermeld ze in het opmerkingengedeelte en we nemen contact met u op.

Gerelateerde berichten: