SAS-zelfstudie: alles wat u moet weten over SAS



Ontdek in deze SAS Tutorial-blog wat SAS is? Wat kan het doen en begrijp waarom SAS een van de meest populaire analysetools op de markt is.

Vragen - SAS Tutorial - EdurekaWat is SAS? Waarom zou ik SAS moeten leren?Wat zijn de voordelen van ?Bent u op zoek naar antwoorden op bovenstaande vragen? Zo ja, dan ditSAS-zelfstudiebeantwoordt al uw vragen.

Wij mensen zijn een merkwaardige soort, nietwaar? We willen altijd meer weten. Dit verlangen om te weten, zorgt ervoor dat we meer vragen stellen en houdt ons op onze beurt op zoek naar meer antwoorden.





Laten we eens kijken naar een eenvoudig probleem. Wat als u wilt gaan winkelen en u heeft twee opties om uit te kiezen:

  • Een coupon van $ 149
  • 25% kortingsbon

U vraagt ​​zich misschien af ​​welke optie u zal helpen meer te besparen?Dit is een scenario. We hebben veel van dergelijke vragen en we kunnen verschillende scenario's tegenkomen waarin we geen goede beslissing kunnen nemen. Maken deze vragen je nieuwsgierigover het vinden van antwoorden? Zo ja, dan zult u analyses waarderen en ook de tools waarmee u gegevens kunt analyseren. SAS is zo'n tool.



SAS-zelfstudie

Aan het einde van het artikel moet u bekend zijn met de volgende onderwerpen:

Uw begrip van SAS is onvolledig zonder begrip gegevensanalyse.Dus laten we beginnen.

Wat is data-analyse?

Het woord 'analyse' is al een tijdje populair, maar er is geen eenduidige manier om het te definiëren. Laten we proberen analytics te begrijpen met een eenvoudig voorbeeld. Stel je voor, je wilt een T-shirt kopen. Wat zijn de mogelijke vragen die u kunt bedenken? Laat me je helpen met een paar veelvoorkomende:



  • Wanneer moet ik een T-shirt kopen?
  • Hoeveel moet ik uitgeven voor het T-shirt?
  • Moet ik het T-shirt online kopen of moet ik een winkel bezoeken?
  • Als ik besluit het T-shirt online te kopen, van welke website moet ik het dan kopen?
  • Als ik besluit om een ​​winkel te bezoeken, welke winkel moet ik dan bezoeken?

De beslissing kan afhankelijk zijn van factoren als tijd, geld, voorkeur en eerdere ervaringen. Laten we doorgaan met het bovenstaande probleem. Stel je de volgende situatie voor:

  • Zondag ben je vrij
  • Uw budget is $ 300
  • Je bezoekt liever een winkel, omdat je dan met de hand een T-shirt kunt uitkiezen
  • U besluit een bepaalde winkel te bezoeken omdat uw vorige bezoek aan de winkel u niet teleurstelde

Stel dat u op basis van de bovenstaande punten besluit om op zondag een winkel te bezoeken en een T-shirt te kopen dat u ongeveer $ 265 kost. U overwoog een aantal mogelijkheden, koos de mogelijkheden die aan de vereisten voldeden en nam een ​​beslissing.

In eenvoudige bewoordingen heb je zojuist een soort analyse gedaan om je te helpen een T-shirt te kopen. Laat me het verder vereenvoudigen. Je brein heeft hier twee simpele dingen gedaan:

  • Verzamelde informatie volgens uw vereiste
  • De gegevens begrepen en op basis van die informatie geholpen bij het kiezen van het T-shirt.

Dit is wat u kunt doen met behulp van analyses. U kunt informatie verzamelen, analyseren en betere beslissingen nemen. Het bovenstaande voorbeeld wasgemakkelijk, zodat u een beslissing kunt nemen op basis van een paar aannames. Wat als het probleem en de besluitvorming niet zo eenvoudig waren?

Beschouw dit probleem vanuit een zakelijk oogpunt.Stel, een e-commercebedrijf wil de kooppatronen van zijn klanten bestuderen op basis van de eerdere gegevens. Het bedrijf zal duizenden records moeten overwegen, nietwaar? Stel je nu de gegevens voor waar we zojuist over spraken of permutaties en combinaties die het bedrijf zou kunnen overwegen voor verschillende voorkeuren die mensen kunnen hebben.

Het is ook mogelijk dat het bedrijf niet over alle gegevens beschikt. Als een klant bijvoorbeeld geen T-shirt heeft gekocht, welke factoren hebben de klant er dan toe gebracht het T-shirt niet te kopen? Deze ontbrekende gegevens kunnen problemen veroorzaken. Hoe gaan we om met deze problemen? Hoe gaan we met dergelijke gegevens om? Goed,deze problemen worden gemakkelijker wanneer we analyses gebruiken. Door analyses te gebruiken, kunt u onnodige gegevens elimineren en de relevante informatie optimaliseren om patronen te vinden die u kunnen helpen betere beslissingen te nemen.

We hebben veel tools tot onze beschikking voor analyse en om dergelijke problemen te vereenvoudigen.Een prominente tool is SAS. Deze SAS-zelfstudie zal u helpen SAS te begrijpen en hoe het kan worden gebruikt om onze problemen op te lossen.

Abonneer je op ons YouTube-kanaal om nieuwe updates te ontvangen ..!

Behoefte aan SAS

De analytics-markt is de afgelopen jaren enorm gegroeid. Dit heeft geresulteerd in een toename van het aantal gebruikte tools. Al deze zijn op de een of andere manier gunstig. Dus laten we verder gaan met onze SAS-zelfstudie en een paar van de meest gebruikte tools op de markt bekijken.

  • SAS: Het is de meest gebruikte tool op de markt voor commerciële analyse. Met een overvloed aan statistische functies en een goede GUI (Enterprise Guide & Miner) is het zeker marktleider.
  • R: Het is een open-source software. Het is gemakkelijk om R te leren omdat het goed gedocumenteerd is. Het is kosteneffectief en heeft sterke statistische mogelijkheden.
  • Python is een andere open-source scripttaal die veel wordt gebruikt. Het gebruik van Python is in de loop van de tijd toegenomen.Tegenwoordig zijn het sportbibliotheken zoals Numpy, Scipy en MatPlotLib. U kunt met deze bibliotheken bijna elke statistische bewerking uitvoeren of elk model bouwen.

SAS Vs. R Vs. Python

Laten we deze drie tools in deze SAS-tutorial vergelijken en ik ga ter vergelijking de volgende parameters gebruiken.

1) Banen

Omdat het een essentieel hulpmiddel is voor onderzoek en analyse, heeft het zeker veel behoefte aan door SAS opgeleide middelen gegenereerd. SAS heeft 70% van het marktaandeel in handen. R bevat 15% en python heeft het minste, dat is minder dan 10%.

2) Gemakkelijk te begrijpen

SAS is een van de gemakkelijkste tools om te leren. Zelfs mensen met beperkte kennis van SQL kunnen het gemakkelijk leren. Python is niet zo handig als SAS voor analyses. R vereist dat je saaie en lange codes schrijft, waardoor SAS een voorsprong krijgt.

3) Taal van de vierde generatie

SAS is een programmeertaal van de vierde generatie. Een programmeertaal van de vierde generatie is 'een programmeertaal die is ontworpen met een specifiek doel voor ogen, zoals de ontwikkeling van commerciële bedrijfssoftware'. Het is ontworpen om de programmeerinspanning te verminderen en de tijd en kosten die nodig zijn om software te ontwikkelen te minimaliseren. R en Python zijn geen talen van de vierde generatie.

4) Flexibel

SAS blijft op de hoogte van de marktbehoeften. Het eenvoudige integratieproces maakt het flexibeler en bruikbaarder. Dit betekent ook dat het goed samengaat met andere technologieën. Het flexibel maken in ware zin.

De bovenstaande redenen ondersteunen sterk de bewering dat SAS zijn toppositie in de markt stevig vasthoudt.Dus nu we de vergelijking van deze drie analytische tools hebben gezien. Door verder te gaan in deze SAS-zelfstudie, kunnen we SAS wat meer in detail begrijpen.

SAS-zelfstudie: wat is SAS ?

Laten we nu proberen te begrijpen wat het is SAS en wat het doet?

SAS staat voor Statistical Analysis System. Het is een softwaresuite ontwikkeld door SAS Institute.

SAS-toepassingen

De onderstaande afbeelding toont een paar toepassingen van SAS:

In eenvoudige bewoordingen kan SAS complexe gegevens verwerken en zinvolle inzichten genereren waarmee organisaties betere beslissingen kunnen nemen of mogelijke resultaten in de nabije toekomst kunnen voorspellen.

Met SAS kunt u gegevens uit verschillende bronnen minen, wijzigen, beheren en ophalen en analyseren.De grafische point-and-click-gebruikersinterface van SAS helpt niet-technische gebruikers om de functies te gebruiken voor grafische bewerkingen en geavanceerde opties.

SAS-zelfstudie | SAS-zelfstudie voor gegevensanalyse | Edureka

SAS-componenten

Laten we verder gaan met onze SAS-zelfstudie en enkele belangrijke SAS-componenten bekijken:

  • SAS-basis: Het is de meest gebruikte component. Het heeft een faciliteit voor gegevensbeheer. U kunt gegevensanalyses uitvoeren met Base SAS.
  • SAS / GRAFIEK: Met het gebruik van SAS / Graph kunt u gegevens als grafieken weergeven. Dit maakt datavisualisatie eenvoudig.
  • SAS / STAT: Hiermee kunt u statistische analyses uitvoeren, zoals variantie-, regressie-, multivariate-, overlevings- en psychometrische analyse.
  • SAS / ETS: Het is geschikt voor tijdreeksanalyse.

Aangezien dit een inleidend artikel is, zullen we ons concentreren op Base SAS en ik ben er zeker van dat het voor iedereen gemakkelijk te begrijpen moet zijn.

Geïnteresseerd in het leren van SAS van experts? Schrijf nu in

SAS als programmeertaal

De meeste programmeeromgevingen zijn ofwel menugestuurd (aanwijzen en klikken) of opdrachtgestuurd (opdrachten invoeren en uitvoeren). SAS is echter noch menugestuurd noch commandogestuurd. Dit komt omdat het een reeks instructies of instructies gebruikt die bekend staan ​​als het SAS-programma. Dit programma is een weergave van wat u wilt doen en is geschreven in SAS-taal.

Gegevens

Data staat centraal in elke dataset. In SAS zijn gegevens beschikbaar in tabelvorm waarbij variabelen de kolomruimte innemen en waarnemingen de rijruimte innemen.

Gegevenstypen:

SAS behandelt getallen als numerieke gegevens en al het andere valt onder tekengegevens. Daarom heeft SAS twee gegevenstypen: numeriek en teken. Makkelijk, is het niet?

diep leren versus machine learning versus patroonherkenning

DATA step en PROC step vormen de basisbouwstenen van een SAS programma. Wat deze bouwstenen doen, is wat we in deze SAS-tutorial gaan bespreken.

Bouwstenen van SAS

We starten een programma met een DATA-stap om een ​​SAS-gegevensset te maken en geven de gegevens vervolgens door aan een PROC-stap. De PROC-stap verwerkt de gegevens. Laten we het onderstaande voorbeeld eens bekijken om te begrijpen hoe de DATA- en PROC-stappen werken.

Stel dat ik een getal in inches naar centimeters wil converteren en het resultaat wil opslaan in een variabele met de naam ‘size’ en het wil afdrukken, dan zou de stap DATA het getal in inches naar centimeters converteren en de stap PROC zou het resultaat afdrukken.

De onderstaande afbeelding toont een codefragment voor het bovengenoemde probleem:

De verklaringen zijn DATA- en PROC-stappen. De lengte van een stap kan variëren van één tot meer dan honderd uitspraken. Het is belangrijk dat u onthoud dat DATA-stappen worden gebruikt om gegevens te lezen en te wijzigen, terwijl PROC-stappen worden gebruikt om gegevens te analyseren, hulpprogramma-functies uit te voeren of rapporten af ​​te drukken.

DATA-stappen beginnen met het trefwoord DATA, gevolgd door een naam die u kiest voor uw SAS-gegevensset. Het is duidelijk dat de bovenstaande DATA-stap een dataset met de naam size oplevert. DATA-stappen lezen gegevens uit externe gegevensbestanden en kunnen ook worden gebruikt om loops en case-statements op te nemen. Het kan worden gebruikt om gegevens samen te voegen, te sorteren, te combineren en samen te voegen.

Evenzo beginnen procedures met een PROC-instructie waarbij het sleutelwoord PROC de naam van de gebruikte procedure volgt (de naam van de procedure kan bijvoorbeeld PRINT, SORT of MEAN zijn). SAS-procedures hebben meestal een handvol mogelijke uitspraken.

Elke keer dat SAS een nieuwe stap tegenkomt (gemarkeerd door een DATA- of PROC-instructie), wordt de vorige stap beëindigd of beëindigd en begint met een nieuwe.

Hoewel een typisch programma begint met een DATA-stap om gegevens in te voeren of te wijzigen, en de gegevens vervolgens doorgeeft aan een PROC-stap, is het zeker niet het enige patroon voor het combineren van DATA- en PROC-stappen. Net zoals je kuntstapel bouwstenenin elke volgorde, u kunt de DATA- en PROC-stappen in elke gewenste volgorde rangschikken. Een programma kan zelfs alleen DATA-stappen of alleen PROC-stappen bevatten.

Desalniettemin zult u het veel gemakkelijker vinden om SAS-programma's te schrijven als u deze basisfuncties begrijpt. Het bovenstaande zijn enkele basisprincipes die elke SAS-beginner zou moeten kennen. Laten we doorgaan naar het volgende deel van onze SAS-zelfstudie en laten we begrijpen hoe we de SAS-universitaire editie kunnen installeren.

Nu kunnen beginners SAS leren en oefenen, zoals SAS Institute Inc is uitgekomen SAS University-editie die gratis beschikbaar is. Alle functies die nodig zijn om Base SAS te leren, zijn hier beschikbaar. Learning Base SAS maakt het u gemakkelijk om andere componenten te leren.

De volgende stappen helpen u bij het installeren van SAS University Edition.Het is software waarmee u SAS-programmering kunt oefenen.

SAS-zelfstudie: installatie

Het installeren van SAS University Edition is eenvoudig. De beschikbaarheid ervan als virtuele machine vereist echter dat u deze in een virtuele omgeving uitvoert. U moet virtualisatiesoftware op uw pc installeren voordat u de SAS-software start. De volgende stappen helpen u bij het downloaden en instellen van de SAS-omgeving.

1) Download SAS University Edition

SAS University Edition kan worden gedownload via deze link SAS University-editie . Als u op de bovenstaande link klikt, verschijnt het volgende venster. Lees de vereiste details voordat u begint met downloaden.

2) Snelstartgids voor installatie

Mensen die helemaal nieuw zijn in het installatieproces, kunnen de volgende handleidingen en video's doorlopen die beschikbaar zijn zoals in stap 1. Het is optioneel en u kunt het overslaan als u al bekend bent.

3) Een virtualisatiesoftware opzetten

Met de links in stap 2 kunt u de geschikte virtualisatiesoftware downloaden. U kunt deze stap overslaan als u al een virtualisatiesoftware heeft geïnstalleerd.

4) Download het zip-bestand

Kies de juiste versie van de SAS University Edition-compatibelmet de virtualisatie-omgeving die u heeft. Het wordt gedownload als een zip-bestand. De naamzou lijken op: ‘Unvbasicvapp_9411005_vmx_en_sp0_1.zip’

5) Pak het zip-bestand uit

Pak het bovenstaande gezipte bestand uit en bewaar het in een geschikte map.

6) Het laden van de virtuele machine

Open en start uw VMware-speler, zoek naar een bestand dat eindigt op de extensie .vmx en open het. Het volgende scherm wordt zichtbaar. Noteer de basisinstellingen zoals toegewezen geheugen en hardeschijfruimte voor uw referentie.

7) Schakel de virtuele machine in

Klik op het Schakel deze virtuele machine in naast de groene pijlmarkering, kunt u de virtuele machine starten. Het volgende scherm zou moeten verschijnen.

Tijdens het laden verschijnt het volgende scherm. Hierna kun je de virtuele machine draaien. U krijgt een prompt om naar de URL te gaan die de SAS-omgeving opent.

8) S. bij SAS Studio

Open een nieuw tabblad in uw browser en laad de URL die in de bovenstaande afbeelding is gemarkeerd. Het volgende scherm zou verschijnen om de gereedheid van de SAS-omgeving aan te geven. Mogelijk krijgt u een andere URL omdat de URLkan verschillen van pc tot pc.

Je mag de studio beginnen en je bent klaar om te gaan.

welke van de volgende zijn voorbeelden van controleverklaringen?

Een SAS-programma uitvoeren

Nu we hebben begrepen hoe we SAS University Edition moeten installeren, laten we in onze SAS-zelfstudie een voorbeeld van een SAS-programma bekijken.

De onderstaande code laat zien hoe u een Fibonacci-reeks afdrukt. Mocht u niet weten wat een Fibonacci-reeks is, laat me die dan voor u definiëren.

De Fibonacci-reeks is een reeks getallen die begint met een een of een nul, gevolgd door een een, en verloopt op basis van de regel dat elk getal (een Fibonacci-getal genoemd) gelijk is aan de som van de voorgaande twee getallen. Als de Fibonacci-reeks wordt aangeduid met F (n), waarbij n de eerste term in de reeks is, toont de volgende vergelijking de Fibonacci-reeks voor n = 0, waarbij de eerste twee termen volgens afspraak als 0 en 1 worden gedefinieerd:

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

In een bepaalde context is het gebruikelijk om n = 1 te gebruiken. In dat geval worden de eerste twee termen standaard gedefinieerd als 1 en 1, en dus:

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

Laten we eens kijken naar deze SAS-code die een Fibonacci-reeks genereert die begint met één.

DATA Fibonacci Do i = 1 tot 10 Fib = Som (Fib, lag (Fib)) als i = 1 dan Fib = 1 uitvoer einde PROC PRINT Fibonacci Run

In de bovenstaande code hebben we een functie gedefinieerd genaamd ‘Fib’ om het volgende getal te berekenen. Fib is gelijk aan de som van het huidige Fib-getal en het vorigeFibonacciaantal. We gebruiken de lag-functie om de laatste functie op te halen en om de waarde van het vorige fib-nummer op te halen.

De volgende afbeelding toont de uitvoer van de bovenstaande code. We hebben de procedure PROC PRINT gebruikt om de output in gedrukte vorm weer te geven.

Ik hoop dat je deze SAS-tutorialblog leuk vond. Dit was de eerste blog van de SAS Tutorial-blogserie. Mijn volgende blog gaat over SAS-programmeren, lees dat ook om te leren hoe je programma's in SAS schrijft.

Als je SAS wilt leren en een carrière in het analytische domein wilt opbouwen, bekijk dan onze die wordt geleverd met live training onder leiding van een instructeur en real-life projectervaring.Deze training zal je helpen SAS diepgaand te begrijpen en je te helpen beheersenverschillende concepten van SAS-taal.

Geïnteresseerd in het leren van SAS van experts? Schrijf nu in

Heeft u een vraag voor ons? Vermeld het in het opmerkingengedeelte en we nemen contact met u op.