R Tutorial - Een beginnershandleiding om R-programmering te leren



Deze blog over R Tutorial laat je kennismaken met de R-tool en helpt je de verschillende grondbeginselen van R-programmering in detail te begrijpen met voorbeelden.

R is de meest populaire tool voor gegevensanalyse, omdat het open-source is, flexibel is, meerdere pakketten biedt en een enorme community heeft. Het is ontworpen voor zowel softwareprogrammeurs, statistici als datamijners en heeft daardoor de populariteit van .In deze R Tutorial-blog geef ik je een compleet inzicht over R met voorbeelden.

Hieronder staan ​​de onderwerpen in deze R Tutorial-blog die ik in de volgende volgorde zal bespreken:





  1. Waarom hebben we Analytics nodig? ?
  2. Wat is Business Analytics ?
  3. Waarom R en wie R gebruikt ?
  4. Installatie van R
  5. Gegevensoperatoren
  6. Gegevenstypen
  7. Flow Control

R-zelfstudie: waarom hebben we analyse nodig?

Voordat ik de vraag beantwoord, wil ik u eerst kort informeren over enkele van de problemen en hun oplossingen in R in meerdere domeinen.



bankieren - R Tutorial - Edureka

Bankieren :

Elke dag worden in Banks grote hoeveelheden klantgegevens gegenereerd. W.Hoewel we regelmatig met miljoenen klanten te maken hebben, wordt het moeilijk om hun hypotheken te volgen.



Oplossing :

R bouwt een aangepast model dat de aan elke individuele klant verstrekte leningen handhaaft, wat ons helpt bij het bepalen van het door de klant te betalen bedrag in de loop van de tijd.

Verzekering :

Verzekering is in hoge mate afhankelijk van prognoses. Het is moeilijk ombeslissen welk beleid u wilt accepteren of afwijzen.

Oplossing:

Door het doorlopende kredietrapport als input te gebruiken, kunnen we een model in R creëren dat niet alleen de risicobereidheid beoordeelt, maar ook een voorspellende prognose maakt.

Gezondheidszorg:

Elk jaar worden miljoenen mensen in het ziekenhuis opgenomen en worden miljarden uitgegeven alleen al aan het opnameproces.

Oplossing :

Gezien de geschiedenis van de patiënt en de medische geschiedenis, kan een voorspellend model worden gebouwd om te identificeren wie het risico loopt op ziekenhuisopname en in welke mate de medische apparatuur moet worden geschaald.

Nu weten we hoe data-analyse organisaties helpt hun data te benutten en te gebruiken om nieuwe kansen te identificeren. Als we het hebben over de behoefte aan analytics in een organisatie, dan moet je deze 4 aspecten tegenkomen:

Laten we vervolgens verder gaan in de R-tutorialblog, waar we eerst zullen begrijpen wat precies bedrijfsanalyse is.

R Tutorial: Wat is Business Analytics?

Bedrijfsanalyses is een proces waarbij grote hoeveelheden gegevens worden onderzocht en verborgen patronen, correlaties en andere inzichten worden verkregen. Het helpt u in feite alle gegevens te begrijpen die u heeft verzameld, of het nu gaat om organisatiegegevens, markt- of productonderzoeksgegevens of andere soorten gegevens. Het wordt gemakkelijk voor u om betere beslissingen te nemen, betere producten, betere marketingstrategieën enz. Raadpleeg de onderstaande afbeelding voor een beter begrip:

Als u naar de bovenstaande afbeelding kijkt, zijn uw gegevens in de eerste afbeelding verspreid. Als u nu iets specifieks wilt, zoals een bepaald record in een database, wordt het omslachtig. Om dit te vereenvoudigen, heb je analyse nodig. Met analyse wordt het gemakkelijk om een ​​verband tussen de gegevens te vinden. Als u eenmaal heeft vastgesteld wat u moet doen, wordt het voor u vrij gemakkelijk om beslissingen te nemen, zoals welk pad u wilt volgen of, in termen van bedrijfsanalyses, welk pad zal leiden tot de verbetering van uw organisatie.

Maar u kunt niet verwachten dat mensen in de bovenstaande keten altijd de onbewerkte gegevens begrijpen die u hen na analyse verstrekt. Dus om deze kloof te overbruggen, hebben we een concept van data visualisatie .

Data visualisatie : Datavisualisatie is een visuele toegang tot enorme hoeveelheden gegevens die u na analyse hebt gegenereerd. De menselijke geest verwerkt visuele afbeeldingen en visuele afbeeldingen zijn beter dan te vergelijken met onbewerkte gegevens. Het is voor ons altijd gemakkelijk om een ​​cirkeldiagram of een staafdiagram te vergelijken met onbewerkte getallen. Nu vraagt ​​u zich misschien af ​​hoe u deze gegevensvisualisatie kunt bereiken op basis van de gegevens die u al hebt geanalyseerd?
Er zijn verschillende tools beschikbaar op de markt voor datavisualisatie:

Jullie moeten je allemaal afvragen dat er al zoveel tools zijn die je helpen om datavisualisatie en een bepaalde hoeveelheid analyses te realiseren, waarom zou je voor R gaan?

Dus mijn volgende onderwerp in de R-tutorialblog gaat over ‘waarom R’ en ‘wie gebruikt R’.

R-zelfstudie: waarom R en wie gebruikt R?

Waarom R?

R is een programmeer- en statistische taal.

R wordt gebruikt voor data-analyse en visualisatie.

R is eenvoudig en gemakkelijk te leren, lezen en schrijven.

R is een voorbeeld van een FLOSS (Free Libre and Open Source Software) waar men vrijelijk kopieën van deze software kan verspreiden, de broncode kan lezen, wijzigen, enz.

Wie gebruikt R?

  • Het Consumer Financial Protection Bureau gebruikt R voor gegevensanalyse
  • Statistici bij John Deere gebruiken R voor tijdreeksmodellering en geospatiale analyse op een betrouwbare en reproduceerbare manier.
  • Bank of America gebruikt R voor rapportage.
  • R maakt deel uit van de technologiestack achter de beroemde aanbevelingsengine van Foursquare.
  • ANZ, de vierde grootste bank in Australië, gebruikt R voor kredietrisicoanalyse.
  • Google gebruikt R om economische activiteit te voorspellen.
  • Mozilla, de stichting die verantwoordelijk is voor de Firefox-webbrowser, gebruikt R om webactiviteit te visualiseren.

Hieronder staan ​​enkele van de domeinen waarin R wordt gebruikt:

Laten we nu verder gaan in de R-tutorialblog en R.

R Tutorial: Installatie van R

Ik zal u begeleiden bij het installeren van R op uw systeem. Volg gewoon de onderstaande stappen:

Stap 1 : Ga naar de link- https://cran.r-project.org/

Stap 2 : Download en installeer R 3.3.3 op uw systeem.

Raadpleeg de onderstaande schermafbeelding voor een beter begrip.

matrix vermenigvuldigingsprogramma in java

Door de bovenstaande stappen te volgen, bent u klaar met het R-installatiegedeelte. Nu kunt u direct beginnen met coderen in R door RStudio IDE te downloaden. Volg de onderstaande stappen om dit te downloaden:

Stap 1 : Ga naar de link- https://www.rstudio.com/

Stap 2 : Download en installeer Rstudio op uw systeem.

Nadat je alles hebt geïnstalleerd, ben je helemaal klaar om te coderen!

R Tutorial voor beginners | R Programmeerhandleiding | Edureka

Laten we vervolgens verder gaan in de R Tutorial-blog en begrijpen wat gegevensoperatoren in R.

R Tutorial: Data Operators in R

Er zijn voornamelijk 5 verschillende soorten operators, die hieronder worden opgesomd:

  1. Rekenkundige operatoren : Voer rekenkundige bewerkingen uit zoals optellen, aftrekken, vermenigvuldigen, delen enz.
  2. Toewijzingsoperatoren :Toewijzingsoperatoren worden gebruikt om waarden toe te wijzen. Bijvoorbeeld:
  • Toewijzing Operator =
    Syntaxis:
    variabele naam = waarde
> x = 5 >X 
Uitgang: [1] 5
  • Toewijzing Operator<-
    Syntaxis:
    variabele naam<- value

    > x<- 15 > x
    Uitgang: [1] 15
  • Toewijzing Operator<<-
    Syntaxis:
    variabele naam<<- value
> x<<- 2 > x
Uitgang: [1] 2
  • Toewijzing Operator ->
    Syntaxis:
    waarde -> naam van de variabele

    > 25 -> x > x 
    Uitgang: [1] 25

3. Relationele operator : Het definieert een relatie tussen twee entiteiten. Bijvoorbeeld: ,<=,!= etc.

> xx! = 2
Uitgang:[1] WAAR

4. Logische operators : Deze operators vergelijken de twee entiteiten en worden meestal gebruikt met booleaanse (logische) waarden zoals &, | en!.

> x2 en 3
Uitgang:[1] WAAR

5. Speciale operators : Deze operators worden voor specifieke doeleinden gebruikt, niet voor logische berekeningen. Bijvoorbeeld:

  • Het maakt de reeks getallen op volgorde voor een vector.

    > xx
    Uitgang: [1] 2 3 4 5 6 7 8
  • % in% Deze operator wordt gebruikt om te identificeren of een element tot een vector behoort.
    Voorbeeld

    > xyy% in% x
    Uitvoer: [1] WAAR

R Zelfstudie: gegevenstypen

Datatypes worden gebruikt om informatie op te slaan. In R hoeven we een variabele niet als een gegevenstype te declareren. De variabelen worden toegewezen met R-objecten en het datatype van het R-object wordt het datatype van de variabele.Er zijn hoofdzakelijk zes gegevenstypen aanwezig in R:

Laten we op elk ervan dieper ingaan:

Vector : Een vector is een reeks gegevenselementen van hetzelfde basistype. Voorbeeld:

vtr = (1, 3, 5, 7 9)

of

vtr<- (1, 3, 5 ,7 9)

Er zijn 5 atomaire vectoren, ook wel aangeduid als vijf klassen van vectoren.

Lijst : Lijsten zijn de R-objecten die elementen van verschillende typen bevatten, zoals & min-getallen, tekenreeksen, vectoren en een andere lijst erin.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = lijst (n, s, WAAR) > x

Uitvoer -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] WAAR

Arrays : Arrays zijn de R-gegevensobjecten die gegevens in meer dan twee dimensies kunnen opslaan. Het heeft vectoren als invoer nodig en gebruikt de waarden in de parameter dim om een ​​array te maken.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) resultaat<- array(c(vector1,vector2),dim = c(3,3,2))

Uitvoer -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Arrays : Matrices zijn de R-objecten waarin de elementen in een tweedimensionale rechthoekige lay-out zijn gerangschikt. Een matrix wordt gemaakt met de functie matrix (). Voorbeeld: matrix (data, nrow, ncol, byrow, dimnames) waar,

gegevens is de invoervector die de gegevenselementen van de matrix wordt.

nrow is het aantal rijen dat moet worden gemaakt.

ncol is het aantal kolommen dat moet worden gemaakt.

byrow is een logische aanwijzing. Indien WAAR, dan worden de ingevoerde vectorelementen gerangschikt op rij.

dimnaam zijn de namen die zijn toegewezen aan de rijen en kolommen.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Uitvoer :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Factoren : Factoren zijn de data-objecten die worden gebruikt om de data te categoriseren en als niveaus op te slaan. Ze kunnen zowel strings als gehele getallen opslaan. Ze zijn nuttig bij data-analyse voor statistische modellering.

> gegevens<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Uitvoer :

[1] Oost West Oost Noord Noord Oost West West Oost Niveaus: Oost Noord West

Dataframes : Een dataframe is een tabel of een tweedimensionale matrixachtige structuur waarin elke kolom waarden van één variabele bevat en elke rij één set waarden uit elke kolom.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > cijfers = c (623.3.515.2.611.0.729.0.843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Uitvoer :

std_id std_name markeringen 1 1 Rick 623.30 2 2 en 515.20 3 3 Michelle 611.00 4 4 Ryan 729,00 5 5 Gary 843,25

Hierdoor komen we aan het einde van verschillende gegevenstypen in R. Laten we vervolgens verder gaan in de R Tutorial-blog en een ander belangrijk concept begrijpen: flow control statements.

R Tutorial: Flow Control-verklaringen

Flow control-instructies spelen een zeer belangrijke rol, omdat ze u in staat stellen om de stroom van uitvoering van een script binnen een functie te regelen. De meest gebruikte flow control-statements worden weergegeven in de onderstaande afbeelding:

Laten we ze nu allemaal met voorbeelden bespreken.

R Tutorial: Selector-verklaringen

  • Als control Statement : Deze controleverklaring evalueert een enkele voorwaarde. Het is vrij eenvoudig omdat het slechts een enkel trefwoord 'if' heeft, gevolgd door de voorwaarde en vervolgens een bepaalde reeks instructies die moeten worden uitgevoerd voor het geval het waar is. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In dit stroomschema reageert de code op de volgende manier:

  1. Allereerst komt het in de lus waar het de conditie controleert.
  2. Als de voorwaarde waar is, wordt de voorwaardelijke code of de geschreven verklaringen uitgevoerd.
  3. Als de voorwaarde onwaar is, worden de instructies genegeerd.

Hieronder ziet u een voorbeeld van als control statement in R. Probeer dit voorbeeld uit te voeren in R Studio.

x = 2 herhaal {x = x ^ 2 print (x) if (x> 100) {break}

Uitgang:

[1] 4 [1] 16 [1] 256
  • If Else Control Statement :Examens type controleverklaringevalueert een groep voorwaarden en selecteert de uitspraken. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In dit stroomschema reageert de code op de volgende manier:

  1. Allereerst komt het in de lus waar het de conditie controleert.
  2. Als de voorwaarde waar is, worden de eerste ‘if’ -instructies uitgevoerd.
  3. Als de voorwaarde onwaar is, gaat het naar de ‘anders als’ voorwaarde en als deze waar is, wordt de ‘anders als’ -code uitgevoerd.
  4. Als ten slotte de ‘else if’ -code ook onwaar is, gaat deze naar de ‘else'-code en wordt deze uitgevoerd. Dit betekent dat als geen van deze voorwaarden waar is, de ‘else’ -instructie wordt uitgevoerd.

Hieronder ziet u een voorbeeld van als anders control statement in R. Probeer dit voorbeeld uit te voeren in R Studio.

x5) {print ('x is groter dan 5')} elseif (x == 5) {print ('x is gelijk aan 5')} anders {print ('x is niet groter dan 5')}

Uitgang:

[1] 'x is gelijk aan 5'
  • Schakel tussen verklaringen : Deze controleverklaringen worden in principe gebruikt om een ​​bepaalde uitdrukking te vergelijken met een bekende waarde. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In dit stroomdiagram van de Switch-casus reageert de code in de volgende stappen:

  1. Allereerst komt het in de schakelkast met een uitdrukking.
  2. Vervolgens gaat het naar de voorwaarde van geval 1, controleert de waarde die aan de voorwaarde is doorgegeven. Als het waar is, wordt het instructieblok uitgevoerd. Daarna zal het uit die schakelkast breken.
  3. Als het vals is, wordt overgeschakeld naar het volgende geval. Als de voorwaarde van Geval 2 waar is, voert het de instructie uit en breekt het uit dat geval, anders springt het opnieuw naar het volgende geval.
  4. Laten we nu zeggen dat u geen enkel geval hebt gespecificeerd of dat er een verkeerde invoer van de gebruiker is, dan zal het naar het standaardgeval gaan waar het uw standaardverklaring zal afdrukken.

Hieronder ziet u een voorbeeld van de instructie switch in R. Probeer dit voorbeeld uit te voeren in R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Uitgang:

[1] 275

R Tutorial: Loop-verklaringen

Lussen helpen je om bepaalde acties te herhalen, zodat je ze niet herhaaldelijk hoeft uit te voeren. Stel je voor dat je een bewerking 10 keer moet uitvoeren, als je de code voor elke keer begint te schrijven, neemt de lengte van het programma toe en zou het moeilijk voor je zijn om het later te begrijpen. Maar door tegelijkertijd een lus te gebruiken, als ik dezelfde instructie in een lus schrijf, bespaart het tijd en wordt de leesbaarheid van de code gemakkelijker. Het wordt ook meer geoptimaliseerd met betrekking tot code-efficiëntie.

In de bovenstaande afbeelding, ‘ herhaling' en ‘ terwijl ‘Verklaringen helpen u een bepaalde set regels uit te voeren totdat de voorwaarde waar is, maar’ voor' is een lusinstructie die wordt gebruikt als je weet hoe vaak je een instructieblok wilt herhalen. Als je nu weet dat je het 10 keer wilt herhalen, dan ga je met 'for'-statement, maar als je niet zeker weet hoe vaak je de code wilt laten herhalen, ga je met' repeat 'of 'herhalingslus.

Laten we ze allemaal bespreken met voorbeelden.

  • Herhaling : De herhaallus helpt om dezelfde set code keer op keer uit te voeren totdat aan een stopvoorwaarde is voldaan. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In het bovenstaande stroomschema reageert de code in de volgende stappen:

  1. Allereerst zal het een set code invoeren en uitvoeren.
  2. Vervolgens zal het de voorwaarde controleren, als het waar is, zal het teruggaan en dezelfde set code opnieuw uitvoeren totdat het bedoeld is als onwaar.
  3. Als het onwaar blijkt te zijn, verlaat het de lus direct.
  • Terwijl : De while-instructie helpt ook om dezelfde set code keer op keer uit te voeren totdat aan een stopvoorwaarde is voldaan. Raadpleeg het onderstaande stroomschema voor een beter begrip:

tableau data blending werkt niet

In het bovenstaande stroomschema reageert de code in de volgende stappen:

  1. Allereerst wordt de toestand gecontroleerd.
  2. Als blijkt dat het waar is, zal het de set code uitvoeren.
  3. Vervolgens controleert het opnieuw de voorwaarde, als deze waar is, zal het dezelfde code opnieuw uitvoeren. Zodra blijkt dat de voorwaarde onwaar is, verlaat deze de lus onmiddellijk.

Hieronder ziet u een voorbeeld van de while-instructie in R. Probeer dit voorbeeld uit te voeren in R Studio.

x = 2 terwijl (x<1000) { x=x^2 print(x) } 

Uitgang:

4 16256 65536

Dus je moet je afvragen hoe deze twee uitspraken verschillen? Laat me je twijfel wegnemen!
Hier is het belangrijkste verschil tussen de herhalings- en while-verklaring dat deze verandert met betrekking tot uw toestand. Terwijl lus definieert in feite wanneer u de lus gaat openen om de instructies uit te voeren en herhaling loop definieert wanneer je de loop verlaat na het uitvoeren van de statements. Dus deze twee verklaringen staan ​​bekend als de ingangscontrole en de uitgangscontrole. Dat is hoe terwijl en herhaalde uitspraken verschillen.

  • For loop: For-lussen worden gebruikt wanneer u een codeblok meerdere keren moet uitvoeren. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In het bovenstaande stroomschema reageert de code in de volgende stappen:

  1. Allereerst is er initialisatie waarbij u specificeert hoe vaak u de lus wilt herhalen.
  2. Vervolgens controleert het de toestand. Als de voorwaarde waar is, wordt de set code het opgegeven aantal keren uitgevoerd.
  3. Zodra blijkt dat de voorwaarde onwaar is, verlaat deze de lus onmiddellijk.

Hieronder ziet u een voorbeeld van een for-instructie in R. Probeer dit voorbeeld uit te voeren in R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Uitgang:

7 19 25 65 45

Laten we vervolgens naar onze laatste reeks uitspraken in de R Tutorial-blog gaan, d.w.z. spronginstructies.

R Tutorial: Jump-verklaringen

Break-verklaring : Break-instructies helpen om het programma te beëindigen en hervatten de controle naar de volgende instructie die volgt op de lus. Deze verklaringen worden ook gebruikt in switchcase. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In het bovenstaande stroomschema reageert de code in de volgende stappen:

  1. Allereerst komt het in de lus waar het de conditie controleert.
  2. Als de lusvoorwaarde onwaar is, verlaat deze de lus direct.
  3. Als de voorwaarde waar is, wordt de verbrekingstoestand gecontroleerd.
  4. Als de onderbrekingsvoorwaarde waar is, bestaat deze uit de lus.
  5. Als de onderbrekingsvoorwaarde onwaar is, voert het de instructies uit die in de lus blijven en herhaalt vervolgens dezelfde stappen.

Hieronder ziet u een voorbeeld van een jump-instructie in R. Probeer dit voorbeeld uit te voeren in R Studio.

X<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Uitgang:

[1] 1 [1] 2

Volgende verklaring : Een volgende instructie wordt gebruikt als u de huidige iteratie van de lus wilt overslaan zonder deze te beëindigen. De volgende verklaring lijkt veel op ‘doorgaan’ in een andere programmeertaal. Raadpleeg het onderstaande stroomschema voor een beter begrip:

In het bovenstaande stroomschema reageert de code in de volgende stappen:

  1. Allereerst komt het in de lus waar het de conditie controleert.

  2. Als de lusvoorwaarde onwaar is, verlaat deze de lus direct.

  3. Als de lusvoorwaarde waar is, worden blok 1-instructies uitgevoerd.

  4. Daarna zal het controleren op ‘volgende’ verklaring. Als het aanwezig is, worden de instructies daarna niet in dezelfde iteratie van de lus uitgevoerd.

  5. Als ‘next’ statement niet aanwezig is, worden alle instructies daarna uitgevoerd.

Hieronder ziet u een voorbeeld van de volgende instructie in R. Probeer dit voorbeeld uit te voeren in R Studio.

for (i in 1:15) {if ((i %% 2) == 0) {next} print (i)}

Uitgang:

1 3 5 7 9 11 13 15

Dit is het einde van de R-tutorialblog. Ik hoop dat jullie duidelijk zijn over elk concept dat ik hierboven heb besproken. Blijf op de hoogte, mijn volgende blog zal over R-training gaan, waar ik nog wat meer concepten van R in detail zal uitleggen met exruim.

Nu je de basisprincipes van R hebt begrepen, kun je het door Edureka, een vertrouwd online leerbedrijf met een netwerk van meer dan 250.000 tevreden leerlingen verspreid over de hele wereld. Edureka's Data Analytics met R-training helpt u expertise op te doen in R-programmering, datamanipulatie, verkennende data-analyse, datavisualisatie, datamining, regressie, sentimentanalyse en het gebruik van R Studio voor praktijkvoorbeelden over detailhandel, sociale media.

Heeft u een vraag voor ons? Vermeld het in het commentaargedeelte van deze 'R Tutorial' -blog en we nemen zo snel mogelijk contact met u op.