R Programmeren - Beginnersgids voor R Programmeertaal



Deze blog over R-programmering laat je kennismaken met R en helpt je de verschillende fundamentele concepten van R-programmeren in detail te begrijpen met voorbeelden.

R is een van de meest populaire analysetools. Maar behalve dat het wordt gebruikt voor analyses, is R ook een programmeertaal.Met zijn groei in de IT-industrie is er een sterk stijgende vraag naar geschoolde of met begrip van R als beide, een tool voor gegevensanalyse en een programmeertaal.In deze blog zal ik je helpen de verschillende basisprincipes van R-programmeren te begrijpen. In onze p eerbiedig Blog ,we hebben besproken waarom we Analytics nodig hebben, wat is Business Analytics, waarom en wie R.

In deze blog zullen we de onderstaande kernconcepten van R-programmering in de volgende volgorde begrijpen:





  1. Variabelen
  2. Gegevenstypen
  3. Gegevensoperatoren
  4. Voorwaardelijke verklaring
  5. Loops
  6. Functies

U kunt de webinaropname van R Programming Language doorlopen, waar onze instructeur de onderwerpen op een gedetailleerde manier heeft uitgelegd met voorbeelden die u zullen helpen R Programming beter te begrijpen.

R Programmeren voor beginners | R Zelfstudie programmeertaal | Edureka



Laten we dus verder gaan en kijken naar het eerste concept van R-programmering: variabelen.

R Programmering: variabelen

Variabelen zijn niets anders dan een naam voor een geheugenlocatie die een waarde bevat. Een variabele in R kan numerieke waarden, complexe waarden, woorden, matrices en zelfs een tabel opslaan. Verrassend toch?

Variabele - R-programmering - Edureka

Afb: Creatievan variabelen



De bovenstaande afbeelding laat ons zien hoe variabelen worden gemaakt en hoe ze worden opgeslagen in verschillende geheugenblokken. In R hoeven we geen variabele te declareren voordat we deze gebruiken, in tegenstelling tot andere programmeertalen zoals Java, C, C ++, enz.

Laten we verder gaan en proberen te begrijpen wat een gegevenstype is en de verschillende gegevenstypen die worden ondersteund in R.

R Programmering: gegevenstypen

In R wordt een variabele zelf niet van een gegevenstype gedeclareerd, maar krijgt deze het gegevenstype van het R-object dat eraan is toegewezen. Dus R wordt een dynamisch getypeerde taal genoemd, wat betekent dat we een datatype van dezelfde variabele keer op keer kunnen veranderen wanneer we het in een programma gebruiken.

Gegevenstypen specificeren welk type waarde een variabele heeft en welk type wiskundige, relationele of logische bewerkingen erop kunnen worden toegepast zonder een fout te veroorzaken. Er zijn veel gegevenstypen in R, maar hieronder staan ​​de meest gebruikte:

Laten we nu elk van deze gegevenstypen afzonderlijk bespreken, te beginnen bij Vectors.

Vectoren

Vectoren zijn de meest elementaire R-gegevensobjecten en er zijn zes soorten atoomvectoren. Hieronder staan ​​de zes atoomvectoren:

Logisch : Het wordt gebruikt om logische waarden op te slaan, zoals WAAR of ONWAAR .

Numeriek : Het wordt gebruikt om zowel positieve als negatieve getallen op te slaan, inclusief reëel getal.

Bijv .: 25, 7.1145, 96547

Geheel getal : Het bevat alle gehele getallen, d.w.z. alle positieve en negatieve gehele getallen.

Bijv .: 45.479, -856.479, 0

Complex : Deze hebben de vorm x + yi, waarbij x en y numeriek zijn en i de vierkantswortel van -1 vertegenwoordigt.

Bijv: 4 + 3i

Karakter : Het wordt gebruikt om een ​​enkel teken, een groep tekens (woorden) of een groep woorden samen op te slaan. De tekens kunnen worden gedefinieerd in enkele aanhalingstekens of dubbele aanhalingstekens.

Bijv: 'Edureka', 'R is leuk om te leren'.

In het algemeen wordt een vector op de volgende manier gedefinieerd en geïnitialiseerd:

is een postdoctorale masteropleiding
Vtr = c (2, 5, 11, 24) Of Vtr<- c(2, 5, 11 , 24)

Laten we verder gaan en andere gegevenstypen in R.

Lijst

Lijsten lijken veel op vectoren, maar lijsten zijn de R-objecten die elementen van verschillende typen kunnen bevatten, zoals & min-getallen, tekenreeksen, vectoren en een andere lijst erin.

Bijv .:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Uitgang:

[[1]] [1] 'Hallo' 'Hallo' 'Hoe doe je '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] WAAR

Matrix

Matrix is ​​het R-object waarin de elementen zijn gerangschikt in een tweedimensionale rechthoekige lay-out.

De basissyntaxis voor het maken van een matrix in R is & minus

 matrix (data, nrow, ncol, byrow, dimnames) 

Waar:

  • gegevens is de invoervector die de gegevenselementen van de matrix wordt.
  • nrow is het aantal rijen dat moet worden gemaakt.
  • ncol is het aantal kolommen dat moet worden gemaakt.
  • byrow is een logische aanwijzing. Indien WAAR, dan zijn de invoervectorelementen gerangschikt op rij.
  • dimnaam zijn de namen die zijn toegewezen aan de rijen en kolommen.

Voorbeeld:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Uitgang:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Arrays in R zijn data-objecten die kunnen worden gebruikt om data in meer dan twee dimensies op te slaan. Het neemt vectoren als invoer en gebruikt de waarden in de Nee parameter om een ​​array te maken.

De basissyntaxis voor het maken van een array in R is & minus

 array (data, dim, dimnames) 

Waar:

  • gegevens is de invoervector die de gegevenselementen van de array wordt.
  • Nee is de dimensie van de array, waar u het aantal rijen, kolommen en het aantal matrices doorgeeft dat door genoemde dimensies moet worden gemaakt.
  • dimnaam zijn de namen die zijn toegewezen aan de rijen en kolommen.

Voorbeeld:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Uitgang:

, , een [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Dataframe

Een dataframe is een tabel of een tweedimensionale matrixachtige structuur waarin elke kolom waarden van één variabele bevat en elke rij één set waardenvoorelke kolom. Hieronder staan ​​enkele kenmerken van een dataframe waarmee u rekening moet houden elke keer dat we ermee werken:

  • De kolomnamen mogen niet leeg zijn.
  • Elke kolom moet hetzelfde aantal gegevensitems bevatten.
  • De gegevens die in een dataframe zijn opgeslagen, kunnen van het numerieke, factor- of tekentype zijn.
  • De rijnamen moeten uniek zijn.

Voorbeeld:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & D ') emp. Gegevens<- data.frame(emp_id, emp_name, dept) emp.data 

Uitgang:

emp_id emp_name afd 1100 John Sales 2101 Henry Finance 3102 Adam Marketing 4103 Ron HR 5104 Gary R & D

Nu we de basisgegevenstypen van R hebben begrepen, wordt het tijd dat we diep in R duiken door de concepten van gegevensoperatoren te begrijpen.

R Programmering: gegevensoperatoren

Er zijn voornamelijk 4 gegevensoperatoren in R, deze zijn zoals hieronder te zien:

Rekenkundige operatoren : Deze operatoren helpen ons bij het uitvoeren van de elementaire rekenkundige bewerkingen zoals optellen, aftrekken, vermenigvuldigen, enz.

Beschouw het volgende voorbeeld:

num1 = 15 num2 = 20 num3 = 0 #additie num3 = num1 + num2 num3 #substractie num3 = num1 - num2 num3 #vermenigvuldiging num3 = num1 * num2 num3 # divisie num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # verdieping divisie num3 = num1% /% num2 num3

Uitgang:

[1] 35 [vijftien [1] 300 [1] 0,75 [1] 15 [1] 125 [elf

Relationele operators : Deze operators helpen ons de relationele bewerkingen uit te voeren, zoals controleren of een variabele groter is dan, kleiner dan of gelijk is aan een andere variabele. De output van een relationele operatie is altijd een logische waarde.

Beschouw de volgende voorbeelden:

num1 = 15 num2 = 20 # is gelijk aan num3 = (num1 == num2) num3 # niet gelijk aan num3 = (num1! = num2) num3 # minder dan num3 = (num1 num2) num3 # minder dan gelijk aan num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Uitgang:

[1] ONWAAR [1] WAAR [1] WAAR [1] ONWAAR [1] WAAR [1] ONWAAR

Toewijzingsoperatoren: Deze operatoren worden gebruikt om waarden toe te wijzen aan variabelen in R. De toewijzing kan worden uitgevoerd met behulp van de toewijzingsoperator(<-) of is gelijk aan operator (=). De waarde van de variabele kan op twee manieren worden toegewezen: linkertoewijzing en rechtertoewijzing.

LogischOperatoren: Deze operators vergelijken de twee entiteiten en worden doorgaans gebruikt met booleaanse (logische) waarden zoals ‘en’, ‘of’en'niet'.


R Programmering: voorwaardelijke verklaringen

  1. Als verklaring: De If-instructie helpt u bij het evalueren van een enkele uitdrukking als onderdeel van de stroom. Om deze evaluatie uit te voeren, hoeft u alleen het trefwoord If te schrijven, gevolgd door de uitdrukking die moet worden geëvalueerd. Het onderstaande stroomdiagram geeft een idee van hoe de If-instructie de stroom van een code bestuurt: Beschouw het volgende voorbeeld:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Uitgang:

[1] 'Num1 is kleiner of gelijk aan Num2'
  • Else If-verklaring: De Else if-instructie helpt u bij het uitbreiden van vertakkingen naar de stroom die is gemaakt door de If-instructie en geeft u de mogelijkheid om meerdere voorwaarden te evalueren door nieuwe stroomtakken te maken. De onderstaande stroom geeft u een idee van hoe de else if-instructie de stroom van de code vertakt:

    Beschouw het volgende voorbeeld:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is kleiner dan Num1')} else if ('Num1 == Num2) {print (' Num1 en Num2 zijn gelijk ')}

    Uitgang:

    [1] 'Num1 is kleiner dan Num2'

  • Anders verklaring: De else-instructie wordt gebruikt wanneer alle andere expressies zijn gecontroleerd en ongeldig worden bevonden. Dit is de laatste instructie die wordt uitgevoerd als onderdeel van de If - Else if branch. De onderstaande stroom geeft u een beter idee over hoe Else de stroom van de code verandert:

Beschouw het volgende voorbeeld:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is kleiner dan Num1')} else print ('Num1 en Num2 zijn gelijk')}

Uitgang:

[1] 'Num1 en Num2 zijn gelijk'

R Programmering: lussen

Met een lusinstructie kunnen we een instructie of een groep instructies meerdere keren uitvoeren. Er zijn hoofdzakelijk 3 soorten lussen in R:

  1. herhaal Loop : Het herhaalt een instructie of een groep uitspraken terwijl een bepaalde voorwaarde WAAR is. Herhaallus is het beste voorbeeld van een uitgangsgestuurde lus waarbij de code eerst wordt uitgevoerd en vervolgens de conditie wordt gecontroleerd om te bepalen of de besturing zich binnen de lus moet bevinden of moet verlaten. Hieronder ziet u de stroom van controle in een herhaallus:
    Laten we het onderstaande voorbeeld bekijken om te begrijpen hoe we de herhaallus kunnen gebruiken om n getallen toe te voegen totdat de som de 100 overschrijdt:

    x = 2 herhaal {x = x ^ 2 print (x) if (x> 100) {break}

    Uitgang:

    [1] 4 [1] 16 [1] 256
  2. herhalingslus : ikt helpt om een ​​statement of een groep statements te herhalen terwijl een bepaalde voorwaarde WAAR is. Hoewel de lus iets anders is dan de herhalingslus, is het een voorbeeld van een ingangsgestuurde lus waarbij de voorwaarde eerst wordt gecontroleerd en alleen als wordt vastgesteld dat de voorwaarde waar is, wordt de controle binnen de lus geleverd om de code uit te voeren . Hieronder ziet u de stroom van controle in een while-lus:
    Laten we naar het onderstaande voorbeeld kijken om de som van de kwadraten voor de eerste 10 getallen op te tellen en te begrijpen hoe de while-lus beter werkt:

    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Uitgang:

    [elf [vijftien [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. for loop : Het wordt gebruikt om een ​​instructie of groep een vast aantal keren te herhalen. In tegenstelling tot de herhaal- en while-lus, wordt de for-lus gebruikt in situaties waarin we ons bewust zijn van het aantal keren dat de code van tevoren moet worden uitgevoerd. Het is vergelijkbaar met de while-lus waar de voorwaarde eerst wordt gecontroleerd en vervolgens alleen de code die erin is geschreven, wordt uitgevoerd. Laten we nu de controlestroom van for-lus bekijken:

Laten we nu een voorbeeld bekijken waarin we de for-lus zullen gebruiken om de eerste 10 getallen af ​​te drukken:

voor (x in 1:10) {print (x)}

Uitgang:

[elf [1] 2 [1] 3 [1] 4 [vijftien [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programmering: functies

Een functie is een blok georganiseerde, herbruikbare code die wordt gebruikt om een ​​enkele, gerelateerde actie uit te voeren. Er zijn hoofdzakelijk twee soorten functies in R:

Vooraf gedefinieerde functies : Dit zijn ingebouwde functies die door de gebruiker kunnen worden gebruikt om hun werk te maken gemakr. Bijv: mean( X) , sum( X) , sqrt ( X ), tuimelaar( X ), enzovoort.

Gebruiker gedefinieerde Functies: Deze functies worden door de gebruiker gecreëerd om aan een specifieke behoefte van de gebruiker te voldoen. Het onderstaande is de syntaxis voor het maken van een functie inR:

 func  naam_naam  <– functie (arg_1, arg_2 en hellip){ // Functie body }

Beschouw het volgende voorbeeld van een eenvoudige functie voor het genereren van de som van de kwadratenvan2 nummers:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Uitgang: [1] 25

Ik hoop dat je deze R-programmeerblog met plezier hebt gelezen. We hebben alle basisprincipes van R in deze tutorial behandeld, dus je kunt nu beginnen met oefenen. Na deze R-programmeerblog, zal ik meer blogs over R for Analytics bedenken, dus houd het in de gaten.

Nu je de basisprincipes van R hebt begrepen, kun je het door Edureka, een vertrouwd online leerbedrijf met een netwerk van meer dan 250.000 tevreden leerlingen verspreid over de hele wereld. Edureka's Data Analytics met R-training helpt u expertise op te doen in R-programmering, datamanipulatie, verkennende data-analyse, datavisualisatie, datamining, regressie, sentimentanalyse en het gebruik van RStudio voor praktijkvoorbeelden over detailhandel en sociale media.

Heeft u een vraag voor ons? Vermeld het in het commentaargedeelte van deze 'R Programming' -blog en we nemen zo snel mogelijk contact met u op.