Programare R - Ghid pentru începători la limbajul de programare R



Acest blog despre programarea R vă introduce în R și vă ajută să înțelegeți în detaliu diferitele concepte fundamentale ale programării R, cu exemple.

R este unul dintre cele mai populare instrumente de analiză. Dar, în afară de a fi folosit pentru analize, R este și un limbaj de programare.Odată cu creșterea sa în industria IT, există o cerere în plină expansiune pentru personal calificat sau cu o înțelegere a R ca ambele, un instrument de analiză a datelor și un limbaj de programare.În acest blog, vă voi ajuta să înțelegeți diferitele elemente fundamentale ale programării R. În a noastră p ciudat Blog ,am discutat De ce avem nevoie de Analytics, Ce este Business Analytics, De ce și cine folosește R.

În acest blog, vom înțelege conceptele de bază de mai jos despre programarea R în următoarea succesiune:





  1. Variabile
  2. Tipuri de date
  3. Operatori de date
  4. Declarație condiționată
  5. Bucle
  6. Funcții

Puteți trece prin înregistrarea pe webinar a limbajului de programare R, unde instructorul nostru a explicat subiectele într-o manieră detaliată cu exemple care vă vor ajuta să înțelegeți mai bine programarea R.

Programare R pentru începători | R Tutorial de limbaj de programare | Edureka



Deci, să mergem mai departe și să vedem primul concept de programare R - Variabile.

Programare R: Variabile

Variabilele nu sunt altceva decât un nume către o locație de memorie care conține o valoare. O variabilă în R poate stoca valori numerice, valori complexe, cuvinte, matrice și chiar un tabel. Surprinzător, nu?

Variabilă - Programare R - Edureka

Smochin: Crearede variabile



Imaginea de mai sus ne arată cum sunt create variabilele și cum sunt stocate în diferite blocuri de memorie. În R, nu trebuie să declarăm o variabilă înainte să o folosim, spre deosebire de alte limbaje de programare precum Java, C, C ++ etc.

Să mergem mai departe și să încercăm să înțelegem ce este un tip de date și diferitele tipuri de date acceptate în R.

Programare R: tipuri de date

În R, o variabilă în sine nu este declarată de niciun tip de date, ci obține tipul de date al obiectului R atribuit acesteia. Deci, R se numește un limbaj tastat dinamic, ceea ce înseamnă că putem schimba din nou și din nou un tip de date cu aceeași variabilă atunci când îl folosim într-un program.

Tipuri de date specifică ce tip de valoare are o variabilă și ce tip de operații matematice, relaționale sau logice i se pot aplica fără a provoca o eroare. Există multe tipuri de date în R, cu toate acestea mai jos sunt cele mai frecvent utilizate:

Să discutăm acum fiecare dintre aceste tipuri de date în mod individual, începând de la Vectori.

Vectori

Vectorii sunt cele mai elementare obiecte de date R și există șase tipuri de vectori atomici. Mai jos sunt cei șase vectori atomici:

Logic : Este folosit pentru a stoca valoare logică, cum ar fi ADEVĂRAT sau FALS .

Numeric : Este folosit pentru a stoca atât numerele pozitive cât și negative, inclusiv numărul real.

De exemplu: 25, 7.1145, 96547

Întreg : Deține toate valorile întregi, adică toate numerele întregi pozitive și negative.

De exemplu: 45,479, -856,479, 0

Complex : Acestea sunt de forma x + yi, unde x și y sunt numerice și i reprezintă rădăcina pătrată a -1.

transformă dublu în int java
De exemplu: 4 + 3i

Caracter : Este folosit pentru a stoca fie un singur caracter, un grup de caractere (cuvinte), fie un grup de cuvinte împreună. Caracterele pot fi definite fie între ghilimele simple sau ghilimele duble.

De exemplu: „Edureka”, „R este distractiv de învățat”.

În general, un vector este definit și inițializat în modul următor:

Vtr = c (2, 5, 11, 24) Sau Vtr<- c(2, 5, 11 , 24)

Să mergem mai departe și să înțelegem alte tipuri de date în R.

Listă

Listele sunt destul de asemănătoare cu vectorii, dar listele sunt obiectele R care pot conține elemente de diferite tipuri, cum ar fi numerele & minus, șiruri, vectori și o altă listă din interior.

De exemplu:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Ieșire:

[[1]] [1] „Bună ziua” „Bună” „Cum faci '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] ADEVĂRAT

Matrice

Matricea este obiectul R în care elementele sunt aranjate într-un aspect dreptunghiular bidimensional.

Sintaxa de bază pentru crearea unei matrice în R este & minus

 matrice (date, nrow, ncol, byrow, dimnames) 

Unde:

ce este un spațiu de nume în c ++
  • date este vectorul de intrare care devine elementele de date ale matricei.
  • nrow este numărul de rânduri care trebuie create.
  • ncol este numărul de coloane care trebuie create.
  • byrow este un indiciu logic. Dacă este TRUE, atunci elementele vectoriale de intrare sunt aranjate după rând.
  • dimname este numele atribuit rândurilor și coloanelor.

Exemplu:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Ieșire:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

TABEL

Tablourile din R sunt obiecte de date care pot fi utilizate pentru a stoca date în mai mult de două dimensiuni. Ia vectori ca intrare și folosește valorile din Nu parametru pentru a crea o matrice.

Sintaxa de bază pentru crearea unui tablou în R este & minus

 matrice (date, dim, dimnames) 

Unde:

  • date este vectorul de intrare care devine elementele de date ale tabloului.
  • Nu este dimensiunea matricei, unde treceți numărul de rânduri, coloană și numărul de matrici care trebuie create de dimensiunile menționate.
  • dimname este numele atribuit rândurilor și coloanelor.

Exemplu:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Ieșire:

, , unu [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Cadru de date

Un cadru de date este un tabel sau o structură bidimensională asemănătoare matricei în care fiecare coloană conține valori ale unei variabile și fiecare rând conține un set de valoripentrufiecare coloană. Mai jos sunt câteva dintre caracteristicile unui cadru de date care trebuie luat în considerare de fiecare dată când lucrăm cu ele:

  • Numele coloanelor nu trebuie să fie goale.
  • Fiecare coloană trebuie să conțină aceeași cantitate de articole de date.
  • Datele stocate într-un cadru de date pot fi de tip numeric, factor sau caracter.
  • Numele rândurilor trebuie să fie unice.

Exemplu:

emp_id = c (100: 104) emp_name = c („John”, „Henry”, „Adam”, „Ron”, „Gary”) dept = c („Vânzări”, „Finanțe”, „Marketing”, „HR ',' R & D ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Ieșire:

emp_id emp_name dept 1 100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary C & D

Deci, acum, după ce am înțeles tipurile de date de bază ale R, este timpul să ne scufundăm profund în R înțelegând conceptele de operatori de date.

Programare R: Operatori de date

Există în principal 4 operatori de date în R, aceștia sunt așa cum se vede mai jos:

Operatori aritmetici : Acești operatori ne ajută să efectuăm operațiile aritmetice de bază cum ar fi adunarea, scăderea, multiplicarea etc.

Luați în considerare următorul exemplu:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #floor division num3 = num1% /% num2 num3

Ieșire:

[1] 35 [cincisprezece [1] 300 [1] 0,75 [1] 15 [1] 125 [unsprezece

Operatori relaționali : Acești operatori ne ajută să efectuăm operațiuni relaționale precum verificarea dacă o variabilă este mai mare decât, mai mică sau egală cu o altă variabilă. Ieșirea unei operații relaționale este întotdeauna o valoare logică.

Luați în considerare următoarele exemple:

num1 = 15 num2 = 20 #equals to num3 = (num1 == num2) num3 #not equal to num3 = (num1! = num2) num3 #lesser than num3 = (num1 num2) num3 #less than equal to num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Ieșire:

[1] FALS [1] ADEVĂRAT [1] ADEVĂRAT [1] FALS [1] ADEVĂRAT [1] FALS

Operatori de misiune: Acești operatori sunt utilizați pentru a atribui valori variabilelor din R. Alocarea poate fi efectuată utilizând fie operatorul de atribuire(<-) sau operator egal (=). Valoarea variabilei poate fi atribuită în două moduri, atribuirea la stânga și atribuirea la dreapta.

LogicOperatori: Acești operatori compară cele două entități și sunt de obicei utilizate cu valori booleene (logice), cum ar fi „și”, „sau”și'nu'.


Programare R: enunțuri condiționate

  1. Declarație If: Instrucțiunea If vă ajută să evaluați o singură expresie ca parte a fluxului. Pentru a efectua această evaluare, trebuie doar să scrieți cuvântul cheie If urmat de expresia de evaluat. Diagrama de flux de mai jos va da o idee despre modul în care instrucțiunea If controlează fluxul unui cod: Luați în considerare următorul exemplu:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Ieșire:

[1] „Num1 este mai mic sau egal cu Num2”
  • Declarație în caz contrar: Instrucțiunea Else if vă ajută să extindeți ramurile la fluxul creat de instrucțiunea If și vă oferă posibilitatea de a evalua condiții multiple prin crearea de noi ramuri ale fluxului. Fluxul de mai jos vă va oferi o idee despre cum instrucțiunea else if ramifică fluxul codului:

    Luați în considerare următorul exemplu:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 este mai mic decât Num1')} else if ('Num1 == Num2) {print (' Num1 și Num2 sunt egale ')}

    Ieșire:

    [1] „Num1 este mai mic decât Num2”

  • Declarație altfel: Instrucțiunea else este utilizată atunci când toate celelalte expresii sunt verificate și găsite nevalide. Aceasta va fi ultima declarație care va fi executată ca parte a ramurii If - Else if. Fluxul de mai jos vă va oferi o idee mai bună despre modul în care Else modifică fluxul codului:

Luați în considerare următorul exemplu:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 este mai mic decât Num1')} else print ('Num1 și Num2 sunt egali')}

Ieșire:

[1] „Num1 și Num2 sunt egali”

Programare R: Bucle

O instrucțiune buclă ne permite să executăm o instrucțiune sau un grup de instrucțiuni de mai multe ori. Există în principal 3 tipuri de bucle în R:

ce este un scaner în java

  1. repetă Bucla : Repetă o afirmație sau un grup de afirmații în timp ce o condiție dată este ADEVĂRATĂ. Repetarea buclei este cel mai bun exemplu de buclă controlată la ieșire în care codul este executat mai întâi și apoi se verifică condiția pentru a determina dacă controlul ar trebui să se afle în buclă sau să iasă din ea. Mai jos este fluxul de control într-o buclă repetată:
    Să ne uităm la exemplul de mai jos pentru a înțelege cum putem folosi repetarea buclei pentru a adăuga n numere până când suma depășește 100:

    x = 2 repetați {x = x ^ 2 print (x) dacă (x> 100) {pauză}

    Ieșire:

    [1] 4 [1] 16 [1] 256
  2. în timp ce Loop : Eut ajută la repetarea unei afirmații sau a unui grup de afirmații în timp ce o condiție dată este ADEVĂRATĂ. În timp ce bucla, în comparație cu bucla de repetare este ușor diferită, este un exemplu de buclă controlată de intrare în care condiția este verificată mai întâi și numai dacă se constată că starea este adevărată, controlul este livrat în buclă pentru a executa codul . Mai jos este fluxul de control într-o buclă while:
    Să ne uităm la exemplul de mai jos pentru a adăuga suma pătratelor pentru primele 10 numere și să înțelegem cum funcționează mai bine bucla while:

    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Ieșire:

    [unsprezece [cincisprezece [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. pentru Loop : Se utilizează pentru a repeta o declarație sau un grup de un număr fix de ori. Spre deosebire de repetare și bucla while, bucla for este utilizată în situații în care suntem conștienți de numărul de ori când codul trebuie executat în prealabil. Este similar cu bucla while în care condiția este verificată mai întâi și apoi se execută doar codul scris în interior. Să vedem acum fluxul de control al buclei for:

Să vedem acum un exemplu în care vom folosi bucla for pentru a imprima primele 10 numere:

pentru (x în 1:10) {print (x)}

Ieșire:

[unsprezece [1] 2 [1] 3 [1] 4 [cincisprezece [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Programare R: Funcții

O funcție este un bloc de cod organizat, reutilizabil, care este utilizat pentru a efectua o singură acțiune asociată. Există în principal două tipuri de funcții în R:

Funcții predefinite : Acestea sunt construite în funcții care pot fi utilizate de utilizator pentru a-și face treaba easier. Ex: mean( X) , stum( X) , sqrt ( X ), toupper( X ), etc.

Definit de utilizator Funcții: Aceste funcții sunt create de utilizator pentru a îndeplini o cerință specifică a utilizatorului. Mai jos este sintaxa pentru crearea unei funcții înR:

 func  nume_tarea  <– funcţie (arg_1, arg_2 și hellip){ // Corpul funcției }

Luați în considerare următorul exemplu de funcție simplă pentru generarea sumei pătratelorde2 numere:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Ieșire: [1] 25

Sper că v-a plăcut să citiți acest blog de programare R. Am acoperit toate elementele de bază ale R în acest tutorial, astfel încât să puteți începe să practicați acum. După acest blog de programare R, voi veni cu mai multe bloguri pe R pentru Analytics, așa că rămâneți la curent.

Acum că ați înțeles elementele de bază ale R, verificați de Edureka, o companie de învățare online de încredere, cu o rețea de peste 250.000 de elevi mulțumiți răspândiți pe tot globul. Analiza datelor Edureka cu instruire R vă va ajuta să câștigați expertiză în programarea R, manipularea datelor, analiza datelor exploratorii, vizualizarea datelor, extragerea datelor, regresia, analiza sentimentelor și utilizarea RStudio pentru studii de caz din viața reală cu amănuntul, social media.

Ai o întrebare pentru noi? Vă rugăm să o menționați în secțiunea de comentarii a acestui blog „Programare R” și vă vom contacta cât mai curând posibil.