R Tutorial - Ghid pentru începători pentru învățarea programării R



Acest blog pe R Tutorial vă prezintă instrumentul R și vă ajută să înțelegeți în detaliu diferitele elemente fundamentale ale programării R, cu exemple.

R este cel mai popular instrument de analiză a datelor, deoarece este open source, flexibil, oferă pachete multiple și are o comunitate imensă. Este conceput atât pentru programatori de software, statistici și mineri de date, cât și, prin urmare, a dat naștere popularității .În acest blog R Tutorial, vă voi oferi o perspectivă completă despre R cu exemple.

Mai jos sunt subiectele din acest blog R Tutorial despre care voi discuta în următoarea secvență:





  1. De ce avem nevoie de Analytics ?
  2. Ce este Business Analytics ?
  3. De ce R și cine folosește R ?
  4. Instalarea R
  5. Operatori de date
  6. Tipuri de date
  7. Controlul debitului

java converti de la dublu la int

R Tutorial: De ce avem nevoie de analize?

Înainte de a răspunde la întrebare, permiteți-mi să vă informez cu câteva dintre problemele și soluțiile lor în R în mai multe domenii.



banking - R Tutorial - Edureka

Bancar :

O cantitate mare de date despre clienți este generată zilnic în bănci. WÎn timp ce se ocupă în mod regulat cu milioane de clienți, devine dificil să le urmărim ipotecile.



Soluţie :

R construiește un model personalizat care menține împrumuturile acordate fiecărui client individual, care ne ajută să decidem suma care trebuie plătită de client în timp.

Asigurare :

Asigurările depind în mare măsură de previziuni. Este greu sadecide ce politică să accepți sau să respingi.

Soluţie:

Folosind raportul de credit continuu ca input, putem crea un model în R care nu numai că va evalua apetitul la risc, ci va face și o previziune predictivă.

Sănătate:

În fiecare an, milioane de oameni sunt internați în spital și miliarde sunt cheltuite anual doar în procesul de admitere.

Soluţie :

Având în vedere istoricul și istoricul medical al pacientului, se poate construi un model predictiv pentru a identifica cine este expus riscului de spitalizare și în ce măsură ar trebui să fie scalate echipamentele medicale.

Acum știm cum analiza datelor ajută organizațiile să își valorifice datele și să le folosească pentru a identifica noi oportunități. Dacă vorbim despre necesitatea analizei într-o organizație, trebuie să întâlniți aceste 4 aspecte:

Apoi, să mergem mai departe în blogul tutorial R, unde vom înțelege mai întâi ce este exact analiza de afaceri.

R Tutorial: Ce este Business Analytics?

Analiza de afaceri este un proces de examinare a unor seturi mari de date și de realizare a unor modele ascunse, corelații și alte informații. Practic vă ajută să înțelegeți toate datele pe care le-ați adunat, fie că sunt date organizaționale, date de cercetare de piață sau de produse sau orice alt tip de date. Devine ușor pentru dvs. să luați decizii mai bune, produse mai bune, strategii de marketing mai bune etc. Consultați imaginea de mai jos pentru o mai bună înțelegere:

Dacă te uiți la figura de mai sus, datele tale din prima imagine sunt împrăștiate. Acum, dacă doriți ceva specific, cum ar fi o anumită înregistrare într-o bază de date, devine greoaie. Pentru a simplifica acest lucru, aveți nevoie de analize. Odată cu analiza, devine ușor să se obțină o corelație între date. Odată ce ați stabilit ce să faceți, devine destul de ușor pentru dvs. să luați decizii, cum ar fi, ce cale doriți să urmați sau în ceea ce privește analiza afacerii, ce cale va duce la îmbunătățirea organizației dvs.

Dar nu vă puteți aștepta ca oamenii din lanțul de mai sus să înțeleagă întotdeauna datele brute pe care le furnizați după analize. Deci, pentru a depăși acest decalaj, avem un concept de vizualizarea datelor .

Vizualizarea datelor : Vizualizarea datelor este un acces vizual la cantități uriașe de date pe care le-ați generat după analize. Mintea umană procesează imagini vizuale, iar grafica vizuală este mai bună decât compararea cu datele brute. Este întotdeauna ușor pentru noi să înțelegem o diagramă circulară sau un grafic cu bare comparativ cu numerele brute. Acum vă puteți întreba cum puteți realiza această vizualizare a datelor din datele pe care le-ați analizat deja?
Există diverse instrumente disponibile pe piață pentru vizualizarea datelor:

Cu toții trebuie să vă întrebați că există deja atât de multe instrumente care vă ajută să realizați vizualizarea datelor și o anumită cantitate de analize, de ce să mergeți cu R?

Deci următorul meu subiect din blogul tutorial R se referă la „de ce R” și „cine folosește R”.

R Tutorial: De ce R și cine folosește R?

De ce R?

R este un limbaj de programare și statistic.

R este utilizat pentru analiza și vizualizarea datelor.

R este simplu și ușor de învățat, citit și scris.

R este un exemplu de FLOSS (Free Libre și Open Source Software) în care se poate distribui în mod liber copii ale acestui software, poate citi codul sursă, îl poate modifica etc.

Cine folosește R?

  • Biroul pentru protecția financiară a consumatorilor folosește R pentru analiza datelor
  • Statisticienii de la John Deere folosesc R pentru modelarea seriilor temporale și analiza geospațială într-un mod fiabil și reproductibil.
  • Bank of America folosește R pentru raportare.
  • R face parte din stiva tehnologică din spatele faimosului motor de recomandări Foursquare.
  • ANZ, a patra cea mai mare bancă din Australia, utilizează R pentru analiza riscului de credit.
  • Google folosește R pentru a prezice activitatea economică.
  • Mozilla, fundația responsabilă pentru browserul web Firefox, folosește R pentru a vizualiza activitatea web.

Mai jos sunt câteva dintre domeniile în care este utilizat R:

Acum, să mergem mai departe în blogul tutorial R și să instalăm R.

R Tutorial: Instalarea R

Permiteți-mi să vă ghidez prin procesul de instalare R pe sistemul dvs. Urmați pașii de mai jos:

Pasul 1 : Accesați linkul- https://cran.r-project.org/

Pasul 2 : Descărcați și instalați R 3.3.3 pe sistemul dvs.

Consultați captura de ecran de mai jos pentru a înțelege mai bine.

Urmând pașii de mai sus, ați terminat cu partea de instalare R. Acum, puteți începe direct codarea în R descărcând RStudio IDE. Pentru a descărca acest lucru, urmați pașii de mai jos:

Pasul 1 : Accesați linkul- https://www.rstudio.com/

Pasul 2 : Descărcați și instalați Rstudio pe sistemul dvs.

După ce ați instalat totul, sunteți pregătiți să codați!

R Tutorial pentru începători | R Tutorial de programare | Edureka

În continuare, să mergem mai departe în blogul R Tutorial și să înțelegem ce sunt operatorii de date în R.

R Tutorial: Operatori de date în R

Există în principal 5 tipuri diferite de operatori, care sunt enumerați mai jos:

  1. Operatori aritmetici : Efectuați operații aritmetice, cum ar fi adunarea, scăderea, multiplicarea, divizarea etc.
  2. Operatori de misiune :Operatorii de atribuire sunt folosiți pentru a atribui valori. De exemplu:
  • Operator de atribuire =
    Sintaxă:
    nume variabil = valoare
> x = 5 >X 
Ieșire: [1] 5
  • Operator de misiune<-
    Sintaxă:
    nume variabil<- value

    > x<- 15 > x
    Ieșire: [1] 15
  • Operator de misiune<<-
    Sintaxă:
    nume variabil<<- value
> x<<- 2 > x
Ieșire: [1] 2
  • Operator de atribuire ->
    Sintaxă:
    valoare -> numele variabilei

    > 25 -> x > x 
    Ieșire: [1] 25

3. Operator relațional : Definește o relație între două entități. De exemplu: ,<=,!= etc.

> xx! = 2
Ieșire:[1] ADEVĂRAT

4. Operatori logici : Acești operatori compară cele două entități și sunt de obicei utilizate cu valori booleene (logice) precum &, | și !.

> x2 și 3
Ieșire:[1] ADEVĂRAT

5. Operatori speciali : Acești operatori sunt utilizați pentru scopuri specifice, nu pentru calculul logic. De exemplu:

  • Creează seria de numere în ordine pentru un vector.

    > xx
    Ieșire: [1] 2 3 4 5 6 7 8
  • % în% Acest operator este utilizat pentru a identifica dacă un element aparține unui vector.
    Exemplu

    > xyy% în% x
    Ieșire: [1] ADEVĂRAT

R Tutorial: tipuri de date

Tipurile de date sunt utilizate pentru a stoca informații. În R, nu este necesar să declarăm o variabilă ca un anumit tip de date. Variabilele sunt atribuite cu obiecte R și tipul de date al obiectului R devine tipul de date al variabilei.Există în principal șase tipuri de date prezente în R:

tutorial informatica pentru incepatori pdf download gratuit

Să intrăm mai în detaliu pe fiecare dintre ele:

Vector : Un vector este o secvență de elemente de date de același tip de bază. Exemplu:

vtr = (1, 3, 5, 7 9)

sau

vtr<- (1, 3, 5 ,7 9)

Există 5 vectori atomici, denumiți și cinci clase de vectori.

Listă : Listele sunt obiectele R care conțin elemente de diferite tipuri, cum ar fi numerele & minus, șiruri, vectori și o altă listă în interiorul său.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = listă (n, s, ADEVĂRAT) > x

Ieșire -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] ADEVĂRAT

Matrice : Tablourile sunt obiectele de date R care pot stoca date în mai mult de două dimensiuni. Ia vectori ca intrare și folosește valorile din parametrul dim pentru a crea o matrice.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) rezultat<- array(c(vector1,vector2),dim = c(3,3,2))

Ieșire -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Matrice : Matricile sunt obiectele R în care elementele sunt dispuse într-un aspect dreptunghiular bidimensional. O matrice este creată folosind funcția matrix (). Exemplu: matrice (date, nrow, ncol, byrow, dimnames) Unde,

date este vectorul de intrare care devine elementele de date ale matricei.

nrow este numărul de rânduri care trebuie create.

ncol este numărul de coloane care trebuie create.

byrow este un indiciu logic. Dacă este TRUE, atunci elementele vectoriale de intrare sunt aranjate după rând.

dimname este numele atribuit rândurilor și coloanelor.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Ieșire :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Factori : Factorii sunt obiectele de date care sunt utilizate pentru a clasifica datele și a le stoca ca niveluri. Pot stoca atât șiruri, cât și numere întregi. Sunt utile în analiza datelor pentru modelarea statistică.

> date<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Ieșire :

[1] Est Vest Vest Nord Nord Est Vest Vest Vest Nivele: Est Nord-Vest

Cadre de date : Un cadru de date este un tabel sau o structură bidimensională în formă de matrice în care fiecare coloană conține valori ale unei variabile și fiecare rând conține un set de valori din fiecare coloană.

> std_id = c (1: 5) > std_name = c („Rick”, „Dan”, „Michelle”, „Ryan”, „Gary”) > mărci = c (623,3,515,2,611,0,729,0,843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Ieșire :

std_id marcaje std_name 1 1 Rick 623,30 2 2 Și 515.20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843,25

Prin aceasta, ajungem la sfârșitul diferitelor tipuri de date în R. În continuare, să mergem mai departe în blogul R Tutorial și să înțelegem un alt concept cheie - instrucțiunile de control al fluxului.

R Tutorial: Instrucțiuni de control al fluxului

Instrucțiunile de control al fluxului joacă un rol foarte important, deoarece vă permit să controlați fluxul de execuție a unui script în interiorul unei funcții. Declarațiile de control al fluxului cele mai utilizate sunt reprezentate în imaginea de mai jos:

Acum, să discutăm fiecare dintre ele cu exemple.

R Tutorial: Instrucțiuni de selecție

  • Dacă declarația de control : Această declarație de control evaluează o singură condiție. Este destul de ușor, deoarece are doar un singur cuvânt cheie „dacă” urmat de condiție și apoi anumite seturi de instrucțiuni care trebuie executate în cazul în care este adevărat. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În această diagramă, codul va răspunde în felul următor:

  1. În primul rând, va intra în bucla unde verifică starea.
  2. Dacă condiția este adevărată, codul condițional sau declarațiile scrise vor fi executate.
  3. Dacă condiția este falsă, declarațiile sunt ignorate.

Mai jos este un exemplu de dacă declarație de control în R. Încercați să rulați acest exemplu în R Studio.

x = 2 repetați {x = x ^ 2 print (x) dacă (x> 100) {pauză}

Ieșire:

[1] 4 [1] 16 [1] 256
  • Dacă Declarație de control altfel :Examentipul declarației de controlevaluează un grup de condiții și selectează afirmațiile. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În această diagramă, codul va răspunde în felul următor:

  1. În primul rând, va intra în bucla unde verifică starea.
  2. Dacă condiția este adevărată, primele instrucțiuni „if” vor fi executate.
  3. Dacă condiția este falsă, atunci merge la condiția „else if” și dacă este adevărată, codul „else if” va fi executat.
  4. În cele din urmă, dacă codul „else if” este, de asemenea, fals, atunci va merge la codul „else” și va fi executat. Aceasta înseamnă că dacă niciuna dintre aceste condiții nu este adevărată, atunci instrucțiunea „else” este executată.

Mai jos este un exemplu de dacă altceva declarație de control în R. Încercați să rulați acest exemplu în R Studio.

x5) {print ('x este mai mare de 5')} elseif (x == 5) {print ('x este egal cu 5')} else {print ('x nu este mai mare de 5')}

Ieșire:

[1] „x este egal cu 5”
  • Declarații de comutare : Aceste instrucțiuni de control sunt utilizate în principiu pentru a compara o anumită expresie cu o valoare cunoscută. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În această diagramă de flux de comutare, codul va răspunde în pașii următori:

  1. În primul rând, va intra în comutatorul care are o expresie.
  2. Apoi va trece la condiția de caz 1, verifică valoarea transmisă condiției. Dacă este adevărat, se va executa blocul Declarație. După aceea, se va rupe de carcasa respectivă.
  3. În cazul în care este fals, atunci va trece la următorul caz. Dacă condiția Cazului 2 este adevărată, va executa instrucțiunea și se va rupe de acel caz, altfel va trece din nou la următorul caz.
  4. Acum, să presupunem că nu ați specificat niciun caz sau că există o intrare greșită din partea utilizatorului, apoi va merge la cazul implicit în care va imprima declarația dvs. implicită.

Mai jos este un exemplu de instrucțiune switch în R. Încercați să rulați acest exemplu în R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Ieșire:

[1] 275

R Tutorial: Declarații de buclă

Buclele vă ajută să repetați anumite seturi de acțiuni, astfel încât să nu trebuie să le efectuați în mod repetat. Imaginați-vă că trebuie să efectuați o operație de 10 ori, dacă începeți să scrieți codul de fiecare dată, lungimea programului crește și vă va fi dificil să o înțelegeți mai târziu. Dar, în același timp, folosind o buclă, dacă scriu aceeași declarație într-o buclă, economisește timp și facilitează lizibilitatea codului. De asemenea, devine mai optimizat în ceea ce privește eficiența codului.

În imaginea de mai sus, „ repeta' și ' in timp ce „Declarațiile vă ajută să executați un anumit set de reguli până când condiția este adevărată, dar” pentru' este o instrucțiune de buclă care este utilizată atunci când știți de câte ori doriți să repetați un bloc de instrucțiuni. Acum, dacă știți că doriți să o repetați de 10 ori, atunci veți merge cu declarația „pentru”, dar dacă nu sunteți sigur de câte ori doriți să se repete codul, veți merge cu „repeta” sau bucla 'while'.

Să discutăm fiecare dintre ele cu exemple.

  • Repeta : Bucla de repetare ajută la executarea aceluiași set de coduri din nou și din nou până când se îndeplinește o condiție de oprire. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În diagrama de mai sus, codul va răspunde în următorii pași:

  1. În primul rând va introduce și va executa un set de cod.
  2. Apoi va verifica starea, dacă este adevărată, va reveni și va executa din nou același set de cod până când va fi fals.
  3. Dacă se constată că este fals, va ieși direct din buclă.
  • In timp ce : Instrucțiunea while ajută și la executarea aceluiași set de coduri din nou și din nou până când se îndeplinește o condiție de oprire. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În diagrama de mai sus, codul va răspunde în următorii pași:

  1. În primul rând, va verifica starea.
  2. Dacă se constată că este adevărat, va executa setul de cod.
  3. Apoi, verifică din nou starea, dacă este adevărată, va executa din nou același cod. De îndată ce se constată că starea este falsă, ea iese imediat din buclă.

Mai jos este un exemplu de declarație while din R. Încercați să rulați acest exemplu în R Studio.

x = 2 în timp ce (x<1000) { x=x^2 print(x) } 

Ieșire:

4 16 256 65 536

Deci, trebuie să vă întrebați cum diferă aceste două afirmații? Lasă-mă să îți curăț îndoielile!
Aici diferența majoră între declarația repetată și cea a timpului este că se schimbă în funcție de starea dumneavoastră. In timp ce bucla defineste practic cand veti intra in bucla pentru a executa instructiunile si repeta bucla se definește când plecați din buclă după executarea instrucțiunilor. Deci, aceste două instrucțiuni sunt cunoscute sub numele de buclă de control de intrare și buclă de control de ieșire. Așa se fac diferențele dintre declarațiile în timp și repetate

  • Pentru buclă: Pentru bucle sunt utilizate atunci când trebuie să executați un bloc de cod de mai multe ori. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În diagrama de mai sus, codul va răspunde în următorii pași:

  1. În primul rând, există inițializarea în care specificați de câte ori doriți să se repete bucla.
  2. Apoi, verifică starea. Dacă condiția este adevărată, va executa setul de cod pentru numărul specificat de ori.
  3. De îndată ce se constată că starea este falsă, ea iese imediat din buclă.

Mai jos este un exemplu de declarație for în R. Încercați să rulați acest exemplu în R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Ieșire:

7 19 25 65 45

În continuare, să trecem la ultimul set de afirmații din blogul R Tutorial, adică declarații jump.

R Tutorial: Salt Declarații

Declarație de pauză : Instrucțiunile Break ajută la terminarea programului și reia controlul la următoarea instrucțiune după buclă. Aceste declarații sunt utilizate și în cazul comutatorului. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În diagrama de mai sus, codul va răspunde în următorii pași:

  1. În primul rând, va intra în bucla unde verifică starea.
  2. Dacă condiția buclei este falsă, ea iese direct din buclă.
  3. Dacă starea este adevărată, atunci va verifica starea de pauză.
  4. Dacă starea de pauză este adevărată, ea există din buclă.
  5. Dacă condiția de pauză este falsă, atunci va executa instrucțiunile care rămân în buclă și apoi va repeta aceiași pași.

Mai jos este un exemplu de instrucțiune jump în R. Încercați să rulați acest exemplu în R Studio.

X<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Ieșire:

[1] 1 [1] 2

Declarația următoare : O următoare instrucțiune este utilizată atunci când doriți să săriți iterația curentă a buclei fără a o termina. Următoarea afirmație este destul de asemănătoare cu „continue” în alte limbaje de programare. Consultați diagrama de flux de mai jos pentru a înțelege mai bine:

În diagrama de mai sus, codul va răspunde în următorii pași:

  1. În primul rând, va intra în bucla unde verifică starea.

  2. Dacă condiția buclei este falsă, ea iese direct din buclă.

  3. Dacă condiția buclei este adevărată, va executa instrucțiunile blocului 1.

  4. După aceea, va verifica declarația „următoare”. Dacă este prezent, atunci instrucțiunile de după aceea nu vor fi executate în aceeași iterație a buclei.

  5. Dacă declarația „următoare” nu este prezentă, atunci toate declarațiile ulterioare vor fi executate.

Mai jos este un exemplu de următoarea declarație din R. Încercați să rulați acest exemplu în R Studio.

arhitectura mvc în java cu exemplu
for (i in 1:15) {if ((i %% 2) == 0) {next} print (i)}

Ieșire:

1 3 5 7 9 11 13 15

Acesta este sfârșitul blogului tutorial R. Sper că voi sunteti clari cu privire la fiecare concept despre care am discutat mai sus. Rămâneți la curent, următorul meu blog va fi despre formarea R, unde voi explica mai multe concepte despre R în detaliu cu examplu.

Acum că ați înțeles elementele de bază ale R, verificați de Edureka, o companie de învățare online de încredere, cu o rețea de peste 250.000 de elevi mulțumiți răspândiți pe tot globul. Analiza datelor Edureka cu instruire R vă va ajuta să câștigați expertiză în programarea R, manipularea datelor, analiza datelor exploratorii, vizualizarea datelor, extragerea datelor, regresia, analiza sentimentelor și utilizarea R Studio pentru studii de caz din viața reală cu amănuntul, social media.

Ai o întrebare pentru noi? Vă rugăm să o menționați în secțiunea de comentarii a acestui blog „R Tutorial” și vă vom contacta cât mai curând posibil.