Proces analitic predictiv în analiza afacerii cu R



Blogul oferă o scurtă idee despre procesul de analiză predictivă în Business Analytics cu R

Proces tipic de modelare:

Într-un proces tipic de modelare, este important să începeți să trageți o ipoteză. Se primește o cerere de ofertă (cerere de propunere) și apoi se trage o ipoteză.





  1. Determinați sursa de date corectă - Aici, clientul poate oferi sursa de date, dacă nu, trebuie să căutăm o sursă de date. Având în vedere un scenariu, în care încercăm să evaluăm cine ar câștiga alegerile, se face o analiză publică a datelor cu surse care includ social media, canale de știri sau opinie publică. De asemenea, trebuie să înțelegem cantitatea de date necesare pentru a analiza problema. În acest caz, căutăm de obicei eșantioane mari, deoarece este un caz de alegeri. Pe de altă parte, dacă analiza se face pe Healthcare, este dificil să mergi pentru o populație numeroasă, deoarece există posibilitatea de a nu obține suficienți oameni pentru a valida ipoteza. De asemenea, calitatea datelor este foarte importantă.
  2. Extrageți datele - De exemplu, dacă luăm un eșantion de populație, putem analiza atribute, cum ar fi venituri mari, venituri mici, vârstă, populație activă (în afara amplasamentului / la fața locului), rezidenți, INR, acoperirea spitalelor etc., pentru a iniția studiul . Aici, este posibil să nu avem nevoie de atât de multe atribute pentru ipoteză. Înțelegem că atributele, cum ar fi veniturile mari și cele mici, nu pot fi factorii care contribuie la determinarea cine va câștiga alegerile. Însă vârsta poate face diferența, deoarece va da un număr direct de câte persoane vor vota. De multe ori putem exclude atribute mai puțin utilizate sau putem include atribute care sunt utile. S-ar putea merge prost în ambele cazuri. Acesta este motivul pentru care analiza este o provocare.
  3. Masați datele pentru a se potrivi instrumentului - Acest lucru se datorează faptului că nu toate instrumentele pot accepta toate datele. Anumite instrumente acceptă numai date CSV sau date Excel. Lipsa instrumentelor este o provocare.
  4. Rulați analiza - Această operație poate fi efectuată folosind multe tehnici de analiză.
  5. A trage concluzii - Analiza oferă cifre pentru a fi precise. Dar depinde de un utilizator să tragă concluzii din aceste cifre. De exemplu, dacă scrie 10% sau 20%, trebuie să înțelegem ce înseamnă? Deriva o corelație între atributul A și atributul B?
  6. Implementați rezultatele - Este important să implementați concluzii pentru a vedea rezultatele în afaceri. De exemplu, se poate concluziona că „Oamenii cumpără umbrelă în sezonul ploios” ceea ce poate duce la mai multe afaceri. Aici, trebuie să punem în aplicare concluzia în care facem umbrelă, disponibilă în magazine, dar atunci poate avea probleme de gestionare. În momentul în care statisticile dau rezultat, implementarea poate merge prost.
  7. Monitorizați progresul - Ultimul pas aici, monitorizarea joacă un rol important. Monitorizarea poate merge prost, deoarece nu multe organizații doresc să monitorizeze progresul și este considerată un pas neglijabil. Dar monitorizarea este importantă, deoarece putem înțelege dacă cercetările și concluziile noastre se îndreaptă în direcția cea bună.

Consultați și acest articol' Corelația nu înseamnă Cauzare 'ceea ce oferă o perspectivă asupra modului în care analiștii pot merge prost. Un punct important de menționat în acest grafic este că Analiza de funcționare este singurul pas în care mașina este responsabilă și dincolo de aceasta depinde de o ființă umană care va determina în cele din urmă modul în care se efectuează cercetarea.

Ai o întrebare pentru noi? Menționați-le în secțiunea de comentarii și vă vom răspunde.



Postări asemănatoare: