Analiza Big Data - Transformarea Statisticilor în acțiune



Acest blog este despre Big Data Analytics, importanța sa, ce înseamnă, diferitele instrumente necesare și, în cele din urmă, diferitele domenii și cazuri de utilizare.

La fel cum se spune că întregul univers și galaxia noastră s-au format datorită exploziei Big Bang, în mod similar, din cauza atâtea progrese tehnologice, datele au crescut exponențial, ducând la explozia Big Data. Aceste date provin din diverse surse, au diferite formate, sunt generate la o rată variabilă și pot conține, de asemenea, inconsecvențe. Astfel, putem numi pur și simplu explozia unor date precum .Voi explica următoarele subiecte în acest blog pentru a vă oferi informații despre Big Data Analytics:

De ce Big Data Analytics?

Înainte să mă duc să vă spun despre ce este Analize, permiteți-mi să vă spun de ce este nevoie. Permiteți-mi să vă dezvăluie, de asemenea, că noi creăm în fiecare zi aproximativ 2,5 miliarde de octeți de date! Deci, acum că am acumulat Big Data, nici nu îl putem ignora, nici nu îl putem lăsa să rămână inactiv și să-l facă să se piardă.





Diferite organizații și sectoare din întreaga lume au început să adopte Big Data Analytics pentru a obține numeroase beneficii. Analiza datelor mari oferă informații pe care multe companii le transformă în acțiuni și obțin profituri uriașe, precum și descoperiri. Voi enumera patru astfel de motive împreună cu exemple interesante.

Primul motiv este,



  1. Organizarea mai inteligentă și mai eficientă
    Permiteți-mi să vă povestesc despre o astfel de organizație, Departamentul de Poliție din New York (NYPD). NYPD folosește în mod strălucit Big Data și analize pentru a detecta și identifica infracțiunile înainte ca acestea să apară. Aceștia analizează tiparele istorice de arestare și apoi le mapează cu evenimente precum sărbătorile federale, zilele de plată, fluxurile de trafic, precipitațiile etc.Acest lucru îi ajută să analizeze informațiile imediat utilizând aceste tipare de date. Strategia Big Data și analiticăajutăaceștia identifică locațiile infracțiunilor, prin care își trimit ofițerii în aceste locații. Astfel, ajungând la aceste locații înainte de comiterea infracțiunilor, acestea previn apariția infracțiunilor.

  2. Optimizați operațiunile comerciale analizând comportamentul clienților Majoritatea organizațiilor utilizează analize comportamentale ale clienților pentru a asigura satisfacția clienților și, prin urmare, pentru a-și spori baza de clienți. Cel mai bun exemplu în acest sens este Amazon. Amazon este unul dintre cele mai bune și mai utilizate site-uri web de comerț electronic, cu o bază de clienți de aproximativ 300 de milioane. Aceștia folosesc datele privind fluxul de clicuri ale clienților și datele istorice ale achizițiilor pentru a le oferi rezultate personalizate pe pagini web personalizate. Analizand clicurile fiecărui vizitator de pe site-ul lor îi ajută să-și înțeleagă comportamentul de navigare pe site, căile pe care le-a luat utilizatorul pentru a cumpăra produsul, căile care i-au determinat să părăsească site-ul și multe altele. Toate aceste informații ajută Amazon să își îmbunătățească experiența de utilizare, îmbunătățind astfel vânzările și marketingul.
  3. Reducerea costurilor Tehnologiile Big Data și progresele tehnologice, cum ar fi cloud computing, aduc avantaje semnificative în ceea ce privește costurile atunci când vine vorba de stocarea și procesarea Big Data. Permiteți-mi să vă spun cum asistența medicală utilizează Big Data Analytics pentru a reduce costurile acestora. În prezent, pacienții utilizează dispozitive noi cu senzori când sunt acasă sau în exterior, care trimit fluxuri constante de date care pot fi monitorizate și analizate în timp real pentru a ajuta pacienții să evite spitalizarea prin auto-gestionarea condițiilor lor.Pentru pacienții spitalizați, medicii pot utiliza analize predictive pentru a optimiza rezultatele și a reduce readmisia.Spitalul Parkland utilizează analize și modele predictive pentru a identifica pacienții cu risc ridicat și pentru a prezice rezultatele probabile odată ce pacienții sunt trimiși acasă. Ca rezultat, Parkland a redus readmiterile de 30 de zile pentru pacienții cu insuficiență cardiacă, cu 31%, economisind 500.000 USD anual.

Produse de generație nouă

Cu capacitatea de a evalua nevoile și satisfacția clienților prin analize, vine puterea de a oferi clienților ceea ce doresc. Am găsit aici trei astfel de produse interesante de menționat. Primul , Googleautoturismceea ce face milioane de calcule la fiecare călătorie care ajută mașina să decidă când și unde să se întoarcă, dacă să încetinească sau să accelereze și când să schimbe banda - aceleași decizii pe care le ia un șofer uman la volan.

al doilea unul esteNetflix care s-a angajat timp de două sezoane în spectacolul său extrem de popular House of Cards, prin încrederea totală în Big Data Analytics! Anul trecut, Netflix și-a crescut baza de abonați din SUA cu 10% și a adăugat aproape 20 de milioane de abonați din întreaga lume.



al treilea exemplu este unul dintre lucrurile noi foarte interesante pe care le-am întâlnit, este un saltea inteligentă de yoga. Prima dată când utilizați Smart Mat, vă va duce printr-o serie de mișcări pentru a vă calibra forma corpului, dimensiunea și limitările personale. Aceste informații de profil personal sunt stocate în aplicația dvs. Smart Mat și vă vor ajuta Smart Mat să detecteze când nu sunteți aliniat sau echilibrat. În timp, va evolua automat cu date actualizate pe măsură ce vă îmbunătățiți practica de yoga.

Ce este Big Data Analytics?

Acum, să definim formal „Ce este analiza Big Data?” Analiza datelor mari examinează tipuri mari și diferite de date pentru a descoperi modele ascunse, corelații și alte informații. Practic, Big Data Analytics este utilizat în mare măsură de companii pentru a le facilita creșterea și dezvoltarea. Acest lucru implică în principal aplicarea diferiților algoritmi de extragere a datelor pe setul dat de date, ceea ce îi va ajuta apoi la luarea mai bună a deciziilor.

Etape în Big Data Analytics

Acestea sunt următoarele etape implicate în procesul de Big Data Analytics:

Tipuri de analize Big Data

Există patru tipuri:

  1. Analize descriptive: Folosește agregarea datelor și extragerea datelor pentru a oferi informații despre trecut și pentru a răspunde: „Ce s-a întâmplat?” Analiza descriptivă face exact ceea ce sugerează numele că „descriu” sau rezumă datele brute și le fac interpretabile de către oameni.
  2. Analize predictive: Folosește modele statistice și tehnici de prognoză pentru a înțelege viitorul și pentru a răspunde: „Ce s-ar putea întâmpla?” Analiza predictivă oferă companiilor informații utile, bazate pe date. Oferă estimări despre probabilitatea unui rezultat viitor.
  3. Analize prescriptive: Folosește algoritmi de optimizare și simulare pentru sfaturi cu privire la posibilele rezultate și răspunsuri: „Ce ar trebui să facem?” Permite utilizatorilor să „prescrie” o serie de acțiuni posibile diferite și să-i îndrume către o soluție. Pe scurt, această analiză se referă la furnizarea de sfaturi.
  4. Analize de diagnostic: Este folosit pentru a determina de ce sa întâmplat ceva în trecut. Se caracterizează prin tehnici precum drill-down, descoperirea datelor, extragerea datelor și corelații. Analiza de diagnostic analizează mai profund datele pentru a înțelege cauzele profunde ale evenimentelor.

Date mare Instrumente

Acestea sunt câteva dintre următoarele instrumente utilizate pentru Big Data Analytics: Hadoop , , Apache HBase , Apache Spark , , , Apache Hive , Kafka .

Domenii Big Data

  • Sănătate: Asistența medicală folosește analize de date mari pentru a reduce costurile, a prezice epidemiile, a evita bolile care pot fi prevenite și a îmbunătăți calitatea vieții în general. Una dintre cele mai răspânditeaplicațiile Big Data în domeniul asistenței medicale este Electronic Health Record (EHRs).
  • Telecom: Aceștia sunt unul dintre cei mai importanți colaboratori la Big Data. Industria telecomunicațiilor îmbunătățește calitatea serviciilor șirutează traficul mai eficient. Analizând înregistrările datelor apelurilor în timp real, aceste companii pot identifica comportamentul fraudulos și pot acționa imediat asupra acestora. Divizia de marketing își poate modifica campaniile pentru a-și viza mai bine clienții și pentru a utiliza informațiile obținute pentru a dezvolta noi produse și servicii.
  • Asigurare: Aceste companii utilizează analize de date mari pentru evaluarea riscurilor, detectarea fraudelor, marketing, informații despre clienți, experiența clienților și multe altele.
  • Guvern: Guvernul indian a folosit analize de date mari pentru a obține o estimare a comerțului în țară. Aceștia au folosit facturile de impozitare centrală pe vânzări pentru a analiza măsura în care statele tranzacționează între ele.
  • Finanţa: Băncile și firmele de servicii financiare utilizează analize pentru a diferenția interacțiunile frauduloase de tranzacțiile comerciale legitime. Sistemele de analiză sugerează acțiuni imediate, cum ar fi blocarea tranzacțiilor neregulate, care oprește frauda înainte de a se produce și îmbunătățește profitabilitatea.
  • Auto: Rolls Royce care a îmbrățișat Big Data prin montarea a sute de senzori în motoarele și sistemele sale de propulsie, care înregistrează fiecare detaliu minuscul despre funcționarea lor. Modificările datelor în timp real sunt raportate inginerilor care vor decide cea mai bună acțiune, cum ar fi planificarea întreținerii sau expedierea echipelor de ingineri.
  • Educaţie: Acesta este un domeniu în care analiza Big Data este absorbită încet și treptat.Optarea pentru tehnologia Big Data alimentată ca instrument de învățare în locul metodelor tradiționale de prelegere, a îmbunătățit învățarea studenților, precum și a ajutat profesorii să-și urmărească performanța mai bine.
  • Cu amănuntul: Retailul, inclusiv comerțul electronic și magazinele, utilizează pe scară largă Big Data Analytics pentru a-și optimiza afacerea. De exemplu, Amazon, Walmart etc.

Cazuri de utilizare a Big Data

Primul caz de utilizare pe care l-am luat aici este al lui Starbucks.

Al doilea caz de utilizare pe care vreau să îl împărtășesc este Procter & Gamble.

Tendințe în analiza datelor mari

Imaginea de mai jos descrie veniturile pe piață ale Big Data înmiliardDolari SUA din anul 2011 până în 2027.

Aici sunt câteva Fapte și statistici de Forbes :

Perspectivele de carieră în Big Data Analytics:

  • Aspecte salariale: Salariul mediu pentru locurile de muncă analitice este de aproximativ 94.167 USD. Data Scientist a fost desemnat cel mai bun loc de muncă din America de trei ani consecutivi, cu un salariu de bază median de 110.000 de dolari și 4.524 de locuri de muncă. În India, procentul de profesioniști în domeniul analizei care obțin salarii mai mici decât INR 10 Lakhs a scăzut procentul de profesioniști în domeniul analizei care câștigă mai mult decât INR 15 Lakhs 17% în 2016 până la douăzeci și unu% în 2017 până la 22,3% în 2018.
  • Oportunități de muncă uriașe: Companii precum Google, Apple, IBM, Adobe, Qualcomm și multe altele angajează profesioniști în Big Data Analytics.

Set de calificare

Acestea sunt câteva dintre abilitățile care sunt necesare în funcție de rolul din domeniul Big Data Analytics:

  • Programare de bază: Ar trebui să aveți cunoștințe despre cel puțin un limbaj de programare cu scop general, cum ar fi Java și Python.
  • Analiza statistică și cantitativă: Este ideal să ai o idee despre statistici și analize cantitative.
  • Depozitarea datelor: Este necesară cunoașterea bazelor de date SQL și NoSQL.
  • Vizualizarea datelor: Este foarte important să știi cum să vizualizezi datele pentru a putea înțelege informațiile și a le aplica în acțiune.
  • Cunostinte specifice de afaceri: Trebuie să fii în mod necesar conștient de afacerea în care aplică analize pentru a-și optimiza operațiunile.
  • Cadrele computaționale: De preferință, ar trebui să știți despre cel puțin unul sau două instrumente care sunt necesare pentru Big Data Analytics.

Acum că cunoașteți Big Data Analytics, consultați de Edureka, o companie de învățare online de încredere, cu o rețea de peste 250.000 de elevi mulțumiți răspândiți pe tot globul. Cursul Edureka Big Data Hadoop Certification Training îi ajută pe cursanți să devină experți în HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume și Sqoop folosind cazuri de utilizare în timp real în domeniul Retail, Social Media, Aviație, Turism, Finanțe.

regresie logistică în codul python

Ai o întrebare pentru noi? Vă rugăm să o menționați în secțiunea de comentarii și vă vom răspunde.