SQL pentru știința datelor: soluție unică pentru începători



Această postare de blog pe SQL pentru știința datelor vă va ajuta să înțelegeți cum poate fi folosit SQL pentru a stoca, accesa și prelua date pentru a efectua analiza datelor.

De când Data Science a fost clasată pe locul 1 pentru că este cea mai promițătoare slujbă din epocă, încercăm cu toții să ne alăturăm cursei de . Această postare de blog pe SQL pentru știința datelor vă va ajuta să înțelegeți cum poate fi folosit SQL pentru a stoca, accesa și prelua date pentru a efectua analiza datelor.

Iată o listă de subiecte care vor fi acoperit în acest blog:





    1. De ce este necesar SQL pentru știința datelor?
    2. Ce este SQL?
    3. Bazele SQL
    4. Instalarea MySQL
    5. Implicat activ

De ce este necesar SQL pentru știința datelor?

Știați că generăm mai mult de 2,5 quintilioane de octeți de date în fiecare zi? Acest ritm de generare a datelor este motivul din spatele popularității tehnologiilor de ultimă generație, cum ar fi Știința datelor , , și așa mai departe.

Obținerea unor informații utile din date este ceea ce se numește Știința datelor. Știința datelor implică extragerea, procesarea și analiza de tone de date. În prezent, ceea ce avem nevoie sunt care poate fi folosit pentru a stoca și gestiona această cantitate vastă de date.



Ce este știința datelor - Edureka

Aici e locul SQL intră.

SQL poate fi utilizat pentru a stoca, accesa și extrage cantități masive de date pentru a realiza mai ușor întregul proces Data Science.



Ce este SQL?

SQL care înseamnă Structured Query Language este un limbaj de interogare menit să gestioneze baze de date relaționale.

Dar ce este mai exact o bază de date relațională?

O bază de date relațională este un grup de tabele bine definite din care datele pot fi accesate, editate, actualizate și așa mai departe, fără a fi nevoie să modificați tabelele bazei de date. SQL este standardul (API) pentru bazele de date relaționale.

Revenind la SQL, programarea SQL poate fi utilizată pentru a efectua mai multe acțiuni pe date, cum ar fi interogarea, inserarea, actualizarea, ștergerea înregistrărilor bazei de date. Exemple de baze de date relaționale care utilizează SQL includ baza de date MySQL, Oracle etc.

Pentru a afla mai multe despre SQL, puteți accesa următoarele bloguri:

  1. Înțelegerea tipurilor de date SQL - Tot ce trebuie să știți despre tipurile de date SQL
  2. CREAȚI TABEL în SQL - Tot ce trebuie să știți despre crearea de tabele în SQL

Înainte de a începe cu o demonstrație pe SQL, să ne familiarizăm cu comenzile SQL de bază.

Bazele SQL

SQL oferă un set de comenzi simple pentru a modifica tabelele de date, să parcurgem câteva dintre comenzile SQL de bază:

cum se folosește atomul cu python
  • CREAȚI BAZA DE DATE - creează o nouă bază de date
  • CREAȚI TABEL - creează un nou tabel
  • INTRODU IN - introduce date noi într-o bază de date
  • SELECTAȚI - extrage date dintr-o bază de date
  • ACTUALIZAȚI - actualizează datele într-o bază de date
  • ȘTERGE - șterge datele dintr-o bază de date
  • ALTER BAZA DE BAZE - modifică o bază de date
  • ALTER TABLE - modifică un tabel
  • MESAJ DE DROP - șterge un tabel
  • CREAȚI INDICE - creează un index pentru a căuta un element
  • DROP INDEX - șterge un indice

Pentru a înțelege mai bine SQL, să instalăm MySQL și să vedem cum puteți juca cu date.

Instalarea MySQL

Instalarea MySQL este o sarcină simplă. Iată un ghid pas cu pas care vă va ajuta să instalați MySQL pe sistemul dvs.

După ce ați terminat instalarea MySQL, urmați secțiunea de mai jos pentru o demonstrație simplă care vă va arăta cum puteți insera, manipula și modifica datele.

SQL pentru știința datelor - Demo MySQL

În această demonstrație, vom vedea cum să creăm baze de date și să le procesăm. Aceasta este o demonstrație la nivel de începător pentru a vă ajuta să începeți cu analiza datelor pe SQL.

Asadar, haideti sa începem!

Pasul 1: Creați o bază de date SQL

O bază de date SQL este un depozit de stocare în care datele pot fi stocate într-un format structurat. Acum să creăm o bază de date folosind MySQL :

CREAȚI BAZA DE DATE edureka FOLOSIȚI edureka

În codul de mai sus, există două comenzi SQL:

Notă : Comenzile SQL sunt definite cu majuscule și un punct și virgulă este utilizat pentru a termina o comandă SQL.

  1. CREATE DATABASE: Această comandă creează o bază de date numită „edureka”

  2. UTILIZARE: Această comandă este utilizată pentru a activa baza de date. Aici activăm baza de date „edureka”.

Pasul 2: creați un tabel cu caracteristicile de date necesare

Crearea unui tabel este la fel de simplă precum crearea unei baze de date. Trebuie doar să definiți variabilele sau caracteristicile tabelului cu tipurile lor de date respective. Să vedem cum se poate face acest lucru:

CREAȚI jucării de masă (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Preț INTEGER, Cantitate INTEGER)

În fragmentul de cod de mai sus apar următoarele lucruri:

  1. Utilizați comanda „CREATE TABLE” pentru a crea o masă numită jucării.
  2. Tabelul de jucărie conține 4 caracteristici, și anume, TID (ID tranzacție), Item_name, Preț și Cantitate.
  3. Fiecare variabilă este definită cu tipurile lor de date respective.
  4. Variabila TID este declarată ca cheie primară. O cheie primară denotă practic o variabilă care poate stoca o valoare unică.

Puteți verifica în continuare detaliile tabelului definit utilizând următoarea comandă:

DESCRIERI jucăriile

java cum se folosește iteratorul

Pasul 3: Introducerea datelor în tabel

Acum că am creat un tabel, să-l completăm cu câteva valori. Mai devreme în acest blog, am menționat cum puteți adăuga date într-un tabel doar folosind o singură comandă, adică INSERT INTO.

Să vedem cum se face acest lucru:

INSERT INTO toys VALUES (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO toys VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO toys VALUES ( NULL, „Dog_house”, 120, 54) INSERT INTO jucării VALORI (NULL, „Skateboard”, 700, 42) INSERT INTO jucării VALORI (NULL, „GI Joe”, 300, 120)

În fragmentul de cod de mai sus, am inserat pur și simplu 6 observații în tabelul „jucării” folosind comanda INSERT INTO. Pentru fiecare observație, între paranteze, am specificat valoarea fiecărei variabile sau caracteristici care a fost definită la crearea tabelului.

Variabila TID este setată la NULL deoarece crește automat de la 1.

Acum să afișăm toate datele prezente în tabelul nostru. Acest lucru se poate face folosind comanda de mai jos:

ALEGE * DIN Jucării


Pasul 4: Modificați intrările de date

Să presupunem că ați decis să creșteți prețul G.I. Joe, deoarece îți atrage mulți clienți. Cum ați actualiza prețul variabilei într-o bază de date?

Este simplu, pur și simplu folosiți comanda de mai jos:

ACTUALIZARE SET Jucării Preț = 350 UNDE TID = 6

Comanda UPDATE vă permite să modificați orice valori / variabile stocate în tabel. Parametrul SET vă permite să selectați o anumită caracteristică, iar parametrul WHERE este utilizat pentru a identifica variabila / valoarea pe care doriți să o modificați. În comanda de mai sus, am actualizat prețul intrării de date al cărui TID este 6 (G.I. Joe).

Acum să vedem tabelul actualizat:

ALEGE * DIN Jucării

De asemenea, puteți modifica ceea ce doriți să fie afișat făcând doar referire la coloanele pe care doriți să le vizualizați. De exemplu, comanda de mai jos va afișa doar numele jucăriei și prețul respectiv:

SELECȚIONEAZĂ Numele articolului, Preț DE LA jucării

Pasul 5: Preluarea datelor

Așadar, după introducerea datelor și modificarea acestora, este în sfârșit timpul să extragem și să preluăm datele în conformitate cu cerințele companiei. Aici datele pot fi recuperate pentru analiza și modelarea ulterioară a datelor.

Rețineți că este un exemplu simplu pentru a începe să utilizați SQL, cu toate acestea, în scenariile din lumea reală, datele sunt mult mai complicate și de dimensiuni mari. În ciuda acestui fapt, comenzile SQL rămân aceleași și acest lucru face ca SQL să fie atât de simplu și de înțeles. Poate procesa seturi de date complexe cu un set de comenzi SQL simple.

Acum, să recuperăm date cu câteva modificări. Consultați codul de mai jos și încercați să înțelegeți ce face fără a privi rezultatul:

ALEGE * DIN JUCĂRILE LIMITA 2

Ai ghicit! Afișează primele două observații prezente în tabelul meu.

Să încercăm ceva mai interesant.

ALEGE * DIN JUCĂRILE COMANDĂ ÎN funcție de preț ASC

După cum se arată în figură, valorile sunt aranjate în funcție de ordinea crescătoare a variabilei de preț. Dacă doriți să căutați cele trei articole cumpărate cel mai frecvent, ce ați face?

Este destul de simplu!

ALEGEȚI * DIN JUCĂRILE COMANDĂ PE Cantitate DESC LIMIT 3

Să încercăm încă unul.

ALEGEȚI * DIN Jucăriile UNDE Preț> 400 COMANDĂ PRET Preț ASC


Această interogare extrage detaliile jucăriilor al căror preț este mai mare de 400 și aranjează rezultatul în ordine crescătoare a prețului.

Deci, astfel puteți procesa date utilizând SQL. Acum, că știți elementele de bază ale SQL pentru știința datelor, sunt sigur că sunteți curios să aflați mai multe. Iată câteva bloguri pentru a începe:

  1. Ce este știința datelor? Un ghid pentru începători pentru știința datelor
  2. Tutorial MySQL - Un ghid pentru începători pentru a afla MySQL

Dacă doriți să vă înscrieți la un curs complet de inteligență artificială și învățare automată, Edureka are un program special care vă va face să vă pricepeți la tehnici precum învățarea supravegheată, învățarea nesupravegheată și procesarea limbajului natural. Acesta include instruire cu privire la cele mai recente progrese și abordări tehnice în inteligența artificială și învățarea automată, cum ar fi învățarea profundă, modelele grafice și învățarea prin întărire.