Tutorial Python Seaborn: Ce este Seaborn și cum se folosește?



Tutorial Python Seaborn de-a lungul diferenței dintre seaborn și matplotlib. Aflați și despre diversele funcții și personalizări disponibile în seaborn.

Python este un depozit de numeroase biblioteci și cadre extrem de puternice. Printre ei, este Seaborn, care este un dominant vizualizarea datelor bibliotecă, acordând încă un motiv finalizării programatorilor . În acest tutorial Python Seaborn, veți înclina toate abilitățile de vizualizare a datelor folosind Seaborn.

Înainte de a merge mai departe, să aruncăm o privire asupra tuturor subiectelor de discuție din acest articol:





Așadar, să începem mai întâi prin argumentarea importanței Python Seaborn.

De ce să folosim Python Seaborn?

Așa cum am menționat anterior, biblioteca Python Seaborn este utilizată pentru a ușura sarcina dificilă de vizualizare a datelor și se bazează pe . Seaborn permite crearea graficelor statistice prin următoarele funcționalități:



  • Un API bazat pe seturi de date care să permită compararea între multiple variabile

  • Suportă grile multi-plot care, la rândul lor, ușurează construirea de vizualizări complexe

  • Vizualizări univariate și bivariate disponibile pentru a compara între subseturi de date



  • Disponibilitatea diferitelor palete de culori pentru a dezvălui diferite tipuri de modele

  • Estimări și parcele automat

Deci, dacă vă întrebați de ce să folosiți Seaborn când aveți deja Matplotlib, iată răspunsul la acesta.

Python Seaborn vs Matplotlib:

„Dacă Matplotlib„ încearcă să facă lucrurile ușoare ușoare și lucrurile dificile posibile ”, seaborn încearcă să faciliteze și un set bine definit de lucruri grele” - Michael Waskom (Creatorul Seaborn).
De fapt, Matplotlib este bun, dar Seaborn este mai bun. În principiu, există două neajunsuri ale Matplotlib pe care Seaborn le remediază:

  1. Matplotlib poate fi personalizat, dar este dificil să ne dăm seama ce setări sunt necesare pentru a face parcelele mai atractive. Pe de altă parte, Seaborn vine cu numeroase teme personalizate și interfețe la nivel înalt pentru a rezolva această problemă.

  2. Când lucrați cu Panda , Matplotlib nu servește bine atunci când vine vorba de tratarea DataFrames, în timp ce funcțiile Seaborn funcționează efectiv pe DataFrames.

Cum se instalează Seaborn?

Pentru a instala biblioteca Python Seaborn, puteți utiliza următoarele comenzi pe baza platformei pe care o utilizați:

pip instalează seaborn

sau

instalați conda seaborn

Odată ce acest lucru este instalat, asigurați-vă că instalați pachetele și bibliotecile de care depinde seaborn.

Instalarea dependențelor Python Seaborn:

Dependențele obligatorii pentru seaborn sunt:

Există și o dependență recomandată, care este:

  • modele de stat

Pentru a instala aceste biblioteci, puteți utiliza aceleași comenzi ca cele prezentate anterior pentru Seaborn cu numele lor respective. Odată instalate, acestea pot fi importate cu ușurință. Seaborn vă permite să încărcați orice set de date din folosind load_dataset () funcţie. De asemenea, puteți vizualiza toate seturile de date disponibile utilizând funcția get_dataset_names () după cum urmează:

EXEMPLU:

importă seaborn ca sns sns.get_dataset_names ()

Aceasta va returna o listă cu toate seturile de date disponibile.
Acum, că v-ați configurat mediul în care lucrați cu seaborn, să mergem mai departe pentru a vedea cum să folosiți funcțiile de reprezentare a acestuia în .

Funcții de complotare Seaborn

Vizualizarea relațiilor statistice:

Procesul de înțelegere a relațiilor dintre variabilele unui set de date și modul în care aceste relații, la rândul lor, depind de alte variabile este cunoscut sub numele de analiză statistică. Să analizăm acum mai profund funcțiile necesare pentru acest lucru:

relplot ():

Aceasta este o funcție la nivel de figură care folosește alte două funcții de axe pentru vizualizarea relațiilor statistice care sunt:

  • scatterplot ()
  • lineplot ()

Aceste funcții pot fi specificate folosind parametrul „kind” al relplot (). În cazul în care acest parametru este dat, îl ia pe cel implicit, care este scatterplot (). Înainte de a începe să scrieți codul, asigurați-vă că importați bibliotecile necesare după cum urmează:

import numpy ca np import panda ca pd import matplotlib.pyplot ca plt import seaborn ca sns sns.set (style = 'darkgrid')

Vă rugăm să rețineți că atributul de stil este, de asemenea, personalizabil și poate lua orice valoare, cum ar fi darkgrid, căpușe, etc pe care le voi discuta mai târziu în secțiunea complot-estetică. Să vedem acum un mic exemplu:

EXEMPLU:

f = sns.load_dataset („zboruri”) sns.relplot (x = „pasageri”, y = „lună”, date = f)

IEȘIRE:

Zboruri1-Python Seaborn Tutorial-Edureka

După cum puteți vedea, punctele sunt reprezentate în 2 dimensiuni. Cu toate acestea, puteți adăuga o altă dimensiune utilizând semantica „nuanță”. Să aruncăm o privire la același exemplu:

tablou cum să creați un set

EXEMPLU:

f = sns.load_dataset („zboruri”) sns.relplot (x = „pasageri”, y = „lună”, nuanță = „an”, date = f)

Veți vedea următoarea ieșire:

IEȘIRE:

Cu toate acestea, există mai multe personalizări pe care le puteți încerca, cum ar fi culorile, stilurile, dimensiunea etc. Permiteți-mi să vă arăt cum puteți schimba culoarea în următorul exemplu:

EXEMPLU:

sns.set (style = 'darkgrid') f = sns.load_dataset ('flight') sns.relplot (x = 'pasageri', y = 'lună', nuanță = 'an', paletă = 'ch: r = - .5, l = .75 ', date = f)

IEȘIRE:

lineplot ():

Această funcție vă va permite să trasați o linie continuă pentru datele dvs. Puteți utiliza această funcție modificând parametrul „kind” după cum urmează:

EXEMPLU:

a = pd.DataFrame ({„Ziua”: [1,2,3,4,5,6,7], „Băcănie”: [30,80,45,23,51,46,76], „Îmbrăcăminte” : [13,40,34,23,54,67,98], „Utensile”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Ziua', y = 'Îmbrăcăminte', kind = 'linie', date = a) g.fig.autofmt_xdate ()

IEȘIRE:

Valoarea implicită pentru graficul de linie este y în funcție de x. Cu toate acestea, poate fi modificat dacă doriți să faceți acest lucru. Există multe alte opțiuni pe care le puteți încerca mai departe.

Acum să aruncăm o privire la modul de trasare a datelor categorice.

Complotarea cu date categorice:

Această abordare intră în imagine atunci când variabila noastră principală este împărțită în continuare în grupuri discrete (categorice). Acest lucru poate fi realizat folosind funcția catplot ().

catplot ():

Aceasta este o funcție la nivel de figură ca relplot (). Poate fi caracterizat prin trei familii de funcții la nivel de axe și anume:

  1. Scatterplots - Acestea includ stripplot (), swarmplot ()

  2. Parcele de distribuție - care sunt boxplot (), violinplot (), boxenplot ()

  3. Diagramele estimative - și anume pointplot (), barplot (), countplot ()

Să luăm acum câteva exemple pentru a demonstra acest lucru:

EXEMPLU:

import mare ca sns import matplotlib.pyplot ca plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', date = a)

IEȘIRE:

După cum puteți vedea, în exemplul de mai sus nu am setat parametrul „kind”. Prin urmare, a returnat graficul ca dispersor implicit. Puteți specifica oricare dintre funcțiile nivelului axelor pentru a schimba graficul după cum este necesar. Să luăm și un exemplu:

EXEMPLU:

import mare ca sns import matplotlib.pyplot ca plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'vioară', date = a)

IEȘIRE:

Ieșirea de mai sus arată diagrama de vioară pentru setul de date de sfaturi. Acum, să încercăm să găsim cum să vizualizăm distribuția unui set de date.

Vizualizarea distribuției unui set de date:

Aceasta se referă în principal la înțelegerea seturilor de date cu contextul de a fi univariate sau bivariate. Înainte de a începe cu aceasta, trebuie doar să importați următoarele:

import numpy ca np import pandas ca pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)

Odată ce ați făcut acest lucru, puteți continua graficarea distribuțiilor univariate și bivariate.

Trasarea distribuțiilor univariate:

Pentru a le parcela, puteți utiliza funcția distplot () după cum urmează:

EXEMPLU:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

IEȘIRE:

După cum puteți vedea în exemplul de mai sus, am trasat un grafic pentru variabila a ale cărei valori sunt generate de funcția normal () folosind distplot.

Trasarea distribuțiilor bivariate:

Acest lucru apare în imagine atunci când aveți două variabile independente aleatorii care duc la un eveniment probabil. Cea mai bună funcție pentru trasarea acestui tip de grafice este jointplot (). Haideți acum să trasăm un grafic bivariat folosind jointplot ().

EXEMPLU:

x = pd.DataFrame ({„Ziua”: [1,2,3,4,5,6,7], „Băcănie”: [30,80,45,23,51,46,76], „Îmbrăcăminte” : [13,40,34,23,54,67,98], „Utensile”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({„Ziua”: [8,9,10,11,12,13,14], „Băcănie”: [30,80,45,23,51,46, 76], „Haine”: [13,40,34,23,54,67,98], „Ustensile”: [12,32,27,56,87,54,34]}, index = [8,9 , 10,11,12,13,14]) medie, cov = [0, 1], [(1, 0,5), (, 5, 1)] date = np.random.multivariate_normal (medie, cov, 200 ) cu sns.axes_style ('alb'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

IEȘIRE:

Acum, că ați înțeles diversele funcții din Python Seaborn, să trecem la construirea unor rețele structurate cu mai multe parcele.

Grile cu mai multe parcele:

Python Seaborn vă permite să trasați mai multe grile unul lângă altul. Acestea sunt practic grafice sau grafice care sunt reprezentate grafic folosind aceeași scară și axe pentru a ajuta la comparația dintre ele. La rândul său, acest lucru ajută programatorul să facă diferența rapidă între parcele și să obțină cantități mari de informații.

Luați în considerare următorul exemplu de funcție facetgrid () pentru a trasa aceste grafice.

EXEMPLU:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'specie') b.map (plt.hist, 'sepal_length')

IEȘIRE:

Rezultatul de mai sus arată clar comparația dintre sfaturile oferite în timpul prânzului și cinei. De asemenea, puteți face complot utilizând funcția PairGrid atunci când aveți o pereche de variabile de comparat. Luați în considerare următorul exemplu.

EXEMPLU:

sns.set (style = 'ticks') a = sns.load_dataset ('flight') b = sns.PairGrid (a) b.map (plt.scatter)

IEȘIRE:

După cum puteți vedea, rezultatul de mai sus compară clar între an și numărul de pasageri în moduri diferite.

Seaborn permite, de asemenea, personalizări în ceea ce privește estetica, care este discutată în continuare.

Plot-Estetic:

Acest segment al tutorialului Python Seaborn se ocupă de a face parcelele noastre mai atractive și mai încântătoare.

Figura-Estetică Python Seaborn:

Prima funcție pe care o voi discuta este setată (). Am mai folosit parametrul „style” al acestei funcții. Acest parametru tratează în esență teme de mare. În prezent, există cinci dintre acestea disponibile și anume darkgrid, căpușe, whitegrid, alb și întunecat.

Luați în considerare următorul exemplu care demonstrează tema albă.

EXEMPLU:

import mare născut ca sns import matplotlib.pyplot ca plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', date = a)

IEȘIRE:

În rezultatul de mai sus, puteți observa că tema este schimbată în alb. Le puteți explora în continuare folosind și celelalte teme. Dacă observați în ieșirea anterioară, există axe prezente în jurul graficului. Cu toate acestea, acest lucru este personalizabil și folosind funcția despine (). Uită-te la exemplul de mai jos.

EXEMPLU:

import mare născut ca sns import matplotlib.pyplot ca plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', date = a) sns.despine (offset = 10, trim = True)

IEȘIRE:



Rețineți diferența dintre cele două ieșiri anterioare. Cu toate acestea, există multe alte opțiuni pe care le puteți explora singuri.

Palete de culori Python Seaborn:

Culoarea este practic caracteristica care se apropie de ochii omului dincolo de orice altă caracteristică. Seaborn vă permite să jucați cu culori folosind diverse funcții, cum ar fi color_palette (), hls_palette (), husl_palette (), etc. Aruncați o privire asupra culorilor care sunt prezente în prezent în seaborn.

EXEMPLU:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

IEȘIRE:

abstractizare date c ++

Imaginea de mai sus arată culorile prezente în seaborn. Am făcut-o folosind funcția palplot (). Pentru variații mai profunde, puteți utiliza hls_palette (), husl_palette () etc.

Acest lucru ne aduce la sfârșitul Tutorialului Python Seaborn. Sper că ai înțeles totul clar. Asigurați-vă că exersați cât mai mult posibil .

Ai o întrebare pentru noi? Vă rugăm să o menționați în secțiunea de comentarii a acestui blog „Python Seaborn Tutorial” și vă vom contacta cât mai curând posibil.

Pentru a obține cunoștințe aprofundate despre Python împreună cu diferitele sale aplicații, vă puteți înscrie pentru live cu suport 24/7 și acces pe viață.