Introducere în Familia coloanei cu Cassandra



Acest blog evidențiază importanța familiei de coloane cu Cassandra

Familia Coloanelor

O familie de coloane este similară cu un tabel din RDBMS sau Sistemul de gestionare a bazelor de date relaționale și este o diviziune logică care asociază date similare. Practic, în date similare, aveți tendința de a stoca un fel de date care sunt de subiecte similare.

De exemplu, datele unei comenzi sunt stocate într-o singură familie de coloane, astfel încât să puteți avea un cod de comandă ca cheie de rând, precum și diverse coloane, cum ar fi tipul de produs care a fost adus ca parte a acelei comenzi, pentru a fi stocate în familia de comenzi specială . Pentru a da anumite exemple, o familie de coloane de utilizator constă dintr-un ID de utilizator ca cheie. Prin urmare, este liber să alegeți un ID, iar coloanele pot fi „nume = Kunal”. Iar valorile coloanelor sunt Kunal și Bangalore. Există o a doua familie de coloane numită familie de coloane Cricketer care permite stocarea statisticilor de cricketer într-o familie de coloane. De exemplu, puteți avea Sachin Tendulkar într-o coloană și numărul de secole în alta. Prin urmare, poate exista orice număr de coloane.





Tipuri de coloane

Column Family nu este altceva decât un tabel care este analog cu un tabel într-o lume RDBMS. Există anumite tipuri, și anume

Coloana statică Familia - Familia de coloane statice este locul în care sunt definite numele și tipurile de date. Deci, atunci când familia de coloane este creată, este disponibilă opțiunea de a denumi numele coloanei și tipurile de date. Se numește static, deoarece coloanele rămân statice, iar numărul de coloane disponibile va fi cunoscut.



Familie dinamică de coloane - Pe de altă parte, o familie dinamică de coloane nu definește numele coloanelor din față și este disponibilă capacitatea Cassandrei de a folosi aplicații arbitrare și nume de coloane pentru a stoca date. Deci, dinamica ajută într-un fel, deoarece într-o date nestructurate, de cele mai multe ori, familia dinamică de coloane ajută la îngrijirea câmpurilor noi care ar fi putut fi adăugate ulterior.

Dacă aveți o familie de coloane statice și doriți să adăugați o familie de coloane dinamice în codul dvs. în timp ce încărcați datele, aceasta poate fi adăugată oricând la o familie de coloane statice. Cassandra oferă libertatea de a alege numele coloanelor.

Diferența cu RDBMS

Familia de coloane Cassandra este fără schemă și este mult scalabilă. Familia de coloane Cassandra are două atribute - Nume și Comparator. Deci, atunci când aveți o familie de coloane Cassandra, acordarea unui nume devine obligatoriu, iar Comparator este practic un tip de date pentru numele coloanelor. Dacă nu specificați comparatorul, acesta va presupune că este un comparator implicit.



Cassandra are, de asemenea, o coloană de familii de super coloane. Va folosi o super coloană intern. Este o grupare logică și un alt nivel de grupare a coloanelor. Deci, într-o familie de coloane de utilizatori, puteți avea două super coloane în care putem avea informații personale ale utilizatorilor și informații despre produse.

Coloane

O coloană este cea mai mică creștere de date din Cassandra. Are 3 componente:

  • Nume
  • Valoare
  • Timestamp-ul - Folosit pentru soluționarea conflictelor și ștampila nu poate fi editată. Este un mecanism intern pentru a vedea când aceste date sau coloane au fost actualizate.
  • Coloane expirante - O dată de expirare poate fi dată unei coloane pentru a ști că coloana va expira.
  • Coloane contra - Coloanele contorului nu sunt altceva decât să mențină coloanele, astfel încât să puteți incrementa și diminua aceste coloane.

Super Coloane

Super Columns este gruparea tuturor coloanelor în totalitate, în funcție de nevoile unei companii și de gruparea logică. Se adaugă un alt nivel de cuibărire la structura regulată a familiei de coloane. Acestea cuprind o structură de familie super coloană.

Cazul principal pentru super coloane este de a denormaliza mai multe rânduri din alte familii de coloane într-un singur rând, permițând recuperarea materializată a vizualizării.

Cazuri de utilizare

Limitările super coloanelor

O limitare este că toate subcoloanele unei familii de coloane super trebuie să fie de-serializate pentru a citi o singură familie de coloane secundare. O altă limitare este că nu putem crea indici secundari pe subcolonele unei supercoloane.

Tipuri de date de coloană

Tipuri de date coloane

În imaginea de mai sus, există diferite tipuri de date. Tipul de date pentru o valoare de coloană se numește validator. Și comparatorul este tipul de date pentru o coloană. Numele și adresa devin un nume de coloană. Deci, puteți avea o dată în cazul numelor de coloane. Puteți avea, de asemenea, o serie de date temporale având data ca nume de coloană.

Rânduri

Pot exista rânduri largi și mai multe rânduri. Pot fi disponibile milioane de coloane și rânduri.

Rândurile slabe au un număr mic de coloane având opțiunea de a avea doar rânduri limitate.

Tasta compusă

Se compune din unul sau mai multe câmpuri cheie primare. Să presupunem că numele unui oraș este setat ca o cheie de rând, poate există un oraș numit în două state diferite, deci va trebui să menționați ce oraș și ce stat. Acest lucru înseamnă pur și simplu că trebuie menționată cheia. În loc să aveți o cheie simplă de coloană de un singur tip, puteți agrega mai multe valori numite și componente de mai multe tipuri pentru a forma o cheie de coloană unică.

Ai o întrebare pentru noi? Menționați-le în secțiunea de comentarii și vă vom răspunde.

Postări asemănatoare:

ce este bucătarul în devops

Introducere în Snitches în Cassandra