OLTP vs OLAP



Următorul blog vorbește pe scurt despre OLTP vs OLAP și despre diferitele cazuri de utilizare.

OLTP vs OLAP

Se spune că OLTP este mai mult un sistem tranzacțional online sau un sistem de stocare a datelor, în care utilizatorul efectuează o mulțime de tranzacții online folosind magazinul de date. Se spune, de asemenea, că există mai multe citiri / scrieri ad-hoc care se întâmplă în timp real.





OLAP este mai mult un magazin de date offline. Este accesatde câte oriîn mod offline. De exemplu, fișierele jurnal în bloc sunt citite și apoi scrise înapoi în fișierele de date. Unele dintre zonele comune în care se folosește OLAP sunt Joburi în jurnal, Joburi în minerit de date etc.

Se spune că Cassandra este mai mult OLTP, întrucât este în timp real, în timp ce Hadoop este mai mult OLAP, deoarece este folosit pentru analize și scrieri în bloc.



De ce să integreze OLAP și OLTP?

Dacă în cazul în care căutați cel mai ieftin preț pentru rezervarea unui hotel în următoarele 365 de zile, aici aveți un set imens de date pentru Cassandra și doriți să primiți recomandări privind baza de date în timp real, o promoție este rulată în funcție de preț.

Într-un astfel de scenariu, trebuie să iterăm toate înregistrările și să ținem analitice pe deasupra, ceea ce este un job offline imens care trebuie inițiat de multe ori. Aici, Hadoop intră în joc pentru analiza datelor în bloc.

Celălalt beneficiu este că putem rula un cluster și renunța la rularea unui cluster Hadoop diferit.



Al treilea beneficiu este acela că se poate reduce și o mulțime de costuri de funcționare.

Având în vedere un scenariu în care, dacă un utilizator este bine versat în diferite sisteme ecologice Hadoop, cum ar fi Hive, Pig Latin și trebuie să integreze date în acesta, atunci trebuie să conectați o sursă de date în Cassandra și să încercați să rulați Map Reduceți și locurile de muncă.

Există un model vizibil între OLTP și OLAP. În OLTP, există un număr mai mic de scrieri, de ex. Informații despre hotel. Presupunând că modificările de preț au loc la fiecare 5000 de ori pe secundă, citirile pot fi mai multe aici. Într-un astfel de scenariu, poate exista 1 scriere pe secundă, dar citirile ar putea fi expulzate la sute și mii. Deci raportul de aici este de aproximativ 1: 1000.

java așteptați și notificați exemplul

Este o observație interesantă că Cassandra se poate potrivi cu ușurință în acest model, care include modele, în care citirea / scrierea este egală. De asemenea, când vine vorba de OLTP, chiar dacă cineva intră într-un model de consistență reglabil și puternic, se poate observa un decalaj de milisecundă între eventualele modele consistente și cele mai puternice modele consistente. Astfel, Cassandra se poate încadra în OLTP.

Venind la OLAP, se pot vedea diferite tipare OLAP, ceea ce înseamnă că există mai multe scrieri care se întâmplă simultan. În OLAP, aruncăm datele într-o singură fotografie, adică toate fișierele jurnal sunt introduse în magazinul de date și apoi începem procesarea. Modelul de date sau modelul de acces este exact opusul tipului de aplicație OLTP. Aici, Hadoop sau MapReduce vor fi utile.

Ai o întrebare pentru noi? Menționați-le în secțiunea de comentarii și vă vom răspunde.

Postări asemănatoare:

Top 5 motive pentru a învăța Cassandra