Date Mare

Tutorial HBase: Introducere HBase și studiu de caz pe Facebook

Acest blog tutorial HBase vă prezintă ceea ce este HBase și caracteristicile sale. De asemenea, acoperă studiul de caz Facebook Messenger pentru a înțelege beneficiile HBase.

Instalați marioneta - Instalați marioneta în patru pași simpli

Acest blog este un ghid despre cum să instalați Puppet Master și Puppet Agent. De asemenea, include un exemplu de implementare a Apache Tomcat utilizând modulul Puppet Tomcat.

Instalarea Apache Pig pe Linux

Acest blog este un ghid pas cu pas pentru instalarea Apache Pig pe mediul Linux. Vom instala Apache Pig 0.16.0 și îl vom executa în diferite moduri.

Arhitectura HBase: Modelul de date HBase și mecanismul de citire / scriere HBase

Acest blog despre HBase Architecture explică modelul de date HBase și oferă informații despre HBase Architecture. De asemenea, explică diferite mecanisme în HBase.

Hive Tutorial - Hive Architecture și NASA Case Study

Acest blog tutorial Hive vă oferă cunoștințe aprofundate despre Hive Architecture și Hive Data Model. De asemenea, explică studiul de caz al NASA despre Apache Hive.

Tutorial Spark Streaming - Analiza sentimentelor folosind Apache Spark

Acest blog Spark Streaming vă va prezenta Spark Streaming, caracteristicile și componentele sale. Include un proiect de analiză a sentimentelor folosind Twitter.

Spark MLlib - Biblioteca de învățare automată a Apache Spark

Acest blog Spark MLlib vă va prezenta biblioteca de învățare automată a lui Apache Spark. Acesta include un proiect de sistem de recomandare a filmului care utilizează Spark MLlib.

Tutorial Spark GraphX - Analize grafice în Apache Spark

Acest blog Tutorial GraphX vă va prezenta Apache Spark GraphX, caracteristicile și componentele sale, inclusiv un proiect de analiză a datelor de zbor.

Tutorial Apache Flume: Flux de date Twitter

Acest blog tutorial Apache Flume explică fundamentele Apache Flume și caracteristicile sale. Va prezenta, de asemenea, streamingul Twitter folosind Apache Flume.

Tutorial Apache Sqoop - Import / Export date între HDFS și RDBMS

Tutorial Apache Sqoop: Sqoop este un instrument pentru transferul de date între Hadoop și bazele de date relaționale. Acest blog acoperă importul și exportul Sooop din MySQL.

Tutorial Oozie: Aflați cum să vă programați locurile de muncă Hadoop

Tutorial Apache Oozie: Oozie este un sistem de planificare a fluxului de lucru pentru gestionarea lucrărilor Hadoop. Este un sistem scalabil, fiabil și extensibil.

Aplicații Big Data în timp real în diverse domenii

Aplicațiile Big Data revoluționează organizațiile și îi ajută să ia decizii de afaceri mai informative, analizând volume mari de date.

Introducere în Spark cu Python - PySpark pentru începători

Apache Spark a preluat lumea Big Data & Analytics, iar Python este unul dintre cele mai accesibile limbaje de programare utilizate în industrie în prezent. Așadar, aici, pe acest blog, vom afla despre Pyspark (scânteie cu python) pentru a obține cele mai bune rezultate din ambele lumi.

Hadoop YARN Tutorial - Aflați noțiunile fundamentale ale arhitecturii YARN

Acest blog se concentrează pe Apache Hadoop YARN, care a fost introdus în versiunea 2.0 Hadoop pentru gestionarea resurselor și programarea locurilor de muncă. Acesta explică arhitectura YARN cu componentele sale și sarcinile îndeplinite de fiecare dintre ele. Descrie trimiterea aplicației și fluxul de lucru în Apache Hadoop YARN.

Top Articole

Categorie

Articole Interesante