Tutorial HBase: Introducere HBase și studiu de caz pe Facebook
Acest blog tutorial HBase vă prezintă ceea ce este HBase și caracteristicile sale. De asemenea, acoperă studiul de caz Facebook Messenger pentru a înțelege beneficiile HBase.
Acest blog tutorial HBase vă prezintă ceea ce este HBase și caracteristicile sale. De asemenea, acoperă studiul de caz Facebook Messenger pentru a înțelege beneficiile HBase.
Acest blog este un ghid despre cum să instalați Puppet Master și Puppet Agent. De asemenea, include un exemplu de implementare a Apache Tomcat utilizând modulul Puppet Tomcat.
Acest blog este un ghid pas cu pas pentru instalarea Apache Pig pe mediul Linux. Vom instala Apache Pig 0.16.0 și îl vom executa în diferite moduri.
Acest blog despre HBase Architecture explică modelul de date HBase și oferă informații despre HBase Architecture. De asemenea, explică diferite mecanisme în HBase.
Acest blog tutorial Hive vă oferă cunoștințe aprofundate despre Hive Architecture și Hive Data Model. De asemenea, explică studiul de caz al NASA despre Apache Hive.
Acest blog Spark Streaming vă va prezenta Spark Streaming, caracteristicile și componentele sale. Include un proiect de analiză a sentimentelor folosind Twitter.
Acest blog Spark MLlib vă va prezenta biblioteca de învățare automată a lui Apache Spark. Acesta include un proiect de sistem de recomandare a filmului care utilizează Spark MLlib.
Acest blog Tutorial GraphX vă va prezenta Apache Spark GraphX, caracteristicile și componentele sale, inclusiv un proiect de analiză a datelor de zbor.
Acest blog tutorial Apache Flume explică fundamentele Apache Flume și caracteristicile sale. Va prezenta, de asemenea, streamingul Twitter folosind Apache Flume.
Tutorial Apache Sqoop: Sqoop este un instrument pentru transferul de date între Hadoop și bazele de date relaționale. Acest blog acoperă importul și exportul Sooop din MySQL.
Tutorial Apache Oozie: Oozie este un sistem de planificare a fluxului de lucru pentru gestionarea lucrărilor Hadoop. Este un sistem scalabil, fiabil și extensibil.
Aplicațiile Big Data revoluționează organizațiile și îi ajută să ia decizii de afaceri mai informative, analizând volume mari de date.
Apache Spark a preluat lumea Big Data & Analytics, iar Python este unul dintre cele mai accesibile limbaje de programare utilizate în industrie în prezent. Așadar, aici, pe acest blog, vom afla despre Pyspark (scânteie cu python) pentru a obține cele mai bune rezultate din ambele lumi.
Acest blog se concentrează pe Apache Hadoop YARN, care a fost introdus în versiunea 2.0 Hadoop pentru gestionarea resurselor și programarea locurilor de muncă. Acesta explică arhitectura YARN cu componentele sale și sarcinile îndeplinite de fiecare dintre ele. Descrie trimiterea aplicației și fluxul de lucru în Apache Hadoop YARN.
În acest blog pe PySpark Tutorial, veți afla despre API-ul PSpark care este utilizat pentru a lucra cu Apache Spark folosind limbajul de programare Python.
În acest blog tutorial PySpark Dataframe, veți afla despre transformări și acțiuni în Apache Spark cu mai multe exemple.
Acest blog Edureka pe Cloudera Hadoop Tutorial vă va oferi o perspectivă completă asupra diferitelor componente Cloudera, cum ar fi Cloudera Manager, Parcele, Hue etc.
Această postare descrie despre creșterea cererii de abilități Hadoop și NoSQL în domeniul IT și în alte domenii. citiți mai departe pentru a vedea cum vă vor ajuta abilitățile Hadoop și NoSQL
Acest blog discută despre avantajele implementării Hadoop, inițiativele Hadoop, Hadoop în organizațiile mici și mari și beneficiile de carieră ale formării Hadoop.
Hadoop a devenit o abilitate fierbinte care trebuie dobândită în circuitul IT, numărul profilului cursanților Hadoop crește drastic zi de zi.