Date Mare

Spark vs Hadoop: Care este cel mai bun cadru Big Data?

Această postare de blog vorbește despre apache spark vs hadoop. Vă va oferi o idee despre care este cadrul potrivit pentru Big Data de ales în diferite scenarii.

Rularea aplicației Scala în Eclipse IDE folosind Sbteclipse

Acest blog vă ajută să înțelegeți cum să instalați și să configurați pluginul sbteclipse cu instrucțiuni pas cu pas pentru a rula aplicația Scala în Eclipse IDE.

Stăpânit Hadoop? E timpul să începeți cu Apache Spark

Această postare de blog explică de ce trebuie să începi cu Apache Spark după Hadoop și de ce învățarea Spark după ce stăpânești hadoop poate face minuni pentru cariera ta!

Drilling Down On Apache Drill, motorul de interogare New-Age

Acest tutorial Apache Drill vă oferă toate informațiile de care aveți nevoie pentru a începe cu motorul de interogare Apache Drill, utilizarea cu Hadoop, Big Data și Apache Spark.

Apache Spark combineByKey explicat

Acest blog Spark Hadoop vă spune tot ce trebuie să știți despre Apache Spark combineByKey. Găsiți scorul mediu pe elev folosind metoda combineByKey.

Apache Falcon: o nouă platformă de gestionare a datelor pentru ecosistemul Hadoop

Apache Falcon este o nouă platformă de gestionare a datelor pentru ecosistemul Hadoop care simplifică procesarea și gestionarea hranei la bordul clusterelor de hadoop. Aflați cum să o configurați.

Acumulatori de scânteie explicați: Apache Spark

Acest blog Apache Spark explică în detaliu acumulatorii Spark. Aflați cum se folosește acumulatorul de scânteie cu exemple. Acumulatoarele de scânteie sunt precum contoare Hadoop Mapreduce.

Apache Flink: Cadrul de analiză Big Data pentru următoarea generație pentru procesarea datelor în flux și în lot

Aflați totul despre Apache Flink și configurarea unui cluster Flink în acest blog. Flink acceptă procesarea în timp real și în serie și este o tehnologie obligatorie Big Data pentru Big Data Analytics.

Caching distribuit cu variabile difuzate: Apache Spark

Această postare pe blog discută stocarea în cache distribuită cu variabile de difuzare și vă ajută să distribuiți în mod eficient valori mari în programarea Spark.

Certificări CCA și CCP de Cloudera: Tot ce trebuie să știți

Certificările CCA și CCP de Cloudera au înlocuit examenele CCDH și CCSHB. Acest blog vă spune tot ce trebuie să știți despre noile certificări.

Transformări de stare cu Windowing în Spark Streaming

Această postare pe blog discută despre transformările de stare cu ferestrele în Spark Streaming. Aflați totul despre urmărirea datelor pe loturi folosind stream-uri D-state.

Transformare cumulată de stare în Apache Spark Streaming

Această postare pe blog discută despre transformările de stare în Spark Streaming. Aflați totul despre urmărirea cumulativă și îmbunătățirea abilităților pentru o carieră Hadoop Spark.

Big Data în domeniul sănătății: modul în care Hadoop revoluționează analiza medicală

Tehnologiile Hadoop și Big Data revoluționează analiza asistenței medicale. Acest blog de date mari din domeniul sănătății discută despre modul în care analiza datelor mari poate îmbunătăți îngrijirea medicală.

Streaming Hadoop: Scrierea unui program Hadoop MapReduce în Python

Această postare de pe Hadoop Streaming este un ghid pas cu pas pentru a învăța să scrieți un program Hadoop MapReduce în Python pentru a procesa cantități mari de Big Data.

Tutorial Big Data: Tot ce trebuie să știți despre Big Data!

Acest blog pe Tutorialul Big Data vă oferă o prezentare completă a Big Data, caracteristicile sale, aplicațiile, precum și provocările cu Big Data.

Tutorial HDFS: Introducere în HDFS și caracteristicile sale

Acest blog Tutorial HDFS vă va ajuta să înțelegeți sistemul de fișiere distribuite HDFS sau Hadoop și caracteristicile sale. De asemenea, veți explora pe scurt componentele sale de bază.

Splunk vs. ELK vs. Sumo Logic: Care funcționează cel mai bine pentru tine?

În acest tutorial Splunk, înțelegeți diferențele dintre Splunk vs. ELK vs. Sumo Logic și determinați care dintre aceste instrumente vi se potrivește cel mai bine.

Splunk Use Case: Domino’s Success Story

În acest blog de caz de utilizare Splunk, veți înțelege modul în care Domino's Pizza a folosit Splunk pentru a obține informații despre comportamentul consumatorilor și pentru a-și formula strategiile de afaceri.

Instalați Hadoop: Configurarea unui cluster Hadoop cu un singur nod

Acest tutorial este un ghid pas cu pas pentru a instala clusterul Hadoop și a-l configura pe un singur nod. Toți pașii de instalare Hadoop sunt pentru mașina CentOS.

Comenzi HDFS: Comenzi Hadoop Shell pentru a gestiona HDFS

Acest blog vorbește despre diferitele comenzi HDFS, cum ar fi fsck, copyFromLocal, expunge, cat etc., care sunt utilizate pentru a gestiona sistemul de fișiere Hadoop.

Top Articole

Categorie

Articole Interesante