Prelucrare Big Data cu Apache Spark & ​​Scala



Apache Spark a apărut ca o mare dezvoltare în procesarea datelor mari.

substring în exemplu server SQL

IST: 07:00 - 08:00, 17 octombrie’14





PDT: 18:30 - 19:30, 16 octombrie ’14

Locuri limitate !! Completați formularul din dreapta și rezervați-vă astăzi slotul.



Bună tuturor, organizăm un webinar gratuit pe Apache Spark și Scala pe 18 octombrie’14. Titlul seminarului web este „Procesare Big Data cu Apache Spark și Scala” . În acest seminar web, vor fi discutate subiectele esențiale referitoare la Apache Spark și Scala. Orice întrebări sau îndoieli pot fi clarificate în timpul sesiunii.

Subiecte care trebuie acoperite:

  • Ce este Big Data?
  • Ce este Spark?
  • De ce Spark?
  • Ecosistemul Spark
  • O notă despre Scala
  • De ce Scala?
  • Hello Spark - Hands on

De ce Spark?

Apache Spark este un cadru de calcul open-source pentru clusterele de comunități Hadoop. Se califică pentru a fi unul dintre cele mai bune motoare de analiză și procesare a datelor pentru date la scară largă, cu viteza sa inegalabilă, ușurința de utilizare și analiza sofisticată. Următoarele sunt avantajele și caracteristicile care fac din Apache Spark un succes încrucișat pentru analize operaționale și de investigație:

  • Programele dezvoltate prin Spark rulează de 100 de ori mai repede decât cele dezvoltate în Hadoop MapReduce.
  • Spark compilează 80 de operatori la nivel înalt.
  • Spark Streaming permite procesarea datelor în timp real.
  • GraphX ​​este o bibliotecă pentru calcule grafice.
  • MLib este biblioteca de învățare automată pentru Spark.
  • Scris în principal în Scala, Spark poate fi încorporat în orice sistem operațional bazat pe JVM, în același timp poate fi folosit și în modul REPL (Citire, Evaluare, Procesare și Încărcare).
  • Are capacități puternice de stocare în cache și persistență pe disc.
  • Spark SQL îi permite să gestioneze cu competență interogările SQL
  • Apache Spark poate fi implementat prin Apache Mesos, Yarn in HDFS, HBase, Cassandra sau Spark Cluster Manager (propriul manager de cluster Spark).
  • Spark simulează stilul funcțional și colecțiile API ale Scala, ceea ce reprezintă un mare avantaj pentru dezvoltatorii Scala și Java.

Nevoia de Apache Spark:

Spark oferă beneficii imense industriei în ceea ce privește viteza, varietatea sarcinilor pe care le poate îndeplini, flexibilitatea, analiza calității datelor, rentabilitatea etc., care sunt nevoile zilei. Oferă soluții de analiză big data high-end, în timp real, pentru industria IT, satisfăcând cererea crescândă a clienților. Analiza în timp real valorifică capacitățile afacerii în grămezi. Compatibilitatea sa cu Hadoop facilitează adoptarea rapidă de către companii. Există o nevoie puternică de experți și dezvoltatori învățați de la Spark, deoarece aceasta este o tehnologie relativ nouă, care este adoptată din ce în ce mai mult.