Instalarea Apache Hive pe Ubuntu



În acest blog vom afla despre instalarea Apache Hive pe Ubuntu și conceptele din jurul Hadoop Hive, Hive sql, baza de date Hive, serverul Hive și instalarea Hive.

Apache Hive este unul dintre cele mai importante cadre din ecosistemul Hadoop, ceea ce îl face foarte important . În acest blog, vom afla despre instalarea Apache Hive și Hive pe Ubuntu.

Ce este Apache Hive?

Apache Hive este o infrastructură de depozit de date care facilitează interogarea și gestionarea seturilor mari de date care se află în sistemul de stocare distribuită. Este construit deasupra Hadoop și dezvoltat de Facebook. Stup oferă o modalitate de a interoga datele utilizând un limbaj de interogare de tip SQL numit HiveQL (Limbaj de interogare Hive).





Intern, un compilator traduce HiveQL declarații în MapReduce locuri de muncă, care sunt apoi trimise la Cadrul Hadoop pentru executare.

Diferența dintre Hive și SQL:

Stup arată foarte asemănător cu baza de date tradițională cu SQL acces. Cu toate acestea, pentru că Stup se bazeaza pe Hadoop și MapReduce operațiuni, există mai multe diferențe cheie:



Deoarece Hadoop este destinat scanărilor secvențiale lungi și Stup se bazeaza pe Hadoop , v-ați aștepta ca interogările să aibă o latență foarte mare. Înseamnă că Stup nu ar fi adecvat pentru acele aplicații care necesită timpi de răspuns foarte rapizi, așa cum vă puteți aștepta cu o bază de date tradițională RDBMS.

In cele din urma, Stup este bazat pe citire și, prin urmare, nu este adecvat pentru procesarea tranzacțiilor care implică de obicei un procent mare de operațiuni de scriere.

cum se face testarea bazei de date

Instalarea Hive pe Ubuntu:

Vă rugăm să urmați pașii de mai jos pentru instalare Apache Hive pe Ubuntu:



Pasul 1: Descarca Gudron de stup.

Comanda: wget http://archive.apache.org/dist/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

Pasul 2: Extrageți gudron fişier.

Comanda: tar -xzf apache-hive-2.1.0-bin.tar.gz

Comanda: eu sunt

Spread Hive File - Instalare Hive - Edureka

Pasul 3: Editați fișierul „.Bashrc” fișier pentru a actualiza variabilele de mediu pentru utilizator.

Comanda: sudo gedit .bashrc

Adăugați următoarele la sfârșitul fișierului:

# Setați HIVE_HOME

export HIVE_HOME = / home / edureka / apache-hive-2.1.0-bin
export PATH = $ PATH: /home/edureka/apache-hive-2.1.0-bin/bin

De asemenea, asigurați-vă că și calea hadoop este setată.

Rulați comanda de mai jos pentru ca modificările să funcționeze în același terminal.

Comanda: sursa .bashrc

Pasul 4: Verificați versiunea stupului.

merge sort algoritm c ++

Pasul 5: Crea Stup directoare în HDFS . Directorul 'depozit' este locația pentru a stoca tabelul sau datele legate de stup.

Comanda:

  • hdfs dfs -mkdir -p / utilizator / stup / depozit
  • hdfs dfs -mkdir / tmp

Pasul 6: Setați permisiunile de citire / scriere pentru tabel.

Comanda:

În această comandă, acordăm permisiunea de scriere grupului:

  • hdfs dfs -chmod g + w / utilizator / stup / depozit
  • hdfs dfs -chmod g + w / tmp

Pasul 7: A stabilit Hadoop cale în h ive-env.sh

Comanda: cd apache-hive-2.1.0-bin /

Comanda: gedit conf / hive-env.sh

Setați parametrii așa cum se arată în instantaneul de mai jos.

Pasul 8: Editați | × hive-site.xml

Comanda: gedit conf / hive-site.xml

javax.jdo.option.ConnectionURL jdbc: derby: databaseName = / home / edureka / apache-hive-2.1.0-bin / metastore_dbcreate = adevărat șir de conectare JDBC pentru un metastore JDBC. Pentru a utiliza SSL pentru a cripta / autentifica conexiunea, furnizați un flag SSL specific bazei de date în adresa URL a conexiunii. De exemplu, jdbc: postgresql: // myhost / db? Ssl = true pentru baza de date postgres. hive.metastore.warehouse.dir / user / hive / locația depozitului bazei de date implicite pentru depozitul hive.metastore.uris Thrift URI pentru metastore-ul la distanță. Folosit de clientul metastore pentru a se conecta la metastore la distanță. javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver Numele clasei driverului pentru un metastore JDBC javax.jdo.PersistenceManagerFactoryClass org.datanucleus.api.jdo.JDOPersistenceManagerFactory clasa care implementează jdo

Pasul 9: În mod implicit, Hive folosește Derby Bază de date. Inițializați baza de date Derby.

Comanda: bin / schematool -initSchema -dbType derby

Pasul 10 :Lansa Stup.

ce este moștenirea multiplă în java

Comanda: stup

Pasul 11 :Rulați câteva interogări în shell Hive.

Comanda: afișați baze de date

Comanda: creați tabelul angajat (șir de identificare, șir de nume, șir dept) format de rând câmpuri delimitate terminate de „stocate ca fișier text

Comanda: arata mese

Pasul 12: Pentru a ieși din Stup:

Comanda: Ieșire

Acum că ați terminat instalarea Hive, următorul pas înainte este să încercați comenzile Hive pe shell Hive. Prin urmare, următorul nostru blog „ Comenzi de top Hive cu exemple în HQL ”Vă va ajuta să stăpâniți comenzile Hive.

Postări asemănatoare:

Cum se execută Hive Scripts?

Comenzi Hive

Introducere în Apache Hive