Învățare supravegheată în Apache Mahout



Învățarea supravegheată este o tehnică de învățare automată, în care o funcție este dedusă din exemplele etichetate de date de formare.

Învățarea supravegheată este metoda, în care datele de instruire includ atât intrarea, cât și rezultatele dorite. Instruirea sistemului cu exemple se numește învățare supravegheată. Sau altfel, instruirea algoritmului cu un profesor poate fi tratată și ca învățare supravegheată. După antrenarea algoritmului cu toate datele eșantionului sau datele etichetate, care are atât predictorii asupra variabilei țintă, se poate antrena algoritmul și se poate folosi exemplul nevăzut pentru o clasificare ulterioară.





pentru ce se utilizează cadrul de primăvară

Iată câteva dintre caracteristicile importante ale învățării supravegheate în Mahout:

  • Construirea unui set adecvat de formare, validare și testare (Bok) este crucială.
  • Aceste metode sunt de obicei rapide și exacte.
  • Metodele de învățare supravegheate trebuie să fie capabile să se generalizeze.
  • Acestea dau rezultate corecte, atunci când datele noi sunt date în intrare fără să știe unprioriţintă.
  • În unele cazuri, rezultatele corecte (țintele) sunt cunoscute și date în contribuția modelului în timpul procesului de învățare.

Exemplu de învățare supravegheată

În cazul în care doriți să instruiți o misiune și vi se oferă două grupuri diferite de imagini împreună cu datele etichetate, de ex. în imaginea de mai sus, un grup are imaginile unui elefant, iar celălalt are imaginile unui leu. Datele etichetate implică ca fiecare set de date să aibă o valoare țintă. În exemplul de mai sus, setul de date este imagini de elefant, în timp ce eticheta dată acestuia, adică „Elefant” este valoarea țintă a setului de date. Un astfel de set de date etichetate este utilizat pentru procesul de instruire, astfel încât algoritmul de instruire să poată utiliza acest set de date și să construiască un model, care poate fi utilizat în continuare pentru a clasifica exemplele nevăzute fără datele etichetate sau variabila țintă.



Să identificăm caracteristicile care ajută la identificarea unui obiect ca un elefant sau un leu:

Caracteristicile ar putea fi - mărimea, culoarea, înălțimea, mărimea urechii, trunchiul, colțul

Acesta poate fi numit un set de caracteristici, care va fi utilizat în scopul instruirii. Acest set de caracteristici va avea impact asupra variabilei țintă finale. Aceste variabile sunt cunoscute sub numele de variabile predictive , deoarece ne ajută în determinarea variabila țintă finală . Variabila finală poate fi numită și etichetă. Variabila finală iată Elefant / Leu.



table-word

În acest exemplu, fiecare dintre înregistrările din categorii, dimensiune, culoare, înălțime, mărimea urechii, trunchiul și colțul este o variabilă predictivă, în timp ce Elephant și Lion sunt variabilele țintă. Aceste variabile pot fi tratate ca exemple de formare și, respectiv, seturi de date de formare.

Astfel, Învățarea supravegheată este o modalitate prin care te antrenezi împreună cu etichetele, prin care îi ceri algoritmului să extragă anumite caracteristici din acesta și, pe baza acestuia, ori de câte ori vezi un exemplu nevăzut, algoritmul îl va putea clasifica în clasa potrivită.

Ai o întrebare pentru noi? Menționați-le în secțiunea de comentarii și vă vom răspunde.

tutorial talend etl instrument pdf

Postări asemănatoare: