Care sunt condițiile prealabile pentru învățarea automată?



Acest blog despre condițiile prealabile pentru învățarea automată vă va ajuta să înțelegeți conceptele de bază pe care trebuie să le cunoașteți înainte de a începe cu învățarea automată.

Învățarea automată este, fără îndoială, cea mai solicitată tehnologie din epocă! Dacă sunteți un începător care începe cu învățarea automată, este important să cunoașteți condițiile prealabile pentru învățarea automată. Acest blog vă va ajuta să înțelegeți diferitele concepte pe care trebuie să le cunoașteți înainte de a începe cu Machine Learning.

Pentru a obține cunoștințe aprofundate despre inteligența artificială și învățarea automată, vă puteți înscrie pentru live de Edureka cu suport 24/7 și acces pe viață.





Iată o listă de subiecte acoperit în acest blog:

  1. Cerințe preliminare pentru învățarea automată
  2. Înțelegerea învățării automate cu un caz de utilizare

Condiții preliminare pentru învățarea automată

Pentru a începe cuÎnvățarea automată trebuie să fie familiarizați cu următoarele concepte:



dimensiunea unui javascript matrice
  1. Statistici
  2. Algebră liniară
  3. Calcul
  4. Probabilitate
  5. Limbaje de programare

Statistici

Statisticile conțin instrumente care pot fi utilizate pentru a obține unele rezultate din date. Există statistici descriptive care sunt folosite pentru a transforma datele brute în unele informații importante. De asemenea, statisticile inferențiale pot fi folosite pentru a obține informații importante dintr-un eșantion de date în loc să utilizeze setul de date complet.

Pentru a afla mai multe despre Statistici puteți accesa următoarele bloguri:

Algebră liniară

Oferte de algebră liniarăcu vectori, matrici și transformări liniare. Este foarte important în învățarea automată, deoarece poate fi folosit pentru a transforma și a efectua operațiuni asupra setului de date.



Calcul

Calculul este un domeniu important în matematică și joacă un rol integral în mulți algoritmi de învățare automată. Setul de date cu mai multe funcții esteutilizate pentru a construi modele de învățare automată, deoarece caracteristicile sunt multiple calcul multivariabil joacă un rol important în construirea unui model de învățare automată. Integrările și diferențierile sunt o necesitate.

Probabilitate

Probabilitatea ajută la prezicerea probabilității apariției, ne ajută să argumentăm situația care se poate întâmpla sau nu din nou. Pentru învățarea automată, probabilitatea este o fundație.

Mathematics

Pentru a afla mai multe despre probabilitate, puteți parcurge acest lucru Blog.

Limbaj de programare

Este esențial să cunoașteți limbaje de programare precum R și Python pentru a implementa întregul proces de învățare automată. Python și R oferă ambele biblioteci încorporate care facilitează implementarea algoritmilor de învățare automată.

În afară de a avea cunoștințe de bază de programare, este de asemenea important să știți cum să extrageți, să prelucrați și să analizați datele. Aceasta este una dintre cele mai importante abilități necesare pentru învățarea automată.

Pentru a afla mai multe despre programare limbi pentru învățarea automată, puteți accesa următoarele bloguri:

  1. Cele mai bune biblioteci Python pentru știința datelor și învățarea automată

Caz de utilizare pentru învățarea automată

Învățarea automată se referă la crearea unui algoritm care poate învăța din date pentru a face o predicție, cum ar fi ce fel de obiecte există în imagine sau motorul de recomandare, cea mai bună combinație de medicamente pentru a vindeca anumite boli sau filtrarea spamului.

Învățarea automată se bazează pe premisele matematice și, dacă știți de ce este folosită matematica în învățarea automată, o va face distractivă. Trebuie să cunoașteți matematica din spatele funcțiilor pe care le veți utiliza și ce model este potrivit pentru date și de ce.

Așadar, să începem cu o problemă interesantă de a prezice prețurile locuințelor, având un set de date care conține un istoric al diferitelor caracteristici și prețuri, pentru moment, vom lua în considerare suprafața spațiului de locuit în metri pătrați și prețurile.

Acum avem un set de date care conține două coloane așa cum se arată mai jos:

Trebuie să existe o anumită corelație între aceste două variabile pentru a afla că va trebui să construim un model care să prezică prețul caselor, cum o putem face?

ce se adaugă în java

Să graficăm aceste date și să vedem cum arată:

Aici axa X este prețul pe mp de spațiu de locuit, iar axa Y este prețul casei. Dacă graficăm toate punctele de date, vom obține un grafic de împrăștiere care poate fi reprezentat printr-o linie așa cum se arată în figura de mai sus și dacă introducem unele date, atunci va prezice un rezultat. În mod ideal, trebuie să găsim o linie care să intersecteze punctele maxime de date.

Aici încercăm să creăm o linie care se numește:

Y = mX + c

Această metodă de predicție a relației liniare dintre țintă (variabila dependentă) și variabila predictor (variabilă independentă) este denumită regresie liniară. Ne permite să studiem și să rezumăm o relație între două variabile.

  • X = Variabilă independentă
  • Y = Variabilă dependentă
  • c = interceptarea y
  • m = Panta liniei

Dacă luăm în considerare ecuația, avem valori pentru X care este o variabilă independentă, deci tot ce trebuie să facem este să calculăm valorile pentru m și c pentru a prezice valoarea lui Y.

Deci, cum găsim aceste variabile?

Pentru a găsi aceste variabile, putem încerca o grămadă de valori și putem încerca să aflăm o linie care intersectează numărul maxim de puncte de date. Dar, cum putem găsi cea mai potrivită linie?

Deci, pentru a găsi linia cea mai potrivită, putem folosi funcția de eroare a celor mai mici pătrate care va găsi eroarea dintre valoarea reală a lui y și valoarea prezisă y`.

Funcția de eroare a celor mai mici pătrate poate fi reprezentată folosind următoarea ecuație:

funcția split în exemplul java

Folosind această funcție putem afla eroarea pentru fiecare punct de date prezis comparându-l cu valoarea reală a punctului de date. Apoi luați însumarea tuturor acestor erori și le pătrate pentru a afla abaterea din predicție.

Dacă adăugăm a treia axă la graficul nostru care conține toate valorile posibile de eroare și o trasăm în spațiu tridimensional, va arăta astfel:

În imaginea de mai sus, valorile ideale ar fi în partea de jos neagră, care va prezice prețurile aproape de punctul de date real. Următorul pas este de a găsi cele mai bune valori posibile pentru m și c. Acest lucru se poate face folosind tehnica de optimizare numită coborâre în gradient.

Coborârea în gradient este o metodă iterativă, în care începem cu inițializarea unor seturi de valori pentru variabilele noastre și le îmbunătățim încet minimizând eroarea dintre valoarea reală și valoarea prezisă.

Acum, dacă ne gândim că practic prețurile apartamentului nu depind într-adevăr doar de prețul pe metru pătrat, există mulți factori, cum ar fi numărul de dormitoare, băi etc. Dacă luăm în considerare și aceste caracteristici, atunci ecuația va arăta ceva asa

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Aceasta este o regresie multiliniară care aparține algebrei liniare, aici putem folosi matrici de mărime mxn unde m sunt caracteristici și n sunt puncte de date.

Să luăm în considerare o altă situație în care putem folosi probabilitatea pentru a găsi starea casei pentru a clasifica o casă în funcție de starea ei bună sau starea proastă. Pentru aceasta, pentru a lucra va trebui să folosim o tehnică numită Regresie Logistică care funcționează pe probabilitatea aparițiilor reprezentate de o funcție sigmoidă.

În acest articol, am acoperit condițiile prealabile ale învățării automate și modul în care acestea sunt aplicate în învățarea automată. Deci, practic, constă din statistici, calcul, algebră liniară și teoria probabilităților. Calculul are tehnici utilizate pentru optimizare, algebra liniară are algoritmi care pot funcționa pe seturi de date uriașe, cu probabilitatea că putem prezice probabilitatea aparițiilor și statisticile ne ajută să deducem informații utile din eșantionul de seturi de date.

Acum, că știți condițiile prealabile pentru învățarea automată, sunt sigur că sunteți curios să aflați mai multe. Iată câteva bloguri care vă vor ajuta să începeți cu Data Science:

Dacă doriți să vă înscrieți la un curs complet de inteligență artificială și învățare automată, Edureka are un curs special care vă va face să faceți cunoștințe în tehnici precum învățarea supravegheată, învățarea nesupravegheată și procesarea limbajului natural. Acesta include instruire cu privire la cele mai noi progrese și abordări tehnice în inteligența artificială și învățarea automată, cum ar fi învățarea profundă, modelele grafice și învățarea prin întărire.