fbpx

Machine Learning & Data Science with Python – modul 2 – in progress

Intregul curs de Machine Learning & Data Science with Python presupune lucrul avansat cu instrumente si librarii Data Science .

Cursul se bazeaza pe exercitii practice pentru fiecare modul (cu aplicabilitate directa in
domeniul bancar) si se axeaza pe partea practica in construirea propriilor modele.

De asemenea, in cadrul cursului veti invata cum să imbunatatiti modelele dezvoltate prin algoritmii de invatare automată, prin aprofundarea conceptelor de bias ridicat (underfitting), dispersie ridicata (overfitting), validarea comparativa (cross-validation) si modul in care hiperparametrii ar putea imbunatati performanta modelelor (hyper-parameter tuning).

DESFASURARE CURS:

  • Cursul  se desfasoara online, via Teams sau fizic, la sediul Beneficiarului.
  • Cursul  se desfasoara pe parcursul a 24 de ore (3 zile a cate 8 ore sau 4 zile a cate 6 ore).
  • Cursul este in proces de scriere si va fi disponibil incepand cu martie sau aprilie 2024
  • Conditii de participare:  cunoasterea notiunilor din cadrul modulului 1 + o intelegere a conceptelor fundamentale de statistici si probabilitati.

CURS NOU 2024
SESIUNI PROGRAMATE:
• 23, 24, 25, 26 Sep
09:00 - 12:00, pauza 1h, 13:00 - 16:00
F = sesiune in formare

Structura cursului

Definirea Inteligentei Artificiale (IA)
Rolul si Importanta Inteligentei Artificiale in Societate
           Clasificarea Inteligentei Artificiale
Tipuri de Modele de Machine Learning :
          Regresie liniara
          Support Vector Regressor
          Decision Tree Regressor
          Random Forest
          XGBoost
Interpretarea si Explicabilitatea Modelelor de Machine Learning

 

         Stabilirea Obiectivelor si Selectia Setului de Date Potrivit
  Evaluarea Eficientei Modelului Obtinut
  Ciclul de viata al modelului

 

        Introducere in Analiza Exploratorie a Datelor (AED)
        Metode si Instrumente de Vizualizare a Datelor :
          Tipuri de Grafice
          Explorarea Relatiilor si Tendintelor prin Vizualizare
          Statistici Descriptive si Masuratori in AED
          Identificarea si Tratarea Anomaliilor in Date
 Analiza Corelatiilor si Interdependentelor :
          Calcularea Coeficientilor de Corelatie pentru relatii intre variabile
          Interpretarea si Utilizarea Informatiilor despre Corelatii
Exercitii: Intelegere date, descreirea relatiilor dintre date

 

        Definirea Procesarii Datelor si Importanta sa in Știinta Datelor :
          Concepte de Baza si Rolul Cheie al Procesarii Datelor
          Impactul Asupra Calitatii si Fiabilitatii Informatiilor
Curatarea si Preprocesarea Datelor
Redimensionarea si Normalizarea Datelor:
          Ajustarea Valorilor pentru Comparabilitate si Interpretare
          CorectaRolul Scaling-ului in Algoritmi de Machine Learning
Exercitii: curatare, preprocesare si normarizarea datelor

            Crearea de Caracteristici Noi
  Extragerea Informatiilor din Datele Textuale
 Transformarea Datelor Categorice in Caracteristici Numerice :

 – Metode de Codificare si Incorporare a Datelor Categorice

– Optimizarea Transformarii pentru Imbunatatirea Performantei

Exercitii: convertire valori categorice, crearea coloanelor noi

                 Importanta reducerii spatiului dimensional pentru modelare
                Evaluarea Performantei si Interpretarea Rezultatelor
            Metode Univariate si Multivariate pentru Selectie
Exercitii: reducerea dimensionalitaii

Plecand de la date despre client ne dorim sa vedem daca acesta va putea plati imprumutul sau nu. Proiectul urmareste sa ne parcurga prin metodele de procesare de date si sa aplicam diverse modele de clasificare (Regresie Logistica, Random Forest, etc). In final vom selecta vedea ce operatii statistice sa folosim pentru a determina cel mai bun model.

– Tehnici de tratare a valorilor lipsă
– Tratamentul valorilor extreme
– Tratamentul categoriilor rare
– Multiple tehnici pentru tratamentul variabilelor categorice
– Tehnici de procesare și transformare a datelor necesare pentru principalele grupuri de algoritmi de învățare automată

Plecad de la date despre case dorim sa estimam pretul acestora de vanzare, cu o eroare acceptabila. Proiectul urmareste sa ne parcurga prin metodele de procesare de date si sa aplicam diverse modele de regresie(Regresie Liniara, Random Forest, etc). In final vom selecta vedea ce operatii statistice sa folosim pentru a determina cel mai bun model.

Oferta de pret

Prețul cursului include suportul de curs și materialele didactice, prestația trainerului.

3440 Ron + TVA/pers

(codul de voucher nu este obligatoriu, se aplica doar in anumite cazuri)