
Machine Learning & Data Science with Python – modul 2
Intregul curs de Machine Learning & Data Science with Python presupune lucrul avansat cu instrumente si librarii Data Science . Cursul se bazeaza pe exercitii practice pentru fiecare capitol (cu aplicabilitate directa in domeniul bancar).
De asemenea, in cadrul cursului veti invata cum să imbunatatiti modelele dezvoltate prin algoritmii de invatare automată, prin aprofundarea conceptelor de bias ridicat (underfitting), dispersie ridicata (overfitting), validarea comparativa (cross-validation) si modul in care hiperparametrii ar putea imbunatati performanta modelelor (hyper-parameter tuning).
DESFASURARE CURS:
- Cursul se desfasoara online, via Teams sau fizic, la sediul Beneficiarului – 24 de ore
- Conditii de participare: cunoasterea notiunilor din cadrul modulului 1 + o intelegere a conceptelor fundamentale de statistici si probabilitati.
Structura cursului
Definirea Inteligentei Artificiale (IA)
Rolul si Importanta Inteligentei Artificiale in Societate
Clasificarea Inteligentei Artificiale
Tipuri de Modele de Machine Learning :
– Regresie liniara
– Support Vector Regressor
– Decision Tree Regressor
– Random Forest
– XGBoost
Interpretarea si Explicabilitatea Modelelor de Machine Learning
Stabilirea Obiectivelor si Selectia Setului de Date Potrivit
Evaluarea Eficientei Modelului Obtinut
Ciclul de viata al modelului
Introducere in Analiza Exploratorie a Datelor (AED)
Metode si Instrumente de Vizualizare a Datelor :
– Tipuri de Grafice
– Explorarea Relatiilor si Tendintelor prin Vizualizare
– Statistici Descriptive si Masuratori in AED
– Identificarea si Tratarea Anomaliilor in Date
Analiza Corelatiilor si Interdependentelor :
– Calcularea Coeficientilor de Corelatie pentru relatii intre variabile
– Interpretarea si Utilizarea Informatiilor despre Corelatii
Definirea Procesarii Datelor si Importanta sa in Știinta Datelor :
– Concepte de Baza si Rolul Cheie al Procesarii Datelor
– Impactul Asupra Calitatii si Fiabilitatii Informatiilor
Curatarea si Preprocesarea Datelor
Redimensionarea si Normalizarea Datelor:
– Ajustarea Valorilor pentru Comparabilitate si Interpretare
– CorectaRolul Scaling-ului in Algoritmi de Machine Learning
Crearea de Caracteristici Noi
Extragerea Informatiilor din Datele Textuale
Transformarea Datelor Categorice in Caracteristici Numerice :
– Metode de Codificare si Incorporare a Datelor Categorice
– Optimizarea Transformarii pentru Imbunatatirea Performantei
Exercitii: convertire valori categorice, crearea coloanelor noi
Importanta reducerii spatiului dimensional pentru modelare
Evaluarea Performantei si Interpretarea Rezultatelor
Metode Univariate si Multivariate pentru Selectie
Plecand de la date despre client ne dorim sa vedem daca acesta va putea plati imprumutul sau nu. Proiectul urmareste sa ne parcurga prin metodele de procesare de date si sa aplicam diverse modele de clasificare (Regresie Logistica, Random Forest, etc). In final vom selecta vedea ce operatii statistice sa folosim pentru a determina cel mai bun model.
– Tehnici de tratare a valorilor lipsă
– Tratamentul valorilor extreme
– Tratamentul categoriilor rare
– Multiple tehnici pentru tratamentul variabilelor categorice
– Tehnici de procesare și transformare a datelor necesare pentru principalele grupuri de algoritmi de învățare automată
Plecad de la date despre case dorim sa estimam pretul acestora de vanzare, cu o eroare acceptabila. Proiectul urmareste sa ne parcurga prin metodele de procesare de date si sa aplicam diverse modele de regresie(Regresie Liniara, Random Forest, etc). In final vom selecta vedea ce operatii statistice sa folosim pentru a determina cel mai bun model.
Oferta de pret
Prețul cursului include suportul de curs și materialele didactice, prestația trainerului.
Pret: € 740 + TVA/pers;
Discount: 10% pentru PF incepand cu al doilea curs.