Exercices Python & IA

Débutant 🧠 Fondamentaux Machine Learning GRATUIT

Explorer un DataFrame pandas

En data science, la premiere chose que tu fais avec un nouveau dataset c'est l'explorer. Combien de lignes ? Quelles colonnes ? Quels types de …

10 XP 0 réussites

Résoudre →

pandas dataframe exploration

Débutant 🧠 Fondamentaux Machine Learning GRATUIT

Detecter les valeurs manquantes

Tu recois un dataset du service marketing et surprise : il est plein de trous. Un client qui n'a pas renseigne son email, un capteur …

10 XP 0 réussites

Résoudre →

pandas nan valeurs-manquantes

Débutant 🧠 Fondamentaux Machine Learning GRATUIT

Remplir les valeurs manquantes

Tu as repere les trous dans tes donnees, maintenant il faut les boucher. Impossible de les laisser : la plupart des algorithmes de ML plantent …

10 XP 0 réussites

Résoudre →

pandas fillna imputation

Débutant 🧠 Fondamentaux Machine Learning

Detecter et supprimer les doublons

Quand tu fusionnes plusieurs fichiers CSV ou que tu recois des donnees d'un formulaire bugge, tu te retrouves souvent avec des lignes en double. Un …

10 XP 0 réussites

Résoudre →

pandas doublons nettoyage

Débutant 🧠 Fondamentaux Machine Learning

Separer features numeriques et catégorielles

Avant d'entrainer un modele, tu dois savoir ce que tu as sous les yeux. L'age et le salaire sont des nombres, la ville et la …

10 XP 0 réussites

Résoudre →

pandas features types

Débutant 🧠 Fondamentaux Machine Learning

LabelEncoder : encoder les catégories

Un algorithme de ML ne sait pas ce que veut dire 'rouge' ou 'bleu'. Il ne comprend que les nombres. Si tu as une colonne …

10 XP 0 réussites

Résoudre →

sklearn labelencoder encoding

Débutant 🧠 Fondamentaux Machine Learning

OneHotEncoding avec get_dummies

Le LabelEncoder a un probleme : il cree un ordre artificiel. Si 'bleu' vaut 0 et 'vert' vaut 2, le modele pourrait croire que 'vert' …

10 XP 0 réussites

Résoudre →

pandas one-hot encoding

Intermédiaire 🧠 Fondamentaux Machine Learning

StandardScaler : normaliser les features

Tu as deux features : l'age (entre 18 et 80) et le salaire (entre 20000 et 200000). Sans normalisation, des algorithmes comme KNN ou SVM …

20 XP 0 réussites

Résoudre →

sklearn standardscaler normalisation

Intermédiaire 🧠 Fondamentaux Machine Learning

MinMaxScaler : mettre entre 0 et 1

Le StandardScaler centre les donnees autour de 0, mais parfois tu preferes que tout soit entre 0 et 1. C'est ce que fait le MinMaxScaler, …

20 XP 0 réussites

Résoudre →

sklearn minmaxscaler normalisation

Intermédiaire 🧠 Fondamentaux Machine Learning

Train/test split stratifie

C'est LA regle d'or du machine learning : ne jamais evaluer un modele sur les donnees qui ont servi a l'entrainer. Sinon, c'est comme reviser …

20 XP 0 réussites

Résoudre →

sklearn train-test-split validation

Intermédiaire 🧠 Fondamentaux Machine Learning

LogisticRegression : premier classificateur

C'est le moment d'entrainer ton premier modele de ML. La regression logistique est le choix classique pour commencer : rapide, interpretable, et souvent un bon …

20 XP 0 réussites

Résoudre →

sklearn logistic-regression classification

Intermédiaire 🧠 Fondamentaux Machine Learning

Accuracy et classification report

Ton modele est entraine, il fait des predictions. Mais sont-elles bonnes ? L'accuracy est la metrique la plus intuitive : le pourcentage de bonnes reponses. …

20 XP 0 réussites

Résoudre →

sklearn accuracy classification-report

Intermédiaire 🧠 Fondamentaux Machine Learning

Matrice de confusion

L'accuracy te dit 'tu as 90% de bonnes reponses', mais elle ne te dit pas OU tu te trompes. La matrice de confusion, si. Elle …

20 XP 0 réussites

Résoudre →

sklearn confusion-matrix metriques

Intermédiaire 🧠 Fondamentaux Machine Learning

Cross-validation avec cross_val_score

Tu entraines ton modele, tu obtiens 92% d'accuracy. Tu changes le random_state, tu obtiens 85%. Le probleme avec un seul split train/test, c'est que le …

20 XP 0 réussites

Résoudre →

sklearn cross-validation évaluation

Intermédiaire 🧠 Fondamentaux Machine Learning

LinearRegression : predire une valeur continue

Predire le prix d'un appartement en fonction de sa surface, de son etage et de son quartier. Estimer le salaire d'un candidat selon son experience. …

20 XP 0 réussites

Résoudre →

sklearn regression-lineaire regression

Intermédiaire 🧠 Fondamentaux Machine Learning

Metriques de regression : MAE, MSE, RMSE, R2

Tu predis que l'appartement vaut 250 000 euros, il en vaut 280 000. C'est grave ? Ca depend de la metrique. En regression, tu ne …

20 XP 0 réussites

Résoudre →

sklearn mae mse

Intermédiaire 🧠 Fondamentaux Machine Learning

DecisionTreeClassifier

L'arbre de decision est le modele le plus intuitif qui existe. Pense a un jeu de 20 questions : le modele pose une serie de …

20 XP 0 réussites

Résoudre →

sklearn decision-tree classification

Intermédiaire 🧠 Fondamentaux Machine Learning

RandomForest et importance des features

Le Random Forest est souvent le premier modele qu'on teste sur des donnees tabulaires, et pour cause : il marche tres bien out-of-the-box. L'idee est …

20 XP 0 réussites

Résoudre →

sklearn random-forest importance

Avancé 🧠 Fondamentaux Machine Learning

GradientBoosting : le modèle qui gagne les competitions

Si tu regardes les solutions gagnantes sur Kaggle pour les donnees tabulaires, tu verras presque toujours du Gradient Boosting. XGBoost, LightGBM, CatBoost : ces noms …

30 XP 0 réussites

Résoudre →

sklearn gradient-boosting ensemble

Avancé 🧠 Fondamentaux Machine Learning

Pipeline sklearn : tout enchainer

Tu normalises tes donnees, tu selectionnes les features, tu entraines le modele, et a chaque etape tu risques d'introduire un bug subtil : appliquer le …

30 XP 0 réussites

Résoudre →

sklearn pipeline preprocessing

Avancé 🧠 Fondamentaux Machine Learning