Débutant
🧠 Fondamentaux
10 XP
0 personnes ont réussi
Separer features numeriques et catégorielles
Avant d'entrainer un modele, tu dois savoir ce que tu as sous les yeux. L'age et le salaire sont des nombres, la ville et la profession sont des categories. Cette distinction est fondamentale car les algorithmes de ML ne traitent pas ces deux types de la meme facon.
Les features numeriques peuvent etre utilisees directement. Les features catégorielles doivent etre encodees en nombres (on verra comment dans les prochains exercices).
Pandas te permet de les séparer facilement : df.select_dtypes(include='number') garde les colonnes numeriques df.select_dtypes(exclude='number') garde les colonnes non numeriques
Écris une fonction séparer_features(df) qui renvoie un dictionnaire avec : 'numeriques' : la liste des noms de colonnes numeriques 'catégorielles' : la liste des noms de colonnes non numeriques