Exercices Python & IA

Distillation simulée

La distillation, c'est une technique où un gros modèle (le "professeur") génère des réponses de haute qualité, et un petit modèle (l'"élève") apprend à les …

30 XP 0 réussites

Résoudre →

fine-tuning distillation professeur

Avancé 🧠 Fondamentaux Entraîner son LLM

Créer un dataset de préférences (DPO)

Le DPO (Direct Preference Optimization) est une alternative au RLHF pour aligner un modèle sur les préférences humaines. Au lieu de former un modèle de …

30 XP 0 réussites

Résoudre →

fine-tuning dpo préférences

Avancé 🧠 Fondamentaux Entraîner son LLM

Pipeline complet de préparation fine-tuning

Tu es développeur IA dans une startup edtech. Ton boss te demande de fine-tuner GPT-4o-mini pour qu'il réponde aux questions des élèves sur Python, dans …

30 XP 0 réussites

Résoudre →

fine-tuning pipeline projet

Avancé 🧠 Fondamentaux Entraîner son LLM

Évaluer un embedding fine-tuné

Quand tu fine-tunes un modèle d'embedding (comme text-embedding-3-small d'OpenAI), tu veux vérifier qu'il retrouve mieux les documents pertinents qu'avant. Pour ça, on utilise deux métriques …

30 XP 0 réussites

Résoudre →

fine-tuning embedding evaluation

Avancé 🧠 Fondamentaux Entraîner son LLM

Analyser les hyperparamètres de fine-tuning

Quand tu lances un fine-tuning, tu ne choisis pas seulement tes données. Tu choisis aussi des hyperparamètres qui contrôlent comment le modèle apprend. Les trois …

30 XP 0 réussites

Résoudre →

fine-tuning hyperparamètres overfitting

Exercices de Code

Suivre un parcours

Distillation simulée

Créer un dataset de préférences (DPO)

Pipeline complet de préparation fine-tuning

Évaluer un embedding fine-tuné

Analyser les hyperparamètres de fine-tuning