Exercices de Code

Débutant 🧠 Fondamentaux Entraîner son LLM GRATUIT

fine-tuning openai jsonl

Convertir des données brutes en JSONL

En pratique, tes données d'entraînement ne tombent jamais du ciel au bon format. Tu les récupères depuis un fichier CSV, une base de données, un …

10 XP 0 réussites

Intermédiaire 🧠 Fondamentaux Entraîner son LLM GRATUIT

fine-tuning jsonl csv

Auditer la qualité d'un dataset

Avant d'envoyer ton dataset à OpenAI, tu ne vérifies pas juste le format. Tu vérifies la qualité. Un dataset qui passe la validation de format …

fine-tuning validation qualité

Débutant 🧠 Fondamentaux Entraîner son LLM GRATUIT

Nettoyer les données d'entraînement

Dans un vrai projet de fine-tuning, tes données brutes ne sont jamais propres. Tu récupères des conversations depuis un export Slack, un CRM ou un …

10 XP 0 réussites

fine-tuning nettoyage dataset

Calculer le coût du fine-tuning

Le fine-tuning n'est pas gratuit. Chaque token que le modèle traite pendant l'entraînement te coûte de l'argent. Avant de lancer un job, il faut estimer …

fine-tuning coût tokens

Splitter train et validation

En machine learning, tu n'entraînes jamais un modèle sur 100% de tes données. Tu en gardes une partie de côté (le set de validation) pour …

fine-tuning split train

Augmenter les données d'entraînement

Quand ton dataset de fine-tuning est trop petit (moins de 100 exemples), le modèle risque de sur-apprendre. Une technique classique c'est l'augmentation de données : …

fine-tuning augmentation données

Évaluer avant et après fine-tuning

Fine-tuner un modèle sans l'évaluer, c'est comme cuisiner sans goûter. Comment tu sais si c'est mieux qu'avant ? Il faut comparer les réponses du modèle …

fine-tuning évaluation similarité

Distillation simulée

La distillation, c'est une technique où un gros modèle (le "professeur") génère des réponses de haute qualité, et un petit modèle (l'"élève") apprend à les …

fine-tuning distillation professeur

Créer un dataset de préférences (DPO)

Le DPO (Direct Preference Optimization) est une alternative au RLHF pour aligner un modèle sur les préférences humaines. Au lieu de former un modèle de …

fine-tuning dpo préférences

Pipeline complet de préparation fine-tuning

Tu es développeur IA dans une startup edtech. Ton boss te demande de fine-tuner GPT-4o-mini pour qu'il réponde aux questions des élèves sur Python, dans …

fine-tuning pipeline projet

Compter les tokens d'un dataset avec tiktoken

Quand tu estimes le coût du fine-tuning en divisant le nombre de caractères par 4, tu obtiens une approximation. Parfois ça suffit pour une estimation …

fine-tuning tiktoken tokens

Calculer le ROI du fine-tuning

Le fine-tuning coûte de l'argent à deux moments : l'entraînement (une seule fois) et l'inférence (à chaque requête). La question que ton manager va te …

fine-tuning roi coût

Évaluer un embedding fine-tuné

Quand tu fine-tunes un modèle d'embedding (comme text-embedding-3-small d'OpenAI), tu veux vérifier qu'il retrouve mieux les documents pertinents qu'avant. Pour ça, on utilise deux métriques …

fine-tuning embedding evaluation

Analyser les hyperparamètres de fine-tuning

Quand tu lances un fine-tuning, tu ne choisis pas seulement tes données. Tu choisis aussi des hyperparamètres qui contrôlent comment le modèle apprend. Les trois …