Débutant
🧠 Fondamentaux
10 XP
0 personnes ont réussi
Créer un exemple d'entraînement
Quand tu veux fine-tuner un modèle comme GPT-4o-mini pour qu'il réponde d'une façon précise (ton style, tes règles, ton domaine), tu dois lui montrer des exemples de conversations idéales. Chaque exemple, c'est une conversation complète avec trois rôles : system (les instructions générales), user (la question de l'utilisateur) et assistant (la réponse que tu veux que le modèle apprenne à reproduire).
Le format attendu par OpenAI, c'est un dictionnaire avec une clé "messages" qui contient une liste de messages. Chaque message est un dictionnaire avec deux clés : "role" (qui parle) et "content" (ce qu'il dit).
Voici à quoi ressemble un exemple complet :
{ "messages": [ {"role": "system", "content": "Tu es un expert Python."}, {"role": "user", "content": "C'est quoi une liste ?"}, {"role": "assistant", "content": "Une liste est une collection ordonnée."} ] }
Écris une fonction creer_exemple(system, user, assistant) qui prend trois chaînes de caractères et renvoie le dictionnaire au bon format.
Exemple :
creer_exemple("Tu es un chef.", "Comment cuire des pâtes ?", "Fais bouillir l'eau.") renvoie {"messages": [{"role": "system", "content": "Tu es un chef."}, {"role": "user", "content": "Comment cuire des pâtes ?"}, {"role": "assistant", "content": "Fais bouillir l'eau."}]}
Tests (4/5)
Format de base
r = creer_exemple('Tu es un assistant.', 'Bonjour', 'Salut !')
assert r == {'messages': [{'role': 'system', 'content': 'Tu es un assistant.'}, {'role': 'user', 'content': 'Bonjour'}, {'role': 'assistant', 'content': 'Salut !'}]}
Vérifie la clé messages
r = creer_exemple('sys', 'usr', 'ast')
assert 'messages' in r, 'Le dictionnaire doit avoir une clé messages'
Vérifie trois messages
r = creer_exemple('a', 'b', 'c')
assert len(r['messages']) == 3, 'Il doit y avoir exactement 3 messages'
Vérifie les rôles
r = creer_exemple('x', 'y', 'z')
roles = [m['role'] for m in r['messages']]
assert roles == ['system', 'user', 'assistant'], 'Les rôles doivent être system, user, assistant dans cet ordre'