Exercices IA & Data Science Créer un Document LangChain
🎉

Bravo!

Débutant 🧠 Fondamentaux 10 XP 0 personnes ont réussi

Créer un Document LangChain

Dans le monde du RAG (Retrieval-Augmented Generation), on manipule des documents. LangChain fournit une classe Document qui représente un morceau de texte avec ses metadonnées.

Un Document a deux attributs principaux :
- page_content : le texte du document (une chaine de caracteres)
- metadata : un dictionnaire avec des infos supplémentaires (source, auteur, date...)

Pour créer un Document :
from langchain_core.documents import Document
doc = Document(page_content='Mon texte', metadata={'source': 'fichier.txt'})

Écris une fonction create_document(text, source) qui crée et renvoie un Document LangChain avec le texte comme page_content et un dictionnaire metadata contenant la clé 'source' avec la valeur source passee en paramètre.

Exemple :
doc = create_document('Bonjour', 'test.txt')
doc.page_content vaut 'Bonjour'
doc.metadata vaut {'source': 'test.txt'}

Tests (1/1)

Tests
from langchain_core.documents import Document
doc = create_document('Bonjour le monde', 'test.txt')
assert isinstance(doc, Document), 'Le résultat doit etre un Document LangChain'
assert doc.page_content == 'Bonjour le monde', f'page_content incorrect: {doc.page_content}'
assert doc.metadata == {'source': 'test.txt'}, f'metadata incorrect: {doc.metadata}'
doc2 = create_document('', 'vide.txt')
assert doc2.page_content == '', 'Un document vide doit avoir page_content vide'
assert doc2.metadata['source'] == 'vide.txt', 'La source doit etre preservee meme pour un doc vide'

Indices (3 disponibles)

solution.py