Exercices de Code

Débutant 🧠 Fondamentaux IA & Data Science

rag langchain document

Decouper un texte avec LangChain

Un des problèmes fondamentaux du RAG, c'est que les textes sont souvent trop longs pour etre traites d'un seul bloc. Il faut les decouper en …

10 XP 0 réussites

rag langchain chunking

Decouper des Documents avec metadonnées

Quand on decoupe un texte en chunks, on veut garder la trace de l'origine de chaque morceau. RécursiveCharacterTextSplitter a une méthode split_documents qui prend une …

rag langchain chunking

Vectoriser des textes avec TF-IDF

Pour comparer des textes entre eux, il faut les transformer en nombres. TF-IDF (Term Frequency - Inverse Document Frequency) est une méthode classique qui donne …

rag tfidf sklearn

Similarite cosinus entre deux textes

Une fois les textes transformes en vecteurs, on peut mesurer leur ressemblance. La similarite cosinus mesure l'angle entre deux vecteurs : si deux textes parlent …

rag similarite cosinus

Rechercher le document le plus pertinent

Le coeur du RAG, c'est la recherche : etant donne une question, trouver le document le plus pertinent dans une base. On va combiner TF-IDF …

rag recherche tfidf

Top-K recherche de documents

En RAG, on ne veut pas juste le meilleur document, on veut souvent les K meilleurs. Ca permet de donner plus de contexte au modèle …

rag recherche top-k

Index FAISS pour la recherche rapide

Quand on a des milliers de documents, calculer la similarite avec chacun devient lent. FAISS (Facebook AI Similarity Search) est une librairie optimisee pour la …

rag faiss index

Combiner TF-IDF et FAISS

Maintenant on va assembler les briques : TF-IDF pour créer les vecteurs et FAISS pour les stocker et faire la recherche rapide. C'est un vrai …

rag faiss tfidf

Pipeline de chunking avec Documents LangChain

En RAG, le pipeline classique c'est : charger les documents, les decouper en chunks, les vectoriser, puis les indexer. On va assembler les étapes de …

rag pipeline chunking

Filtrer les résultats par metadonnées

En RAG, on ne veut pas toujours chercher dans tous les documents. Parfois on veut filtrer par source, par date, par catégorie. C'est le concept …

rag recherche filtrage

Pipeline RAG avec FAISS et évaluation

Pour finir, on va construire un pipeline RAG de niveau production qui combine tout ce qu'on a appris : Documents LangChain, text splitting, TF-IDF, FAISS …

Débutant 🧠 Fondamentaux IA & Data Science

rag pipeline faiss

Créer des Documents LangChain

Dans LangChain, toute donnée textuelle est représentee par un objet Document. C'est la brique de base de tout pipeline RAG. Un Document contient deux choses …

15 XP 0 réussites

langchain document rag

Recherche BM25

BM25 est un algorithme de recherche textuelle classique, utilise par les moteurs de recherche bien avant l'arrivee des embeddings. Il fonctionne par correspondance de mots-cles …

25 XP 0 réussites

bm25 recherche rag

Similarite cosinus avec numpy

La similarite cosinus est LA metrique de base pour comparer des vecteurs dans un système RAG. Elle mesure l'angle entre deux vecteurs, independamment de leur …

25 XP 0 réussites

cosinus numpy vectoriel

Premier graphe LangGraph

LangGraph est la librairie de LangChain pour construire des agents et des workflows complexes sous forme de graphes. Au lieu d'enchainer des appels de fonctions …

langgraph graphe pipeline

Routage conditionnel LangGraph

La vraie puissance de LangGraph, c'est les transitions conditionnelles. Au lieu d'un pipeline lineaire, tu peux diriger le flux vers differents noeuds selon le contenu …

langgraph routing conditionnel

Knowledge Graph avec NetworkX

Un Knowledge Graph (graphe de connaissances) représente des informations sous forme de triplets : (sujet, relation, objet). Par exemple : (Python, est_un, langage), (Django, utilise, …

networkx knowledge-graph rag

Pipeline RAG avec FAISS

On va maintenant combiner ce qu'on a appris pour construire un mini pipeline RAG complet avec FAISS. Pas d'appel API ici : on va utiliser …

40 XP 0 réussites

rag faiss pipeline

Agent LangGraph avec historique

Dans un vrai agent, on veut souvent accumuler des informations au fil des étapes : un historique de messages, une liste de documents trouves, des …

40 XP 0 réussites

langgraph agent annotated

Evaluer un retriever RAG

Construire un système RAG c'est bien, mais comment savoir s'il marche correctement ? Il faut l'evaluer avec des metriques. Les deux metriques de base sont …

40 XP 0 réussites

évaluation rag metriques