Veille IA Veille IA sans buzz : pour stratèges québécois.
La veille

Reranking (reclassement)

Reranking (reclassement)

Reranking (reclassement)

Terme Intermédiaire 📊 Données et traitement

Mis à jour le

Le reranking est la deuxième étape d'un RAG qui réordonne les documents récupérés avec un modèle plus précis (cross-encoder), pour ne garder que les plus pertinents avant la génération.

📖 Définition

Le reranking (reclassement) est une deuxième étape d'un pipeline RAG, qui réordonne par pertinence les documents déjà récupérés avant de les transmettre au modèle de langage. Le principe : une première recherche large et rapide (par similarité d'embeddings ou BM25) renvoie un grand ensemble de candidats — par exemple les 50 passages les plus proches. Mais cette recherche initiale, rapide, ramène souvent des passages thématiquement proches qui ne répondent pas précisément à la question. Le reranker corrige ce défaut : un modèle plus précis, typiquement un cross-encoder, relit chaque paire « requête + passage », attribue un nouveau score de pertinence et réordonne les candidats, pour ne garder que les meilleurs (top 3 à 10). Ces passages, mieux alignés sur la question, sont ensuite injectés dans le prompt du LLM. L'ajout d'un reranker augmente nettement la précision de la récupération et réduit les hallucinations, puisque le modèle s'appuie sur un sous-ensemble plus pertinent. C'est une brique souvent négligée mais à fort impact : on parle d'une architecture « en deux étages » (recherche large → reranking → génération).

💬 En termes simples

C'est comme un jury en deux tours : un premier filtre rapide retient 50 candidats, puis un examinateur expert relit chacun en détail face à la question précise et ne garde que les 3 meilleurs pour la finale.

🎯 Exemple concret

À la question « Quel est le délai de rétractation pour un achat en ligne au Québec ? », la recherche vectorielle ramène 50 passages sur le commerce électronique ; le reranker relit chacun et fait remonter en tête les 3 qui mentionnent précisément le délai, qui seront seuls fournis au modèle.

💡 Le saviez-vous ?

Le cross-encoder d'un reranker est plus précis mais plus lent que la recherche vectorielle : c'est pourquoi on ne l'applique qu'à une cinquantaine de candidats déjà filtrés, et non à toute la base — un bon compromis vitesse/précision.

❓ Questions fréquentes

Pourquoi ajouter un reranker à un RAG ?
Parce que la recherche vectorielle seule ramène souvent des passages proches du sujet mais imprécis ; le reranker les réordonne finement par pertinence, ce qui augmente la précision et réduit les hallucinations.
Qu'est-ce qu'un cross-encoder ?
Un modèle qui évalue ensemble la requête ET un passage pour leur attribuer un score de pertinence très précis ; plus lent que la recherche par embeddings, on l'utilise sur un petit nombre de candidats.
🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !