RAG sur vos documents d'entreprise : le guide simple
Le RAG — retrieval-augmented generation — permet à une IA de répondre à partir de vos documents d'entreprise plutôt que de sa mémoire générale, en citant les passages utilisés. Pas besoin de réentraîner un modèle, pas besoin de confier vos données à l'entraînement de qui que ce soit : vos documents restent un index consulté à chaque question. Ce guide explique le fonctionnement sans jargon, ce que le RAG garantit face aux hallucinations, ce qu'il exige de vos documents, et ce qu'il coûte à l'usage.
Comment ça marche, en quatre étapes
Un système RAG fait deux métiers : documentaliste d'abord, rédacteur ensuite. Le déroulé complet tient en quatre étapes :
- Découpage. Vos documents — procédures, contrats, fiches produit, comptes rendus — sont segmentés en passages de quelques paragraphes, chacun rattaché à sa source.
- Indexation. Chaque passage reçoit une empreinte mathématique qui capture son sens. Deux passages qui parlent de la même chose avec des mots différents ont des empreintes proches.
- Recherche. À chaque question, le système retrouve les passages dont le sens correspond le mieux. « Que faire si un client ne paie pas » retrouve la procédure de recouvrement, même si elle ne contient pas le mot « payer ».
- Génération. Le modèle de langage reçoit la question et les passages trouvés, avec une consigne stricte : répondre uniquement à partir de ces extraits, et les citer.
Le point clé pour un dirigeant : la connaissance vit dans l'index, pas dans le modèle. Mettre à jour le système, c'est remplacer un document et le réindexer — une opération de quelques minutes, pas un projet d'IA.
Réponses sourcées contre hallucinations
Un modèle de langage seul peut « halluciner » : produire une réponse plausible et fausse, avec un aplomb parfait. C'est sa nature — il complète du texte, il ne consulte pas une base de faits. Brancher un RAG ne supprime pas ce risque par magie, mais il le rend gérable, et c'est toute la différence entre un gadget et un outil de travail.
La gestion repose sur deux mécanismes. D'abord la citation systématique : chaque affirmation renvoie au passage du document dont elle provient. L'utilisateur vérifie en un clic, et une réponse non sourcée se repère immédiatement comme suspecte. Ensuite le refus assumé : si la recherche ne trouve rien de pertinent, le système doit répondre « je ne trouve pas cette information dans les documents », plutôt que de combler le vide. Un agent qui ne sait pas dire « je ne sais pas » est mal construit — c'est un critère de recette à exiger noir sur blanc.
Exigez aussi un journal des questions posées. Relire chaque mois les questions restées sans réponse révèle les trous du corpus — et souvent des trous bien réels dans la documentation de l'entreprise, que le RAG ne fait que rendre visibles.
Avec ces deux garde-fous, le RAG atteint une fiabilité suffisante pour du support interne ou de la consultation de procédures. Pour des décisions engageantes — juridiques, médicales, contractuelles — la validation humaine reste la règle, quel que soit le fournisseur.
Vos documents sont le vrai projet
La qualité d'un RAG est plafonnée par celle du corpus. Avant de parler technique, quatre prérequis documentaires font la différence. Des documents à jour : un agent qui cite une grille tarifaire périmée fait des dégâts avec assurance. Des documents non contradictoires : si deux procédures se contredisent, le système citera l'une ou l'autre selon la question — l'arbitrage doit être fait par vous, en amont. Des formats exploitables : du texte, des PDF propres ; les scans de mauvaise qualité et les tableurs à quinze onglets demandent un travail de préparation. Des droits d'accès clairs enfin : si certains documents sont confidentiels, l'agent doit respecter qui a le droit de voir quoi, et cela se conçoit dès le départ.
Dans la pratique, ce nettoyage documentaire représente souvent la moitié de l'effort du projet. C'est une bonne nouvelle déguisée : ce travail profite à l'entreprise même sans IA, et il ne demande aucune compétence technique — seulement quelqu'un qui connaît le métier.
Les coûts d'exploitation, concrètement
Côté construction, un agent RAG sur mesure se situe en 2026 entre 5 000 € et 15 000 € chez un indépendant ou un studio — Épure le propose par exemple en forfait à 9 900 €, réponses sourcées comprises — et nettement plus en agence pour des contextes complexes. Côté exploitation, trois postes, tous modestes à l'échelle d'une PME.
L'indexation d'abord : transformer le corpus en index se paie essentiellement une fois, puis au fil des mises à jour ; pour quelques milliers de pages, le coût se compte en euros. Les appels au modèle ensuite : chaque question consomme quelques centimes selon le modèle choisi et la longueur des réponses ; pour un usage d'équipe, la facture mensuelle reste le plus souvent en dizaines d'euros. L'hébergement enfin : une base de données et une petite application web, soit des coûts d'infrastructure de l'ordre de quelques dizaines d'euros par mois. Le poste réellement structurant n'est pas technique : c'est le temps humain de maintenance du corpus, à budgéter dès le départ.
Par où commencer
Choisissez un domaine où les questions se répètent et où les documents de référence existent : procédures internes, support produit, base contractuelle. Rassemblez le corpus, purgez les versions mortes, désignez un responsable de sa mise à jour. Avec ce socle, le projet technique devient court et chiffrable au forfait — le périmètre exact de ce que couvre un agent livré en 7 jours est détaillé sur la page forfaits.
Prévoyez enfin un pilote court avec un petit groupe d'utilisateurs avant d'ouvrir l'agent à toute l'équipe. Deux semaines d'usage réel valent mieux que toute démonstration : elles montrent les questions effectivement posées, et calibrent la confiance qu'on peut accorder aux réponses.