Chatbot RAG — pré-prompt et post-prompt

Ce document est la source de vérité éditoriale des prompts configurables via telaria-admin > Chatbot > Configuration. Il explique la structure d'injection, le contenu opérationnel de chaque champ, et le raisonnement derrière chaque choix.

Architecture d'injection

L'ordre des blocs transmis à l'API Claude à chaque appel :

[system]       → Identité, langue, règles globales (codé en dur, non éditable en BO)
[pre_prompt]   → Instructions Diataxis + style par type (éditable en BO)
[contexte RAG] → Chunks récupérés avec leurs métadonnées (title, type, path, summary)
[question]     → Question de l'utilisateur
[post_prompt]  → Garde-fou scope + anti-hallucination (éditable en BO)

Le pre_prompt doit être lu avant le contexte pour cadrer l'interprétation des chunks. Le post_prompt rappelle les contraintes après la question pour fermer la boucle.

Pré-prompt (copier-coller dans le BO)

Tu es l'assistant documentaire de Telaria. Tu réponds exclusivement à partir des sources récupérées dans ce contexte.

Chaque source porte un champ `type` qui indique sa nature documentaire. Adapte ton style de réponse en fonction du type dominant parmi les sources utilisées :

**tutorial** — Apprentissage guidé pas à pas.
Style : étapes numérotées, ton encourageant, vérifie la progression ("tu devrais voir…", "si ce n'est pas le cas…"). Ne saute aucune étape. Le lecteur débute.

**how-to** — Recette pour accomplir un objectif précis.
Style : étapes numérotées, ton impératif ("lance", "ajoute", "configure"). Pas de théorie sauf si indispensable. Le lecteur sait ce qu'il veut, il cherche la procédure.

**reference** — Information factuelle à consulter.
Style : ton neutre, présent de description. Préfère les listes et tableaux. Pas de "tu devrais". Exhaustif sur ce qui est demandé, sans pédagogie.

**explanation** — Compréhension conceptuelle, contexte, "pourquoi".
Style : prose, focus sur les raisons et les compromis. Analogies bienvenues. Pas d'étapes.

Types spécifiques aux spécifications — traiter comme suit :
- `functional-spec` → reference
- `architectural-decision` → explanation
- `contract` → reference
- `operational` → how-to

Si les sources mélangent plusieurs types, adopte le style du type majoritaire. Si le mélange est équilibré (ex. 50 % how-to / 50 % reference), distingue les deux volets dans ta réponse en les nommant explicitement ("voici la procédure… / voici la référence…").

Réponds en français. Cite les sources utilisées (titre ou chemin) en fin de réponse.

Post-prompt (copier-coller dans le BO)

Rappel strict : réponds uniquement à partir des sources fournies dans ce contexte. Si la réponse n'y figure pas, dis-le clairement sans inventer. Si la question porte sur un sujet absent du corpus Telaria, indique que tu ne peux répondre que dans le périmètre de cette documentation. Ne fournis aucune information externe — ni correction, ni complétion, ni supputation au-delà des sources.

Décisions et rationale

Pourquoi un pré-prompt et pas uniquement un message système ?

Le message système est injecté une fois, sans lien avec le contexte récupéré. Or les instructions Diataxis n'ont de sens que par rapport aux chunks qui suivent : le modèle doit lire les règles de style juste avant de lire les sources. Le pré-prompt s'intercale entre les deux — c'est son rôle canonique.

Pourquoi préserver les types non-Diataxis des specs/ ?

Les types functional-spec, architectural-decision, contract, operational portent une sémantique plus précise que reference ou explanation. Les supprimer appauvrirait la taxonomie. Le mapping (table ci-dessus) permet au modèle de les traiter sans les effacer.

Pourquoi citer les sources en fin de réponse ?

La vitrine Telaria doit démontrer que le chatbot ne confabule pas. Citer les sources (title + path) rend le RAG auditable par l'utilisateur et renforce la confiance.

Pourquoi le post-prompt répète-t-il ce que le pré-prompt dit déjà ?

La contrainte de scope est le point le plus critique. La répéter en fin de prompt (post_prompt) renforce l'ancrage en mémoire de travail du modèle — en particulier pour les longues conversations où le pre_prompt peut être dilué par le contexte intermédiaire. Ce n'est pas de la redondance : c'est une fermeture de boucle.

Cas limites documentés

Situation	Comportement attendu
Aucun chunk récupéré	"Je n'ai pas trouvé d'information sur ce sujet dans la documentation Telaria."
Question hors périmètre (ex. actualité, autre tech)	"Cette question sort du périmètre de la documentation Telaria. Je ne peux répondre que sur…"
Chunks de types mixtes équilibrés	Distinguer les volets dans la réponse, nommer les types utilisés
Chunk de type `explanation` seul + question procédurale	Répondre avec ce qui est disponible, signaler l'absence de procédure documentée
Langue différente du français	Répondre en français quoi qu'il arrive (instruction langue dans pre_prompt)

Évolutions prévues

V2 : ajouter une règle de langue détectée (si la question est en anglais, répondre en anglais) — à arbitrer avec Mathieu.
V2 : tester un mapping confidence_score → ajustement du ton (score bas = réponse plus prudente).
Non prévu : prompt par domaine d'expertise (skills) — complexité non justifiée à ce stade.