Détecter les hallucinations avec l'annotation de segments
Repérez les hallucinations et les erreurs factuelles des modèles en surlignant les mots exacts et en étiquetant ce qui ne va pas, à la manière de MQM, avec l'annotation de segments dans Potato.
Lorsqu'un modèle invente quelque chose, un pouce vers le bas sur l'ensemble de la réponse ne vous apprend presque rien. Vous savez que c'est faux quelque part. Vous ne savez pas quelle phrase, quel type d'erreur, ni à quel point c'est grave. L'annotation de segments corrige cela : l'annotateur surligne les mots exacts et étiquette ce qui ne va pas avec eux.
C'est la même idée que celle derrière MQM, le cadre de segments d'erreur que l'évaluation de la traduction automatique utilise depuis des années. Marquez le segment, catégorisez l'erreur, évaluez la gravité. Le résultat, ce sont des données sur lesquelles vous pouvez réellement agir.
Pourquoi les segments valent mieux que les marquages globaux
Une étiquette « infidèle » apposée sur toute la réponse est une statistique récapitulative. Un segment est une localisation et un diagnostic. Avec les segments, vous pouvez mesurer les taux d'erreur par type, repérer des tendances sur de nombreuses sorties et constituer des données d'entraînement ciblées pour le mode d'échec qui vous intéresse. Rien de tout cela n'est possible quand l'unité de jugement est la réponse entière.
La mise en place dans Potato
Surlignez le texte problématique, étiquetez le type d'erreur et ajoutez un jugement de gravité afin qu'une bévue anodine et une fabrication dangereuse ne soient pas pondérées de la même manière.
annotation_schemes:
- annotation_type: span
name: errors
description: "Highlight each problematic span and label the error type."
labels: [unsupported_claim, factual_error, contradiction, fabricated_citation]
label_colors:
unsupported_claim: "#f59e0b"
factual_error: "#ef4444"
contradiction: "#8b5cf6"
fabricated_citation: "#ec4899"
- annotation_type: radio
name: severity
description: "How serious is the worst error?"
labels: [Minor, Major, Critical]Les règles qui déterminent la qualité de vos données
Donnez aux annotateurs le matériel source. « Non étayé » est indéfinissable sans lui, donc les documents ou le contexte doivent être à l'écran, et non derrière un onglet.
Décidez votre règle de délimitation une fois pour toutes. Le segment couvre-t-il toute la phrase ou seulement la proposition fausse ? Les deux se défendent ; choisissez-en une et notez-la.
Attendez-vous à de la subjectivité aux marges. Les jugements de fidélité divergent sur les cas limites, alors collectez un recoupement sur un échantillon et vérifiez l'accord avant de vous fier aux chiffres.
Pour aller plus loin
L'explication complète, y compris la façon de définir chaque type d'erreur, se trouve dans le guide Détecter les hallucinations. Pour la version ancrée dans la récupération de ce problème, consultez Évaluation RAG et le guide d'annotation de segments. Pour les détails de mise en œuvre, consultez la documentation source sur les segments d'erreur.