Tests synthétiques de non-régression
Cette suite fournit 10 cas synthétiques courts, relisibles et diffables, pensés comme première barrière de sécurité avant la revue humaine.
Principe :
test.txtcontient le document synthétique d'entrée à relire ou diff-er.expected.txtcontient la sortie anonymisée attendue, normalisée.expected.audit.jsoncontient un résumé stable de l'audit attendu.config_overlay.ymlest optionnel et permet de tester une surcharge locale.
Objectif :
- bloquer les régressions évidentes sur les règles critiques ;
- rendre les écarts lisibles dans un diff Git ou dans la sortie de
pytest; - compléter, et non remplacer, la validation humaine sur corpus réel.
Portée de cette première version :
- texte uniquement ;
- pas encore de PDF/OCR/layout ;
- pas encore de cas
xfailpour les bugs connus.
Exécution :
pytest -q tests/unit/test_synthetic_regression.py