Files
anonymisation/tests/synthetic_regression
Domi31tls 65d6c8c603 test(T-G): réparer corpus synthétique post-cleanup CHCB + dégel 009
- Fixtures 001/003/004/005/010 : CHCB → CHUXX (D-12)
- 009 : Biarritz désormais masqué [VILLE] (bug connu résolu par F1-F4),
  retrait de KNOWN_FAILURES + restauration de Biarritz dans must_not_contain
- test_q1_quarantine.py : tests réels B-3/D2/D3/M5/INDEX/errors.log
  (ex-squelette xfail)

Suite tests/unit : 85 passed, 0 failed.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-03 10:31:38 +02:00
..

Tests synthétiques de non-régression

Cette suite fournit 10 cas synthétiques courts, relisibles et diffables, pensés comme première barrière de sécurité avant la revue humaine.

Principe :

  • test.txt contient le document synthétique d'entrée à relire ou diff-er.
  • expected.txt contient la sortie anonymisée attendue, normalisée.
  • expected.audit.json contient un résumé stable de l'audit attendu.
  • config_overlay.yml est optionnel et permet de tester une surcharge locale.

Objectif :

  • bloquer les régressions évidentes sur les règles critiques ;
  • rendre les écarts lisibles dans un diff Git ou dans la sortie de pytest ;
  • compléter, et non remplacer, la validation humaine sur corpus réel.

Portée de cette première version :

  • texte uniquement ;
  • pas encore de PDF/OCR/layout ;
  • pas encore de cas xfail pour les bugs connus.

Exécution :

pytest -q tests/unit/test_synthetic_regression.py