Files
anonymisation/tests/synthetic_regression

Tests synthétiques de non-régression

Cette suite fournit 10 cas synthétiques courts, relisibles et diffables, pensés comme première barrière de sécurité avant la revue humaine.

Principe :

  • test.txt contient le document synthétique d'entrée à relire ou diff-er.
  • expected.txt contient la sortie anonymisée attendue, normalisée.
  • expected.audit.json contient un résumé stable de l'audit attendu.
  • config_overlay.yml est optionnel et permet de tester une surcharge locale.

Objectif :

  • bloquer les régressions évidentes sur les règles critiques ;
  • rendre les écarts lisibles dans un diff Git ou dans la sortie de pytest ;
  • compléter, et non remplacer, la validation humaine sur corpus réel.

Portée de cette première version :

  • texte uniquement ;
  • pas encore de PDF/OCR/layout ;
  • pas encore de cas xfail pour les bugs connus.

Exécution :

pytest -q tests/unit/test_synthetic_regression.py