Aivanov_scan_ogc/scratch/README.md

# scratch/ — scripts exploratoires

Traces des tests manuels de prototypage réalisés pendant le choix du modèle OCR :

- `test_glm_ocr.py` — benchmark initial GLM-OCR 0.9B (écarté)
- `test_got_ocr.py` — tests GOT-OCR2.0 (échec sur les tableaux denses)
- `test_paddle.py` — tentative PaddleOCR (incompatible avec paddlepaddle installé)
- `test_surya.py` — tentative Surya (incompatible avec transformers 5.6)
- `test_qwen_vl.py` / `test_qwen_vl_3b.py` — Qwen2.5-VL 7B et 3B (3B retenu)
- `test_prompt_*.py` — A/B test prompts (checkboxes et recueil)

Non documenté, peu factorisé : ne pas dépendre de ce dossier depuis le code
de production. Seuls `pipeline/`, `pipeline/referentials.py`, `pipeline/ui_overlay.py`
et `annotate_validation.py` sont le périmètre stable.