fix(scripts): reprocess_audit30 path local Dom (env override) (D-12 fixup)

L'agent CHCB cleanup a remplacé CHCB → CHUXX dans le path SOURCE_ROOT
mais le vrai dossier sur le disque Dom s'appelle bien
'II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)'. Ça a cassé toutes
les recherches PDF (29/29 MISSING).

Fix : lecture du path depuis env var ANON_AUDIT30_SOURCE avec fallback
sur le path local réel. Le nom CHCB est dans le path filesystem chez
Dom, pas une référence sémantique à anonymiser.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-02 14:47:09 +02:00
parent 94e5acd9fb
commit bf268bac12

View File

@@ -18,6 +18,7 @@ from __future__ import annotations
import argparse
import json
import os
import sys
import time
import traceback
@@ -30,9 +31,12 @@ sys.path.insert(0, str(PROJECT_DIR))
from anonymizer_core_refactored_onnx import process_pdf, NerModelManager, NerThresholds # noqa: E402
BASELINE_PATH = PROJECT_DIR / "evaluation" / "baseline_scores.json"
SOURCE_ROOT = Path(
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHUXX_DocJustificatifs (1)"
)
# Path local Dom — pointe vers le dossier physique sur le disque (nom réel
# du dossier reçu, ne pas modifier). Override possible via env var.
SOURCE_ROOT = Path(os.environ.get(
"ANON_AUDIT30_SOURCE",
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)",
))
def list_baseline_docs() -> list[str]: