fix(scripts): reprocess_audit30 path local Dom (env override) (D-12 fixup)
L'agent CHCB cleanup a remplacé CHCB → CHUXX dans le path SOURCE_ROOT mais le vrai dossier sur le disque Dom s'appelle bien 'II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)'. Ça a cassé toutes les recherches PDF (29/29 MISSING). Fix : lecture du path depuis env var ANON_AUDIT30_SOURCE avec fallback sur le path local réel. Le nom CHCB est dans le path filesystem chez Dom, pas une référence sémantique à anonymiser. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -18,6 +18,7 @@ from __future__ import annotations
|
||||
|
||||
import argparse
|
||||
import json
|
||||
import os
|
||||
import sys
|
||||
import time
|
||||
import traceback
|
||||
@@ -30,9 +31,12 @@ sys.path.insert(0, str(PROJECT_DIR))
|
||||
from anonymizer_core_refactored_onnx import process_pdf, NerModelManager, NerThresholds # noqa: E402
|
||||
|
||||
BASELINE_PATH = PROJECT_DIR / "evaluation" / "baseline_scores.json"
|
||||
SOURCE_ROOT = Path(
|
||||
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHUXX_DocJustificatifs (1)"
|
||||
)
|
||||
# Path local Dom — pointe vers le dossier physique sur le disque (nom réel
|
||||
# du dossier reçu, ne pas modifier). Override possible via env var.
|
||||
SOURCE_ROOT = Path(os.environ.get(
|
||||
"ANON_AUDIT30_SOURCE",
|
||||
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)",
|
||||
))
|
||||
|
||||
|
||||
def list_baseline_docs() -> list[str]:
|
||||
|
||||
Reference in New Issue
Block a user