From bf268bac129e16d6e4f69bea8e88b966611f43b1 Mon Sep 17 00:00:00 2001 From: Domi31tls Date: Tue, 2 Jun 2026 14:47:09 +0200 Subject: [PATCH] fix(scripts): reprocess_audit30 path local Dom (env override) (D-12 fixup) MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit L'agent CHCB cleanup a remplacé CHCB → CHUXX dans le path SOURCE_ROOT mais le vrai dossier sur le disque Dom s'appelle bien 'II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)'. Ça a cassé toutes les recherches PDF (29/29 MISSING). Fix : lecture du path depuis env var ANON_AUDIT30_SOURCE avec fallback sur le path local réel. Le nom CHCB est dans le path filesystem chez Dom, pas une référence sémantique à anonymiser. Co-Authored-By: Claude Opus 4.7 (1M context) --- scripts/reprocess_audit30.py | 10 +++++++--- 1 file changed, 7 insertions(+), 3 deletions(-) diff --git a/scripts/reprocess_audit30.py b/scripts/reprocess_audit30.py index 7f6ab1b..de528fb 100644 --- a/scripts/reprocess_audit30.py +++ b/scripts/reprocess_audit30.py @@ -18,6 +18,7 @@ from __future__ import annotations import argparse import json +import os import sys import time import traceback @@ -30,9 +31,12 @@ sys.path.insert(0, str(PROJECT_DIR)) from anonymizer_core_refactored_onnx import process_pdf, NerModelManager, NerThresholds # noqa: E402 BASELINE_PATH = PROJECT_DIR / "evaluation" / "baseline_scores.json" -SOURCE_ROOT = Path( - "/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHUXX_DocJustificatifs (1)" -) +# Path local Dom — pointe vers le dossier physique sur le disque (nom réel +# du dossier reçu, ne pas modifier). Override possible via env var. +SOURCE_ROOT = Path(os.environ.get( + "ANON_AUDIT30_SOURCE", + "/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)", +)) def list_baseline_docs() -> list[str]: