fix(scripts): reprocess_audit30 path local Dom (env override) (D-12 fixup)
L'agent CHCB cleanup a remplacé CHCB → CHUXX dans le path SOURCE_ROOT mais le vrai dossier sur le disque Dom s'appelle bien 'II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)'. Ça a cassé toutes les recherches PDF (29/29 MISSING). Fix : lecture du path depuis env var ANON_AUDIT30_SOURCE avec fallback sur le path local réel. Le nom CHCB est dans le path filesystem chez Dom, pas une référence sémantique à anonymiser. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -18,6 +18,7 @@ from __future__ import annotations
|
|||||||
|
|
||||||
import argparse
|
import argparse
|
||||||
import json
|
import json
|
||||||
|
import os
|
||||||
import sys
|
import sys
|
||||||
import time
|
import time
|
||||||
import traceback
|
import traceback
|
||||||
@@ -30,9 +31,12 @@ sys.path.insert(0, str(PROJECT_DIR))
|
|||||||
from anonymizer_core_refactored_onnx import process_pdf, NerModelManager, NerThresholds # noqa: E402
|
from anonymizer_core_refactored_onnx import process_pdf, NerModelManager, NerThresholds # noqa: E402
|
||||||
|
|
||||||
BASELINE_PATH = PROJECT_DIR / "evaluation" / "baseline_scores.json"
|
BASELINE_PATH = PROJECT_DIR / "evaluation" / "baseline_scores.json"
|
||||||
SOURCE_ROOT = Path(
|
# Path local Dom — pointe vers le dossier physique sur le disque (nom réel
|
||||||
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHUXX_DocJustificatifs (1)"
|
# du dossier reçu, ne pas modifier). Override possible via env var.
|
||||||
)
|
SOURCE_ROOT = Path(os.environ.get(
|
||||||
|
"ANON_AUDIT30_SOURCE",
|
||||||
|
"/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs (1)",
|
||||||
|
))
|
||||||
|
|
||||||
|
|
||||||
def list_baseline_docs() -> list[str]:
|
def list_baseline_docs() -> list[str]:
|
||||||
|
|||||||
Reference in New Issue
Block a user