Embarquer modèle NER + chargement auto au démarrage

- GUI V5 : charge DistilCamemBERT-NER automatiquement en arrière-plan
- _app_dir() : chemin compatible Nuitka onefile
- Build Nuitka : inclut models/ + config/ dans le .exe
- GitHub Actions : étape download model avant compilation

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
2026-02-16 15:31:17 +01:00
parent 8339069c83
commit 2e7e31a1f9
3 changed files with 50 additions and 15 deletions

View File

@@ -67,7 +67,16 @@ except ImportError:
# ---------------------------------------------------------------------------
APP_TITLE = "Pseudonymisation de PDF"
APP_VERSION = "v5.0"
DEFAULT_CFG = Path("config/dictionnaires.yml")
def _app_dir() -> Path:
"""Répertoire racine de l'application (compatible Nuitka onefile)."""
# Nuitka onefile extrait dans un dossier temporaire
if "__compiled__" in dir():
return Path(__file__).resolve().parent
return Path.cwd()
DEFAULT_CFG = _app_dir() / "config" / "dictionnaires.yml"
MODELS_DIR = _app_dir() / "models"
DEFAULTS_CFG_TEXT = r"""
# dictionnaires.yml valeurs par défaut (bloc littéral pour les regex)
@@ -255,8 +264,8 @@ class App:
self.th_per = 0.90
self.th_org = 0.90
self.th_loc = 0.90
self._onnx_manager: Optional[Any] = NerModelManager(cache_dir=Path("models")) if NerModelManager else None
self._eds_manager: Optional[Any] = EdsPseudoManager(cache_dir=Path("models")) if EdsPseudoManager else None
self._onnx_manager: Optional[Any] = NerModelManager(cache_dir=MODELS_DIR) if NerModelManager else None
self._eds_manager: Optional[Any] = EdsPseudoManager(cache_dir=MODELS_DIR) if EdsPseudoManager else None
self._active_manager: Optional[Any] = None
self.cfg_data: Dict[str, Any] = {}
@@ -277,6 +286,9 @@ class App:
self._ensure_cfg_exists()
self._load_cfg()
# --- Chargement automatique du modèle NER ---
self._auto_load_ner()
# ---------------------------------------------------------------
# Thème
# ---------------------------------------------------------------
@@ -848,6 +860,26 @@ class App:
pass
return d
# ---------------------------------------------------------------
# Chargement automatique NER au démarrage
# ---------------------------------------------------------------
def _auto_load_ner(self):
"""Charge le modèle NER par défaut en arrière-plan."""
if not self._onnx_manager:
return
self.status_var.set("Chargement du modèle NER...")
threading.Thread(target=self._auto_load_ner_worker, daemon=True).start()
def _auto_load_ner_worker(self):
try:
default_model = "cmarkea/distilcamembert-base-ner"
self._onnx_manager.load(default_model)
self._active_manager = self._onnx_manager
self.use_hf = True
self.status_var.set("Prêt — NER actif.")
except Exception as e:
self.status_var.set(f"Prêt (NER indisponible : {e})")
# ---------------------------------------------------------------
# Modèles NER (API interne)
# ---------------------------------------------------------------