feat(p1z): centralize V4 reasoning model resolution (DGX-safe)

Remplace le default runtime dangereux `qwen2.5vl:7b` (absent du tunnel DGX
-> 404) des chemins V4/reasoning par un helper central get_reasoning_model().

- core/detection/vlm_config.py : + get_reasoning_model() + DEFAULT_REASONING_MODEL
  (qwen2.5vl:7b-rpa). Ordre : RPA_REASONING_MODEL -> RPA_VLM_MODEL/VLM_MODEL ->
  default DGX-safe. Pas d'appel reseau (lazy, safe a l'import).
- core/execution/input_handler.py, observe_reason_act.py (x3),
  core/cognition/vram_orchestrator.py : migration des 5 call-sites.
- tests/unit/test_reasoning_model.py : 8 tests (default DGX-safe, ordre de
  resolution, non-regression wiring des 3 modules V4).

Hors scope (signale lot P1.w) : DEFAULT_VLM_MODEL=gemma4:latest reste fallback
de get_vlm_model(). Client gele non touche.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dom
2026-06-04 16:23:10 +02:00
parent 4dc7d840d6
commit 806cc04b82
5 changed files with 130 additions and 6 deletions

View File

@@ -261,6 +261,42 @@ def get_bbox_grounding_model() -> str:
)
# ────────────────────────────────────────────────────────────────────────────
# P1.z (2026-06-04) : résolution centralisée du modèle V4/reasoning, DGX-safe
# ────────────────────────────────────────────────────────────────────────────
# Modèle de raisonnement V4/ORA par défaut — DGX-safe.
# Les chemins reasoning (ORALoop, détection dialogue/popup, vram_orchestrator)
# font du VLM généraliste sur screenshot (JSON action/decision), pas du grounding
# bbox. Le default est aligné sur le modèle présent sur le tunnel DGX
# (qwen2.5vl:7b-rpa), PAS sur `qwen2.5vl:7b` brut qui est absent du DGX → 404.
DEFAULT_REASONING_MODEL = "qwen2.5vl:7b-rpa"
def get_reasoning_model() -> str:
"""Retourne le modèle pour les chemins V4/reasoning (ORALoop, détection
dialogue/popup, orchestration VRAM).
Distinct du grounding (get_grounding_profile / get_bbox_grounding_model) :
ici on raisonne en langage naturel + JSON sur un screenshot, pas de
coordonnées. Pas d'appel réseau (résolution lazy, safe à l'import).
Ordre de résolution :
1. RPA_REASONING_MODEL (dédié, prioritaire)
2. RPA_VLM_MODEL / VLM_MODEL (hérite de la config VLM existante)
3. DEFAULT_REASONING_MODEL (qwen2.5vl:7b-rpa, présent sur DGX)
Returns:
Nom du modèle de raisonnement (ex: "qwen2.5vl:7b-rpa").
"""
return (
os.environ.get("RPA_REASONING_MODEL")
or os.environ.get("RPA_VLM_MODEL")
or os.environ.get("VLM_MODEL")
or DEFAULT_REASONING_MODEL
)
def needs_think_false(model_name: str) -> bool:
"""Détermine si un modèle nécessite think=false dans le payload.