docs(coordination): dispatch dgx vlm model cleanup

2026-06-02 18:16:55 +02:00
parent 3697e3ba0e
commit 4e7c2a7628
3 changed files with 159 additions and 0 deletions
--- a/docs/coordination/inbox_qwen/2026-06-02_1815_codex-to-qwen_QG-DGX-P1X-dehardcode-modeles-VLM.md
+++ b/docs/coordination/inbox_qwen/2026-06-02_1815_codex-to-qwen_QG-DGX-P1X-dehardcode-modeles-VLM.md
@@ -0,0 +1,43 @@
+# Feuille QG Qwen — DGX P1.x dé-hardcodage modèles VLM
+
+- `De`: Codex
+- `A`: Qwen
+- `Copie`: Dom, Claude
+- `Date`: 2026-06-02 18:15 Europe/Paris
+- `Priorité`: P1.x quality gate
+- `Statut`: QG demandé dès livraison Claude
+
+## Contexte
+
+DGX actif via tunnel `localhost:11434`. Modèle disponible : `qwen3-vl:8b`
+uniquement. Les hardcodes `gemma4:*` et `qwen2.5vl:7b` provoquent des 404.
+
+## Points QG obligatoires
+
+- `rg` runtime : aucun payload actif ne doit hardcoder `gemma4:e4b`,
+  `gemma4:latest` ou `qwen2.5vl:7b` hors constantes/config/commentaires
+  explicitement justifiés.
+- Les call-sites généralistes passent par `core.detection.vlm_config.get_vlm_model()`.
+- Les call-sites grounding JSON passent par le profil approprié (`get_grounding_profile()`) si applicable.
+- Les chemins bbox legacy ne sont pas cassés par remplacement naïf :
+  - pas d'envoi d'un modèle JSON à un parser bbox natif sans adaptation ;
+  - si aucun bbox-model compatible n'est disponible, retour contrôlé/skip clair, pas 404 brut.
+- Pas d'alias Ollama recommandé ou requis.
+- Pas de dépendance au DGX réel dans les tests : mocks HTTP.
+- Vérifier `OLLAMA_URL`/endpoint : le tunnel `localhost:11434` reste compatible sans config supplémentaire.
+- Vérifier non-régression du chemin principal `vlm_config.get_vlm_model()` qui fallback vers `qwen3-vl:8b`.
+
+## Tests attendus côté QG
+
+- Test avec `/api/tags` mocké contenant seulement `qwen3-vl:8b`.
+- Test qu'un call-site ancien `gemma4` résout vers `qwen3-vl:8b`.
+- Test que le chemin bbox legacy ne déclenche pas un 404 modèle brut.
+- Tests ciblés existants autour `resolve_engine`, `safety_checks_provider`, `task_planner` si disponibles.
+
+## Verdict attendu
+
+- GO
+- GO partiel avec réserves précises
+- NO-GO bloquant
+
+— Codex