docs(coordination): dispatch dgx vlm model cleanup

This commit is contained in:
Dom
2026-06-02 18:16:55 +02:00
parent 3697e3ba0e
commit 4e7c2a7628
3 changed files with 159 additions and 0 deletions

View File

@@ -0,0 +1,43 @@
# Feuille QG Qwen — DGX P1.x dé-hardcodage modèles VLM
- `De`: Codex
- `A`: Qwen
- `Copie`: Dom, Claude
- `Date`: 2026-06-02 18:15 Europe/Paris
- `Priorité`: P1.x quality gate
- `Statut`: QG demandé dès livraison Claude
## Contexte
DGX actif via tunnel `localhost:11434`. Modèle disponible : `qwen3-vl:8b`
uniquement. Les hardcodes `gemma4:*` et `qwen2.5vl:7b` provoquent des 404.
## Points QG obligatoires
- `rg` runtime : aucun payload actif ne doit hardcoder `gemma4:e4b`,
`gemma4:latest` ou `qwen2.5vl:7b` hors constantes/config/commentaires
explicitement justifiés.
- Les call-sites généralistes passent par `core.detection.vlm_config.get_vlm_model()`.
- Les call-sites grounding JSON passent par le profil approprié (`get_grounding_profile()`) si applicable.
- Les chemins bbox legacy ne sont pas cassés par remplacement naïf :
- pas d'envoi d'un modèle JSON à un parser bbox natif sans adaptation ;
- si aucun bbox-model compatible n'est disponible, retour contrôlé/skip clair, pas 404 brut.
- Pas d'alias Ollama recommandé ou requis.
- Pas de dépendance au DGX réel dans les tests : mocks HTTP.
- Vérifier `OLLAMA_URL`/endpoint : le tunnel `localhost:11434` reste compatible sans config supplémentaire.
- Vérifier non-régression du chemin principal `vlm_config.get_vlm_model()` qui fallback vers `qwen3-vl:8b`.
## Tests attendus côté QG
- Test avec `/api/tags` mocké contenant seulement `qwen3-vl:8b`.
- Test qu'un call-site ancien `gemma4` résout vers `qwen3-vl:8b`.
- Test que le chemin bbox legacy ne déclenche pas un 404 modèle brut.
- Tests ciblés existants autour `resolve_engine`, `safety_checks_provider`, `task_planner` si disponibles.
## Verdict attendu
- GO
- GO partiel avec réserves précises
- NO-GO bloquant
— Codex