docs(coordination): dispatch dgx vlm model cleanup
This commit is contained in:
@@ -0,0 +1,43 @@
|
||||
# Feuille QG Qwen — DGX P1.x dé-hardcodage modèles VLM
|
||||
|
||||
- `De`: Codex
|
||||
- `A`: Qwen
|
||||
- `Copie`: Dom, Claude
|
||||
- `Date`: 2026-06-02 18:15 Europe/Paris
|
||||
- `Priorité`: P1.x quality gate
|
||||
- `Statut`: QG demandé dès livraison Claude
|
||||
|
||||
## Contexte
|
||||
|
||||
DGX actif via tunnel `localhost:11434`. Modèle disponible : `qwen3-vl:8b`
|
||||
uniquement. Les hardcodes `gemma4:*` et `qwen2.5vl:7b` provoquent des 404.
|
||||
|
||||
## Points QG obligatoires
|
||||
|
||||
- `rg` runtime : aucun payload actif ne doit hardcoder `gemma4:e4b`,
|
||||
`gemma4:latest` ou `qwen2.5vl:7b` hors constantes/config/commentaires
|
||||
explicitement justifiés.
|
||||
- Les call-sites généralistes passent par `core.detection.vlm_config.get_vlm_model()`.
|
||||
- Les call-sites grounding JSON passent par le profil approprié (`get_grounding_profile()`) si applicable.
|
||||
- Les chemins bbox legacy ne sont pas cassés par remplacement naïf :
|
||||
- pas d'envoi d'un modèle JSON à un parser bbox natif sans adaptation ;
|
||||
- si aucun bbox-model compatible n'est disponible, retour contrôlé/skip clair, pas 404 brut.
|
||||
- Pas d'alias Ollama recommandé ou requis.
|
||||
- Pas de dépendance au DGX réel dans les tests : mocks HTTP.
|
||||
- Vérifier `OLLAMA_URL`/endpoint : le tunnel `localhost:11434` reste compatible sans config supplémentaire.
|
||||
- Vérifier non-régression du chemin principal `vlm_config.get_vlm_model()` qui fallback vers `qwen3-vl:8b`.
|
||||
|
||||
## Tests attendus côté QG
|
||||
|
||||
- Test avec `/api/tags` mocké contenant seulement `qwen3-vl:8b`.
|
||||
- Test qu'un call-site ancien `gemma4` résout vers `qwen3-vl:8b`.
|
||||
- Test que le chemin bbox legacy ne déclenche pas un 404 modèle brut.
|
||||
- Tests ciblés existants autour `resolve_engine`, `safety_checks_provider`, `task_planner` si disponibles.
|
||||
|
||||
## Verdict attendu
|
||||
|
||||
- GO
|
||||
- GO partiel avec réserves précises
|
||||
- NO-GO bloquant
|
||||
|
||||
— Codex
|
||||
Reference in New Issue
Block a user