chore(dgx): snapshot consolidation WIP pour transfert poc DGX
Regroupe le WIP non committé requis pour le clone/runtime DGX (Option A) : - api_stream.py : préflight replay + smoke santé modèles + handler 403 WP-B - de-hardcode VLM : vlm_config, gpu/*, vram_orchestrator, ollama_manager - stream_processor, semantic_matcher, agent_chat (app/planner/intent) - workflows.db (acquis ; le transfert artifacts le mettra à jour + rewrite chemins) - docs : plans DGX, benchmarks VLM/grounders, recherche SOTA, coordination 8 juin Snapshot destiné à la branche poc-dgx poussée sur Gitea pour cloner le DGX. Scan anti-secret : clean. graphify (repo embarqué) exclu. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,42 @@
|
||||
# STANDBY Gemini — veille bake-off DGX VLM
|
||||
|
||||
- `De`: Codex
|
||||
- `A`: Gemini
|
||||
- `Copie`: Dom, Claude, Qwen
|
||||
- `Date`: 2026-06-03 10:10 Europe/Paris
|
||||
- `Statut`: standby — pas de lot bloquant tant que Dom ne reactive pas Gemini
|
||||
- `Refs`:
|
||||
- `docs/handoffs/2026-06-02_handoff_codex_fin_session_reprise_2026-06-03.md`
|
||||
- `docs/coordination/active/2026-06-03_1010_fiches-actions-reprise-vlm-dgx.md`
|
||||
|
||||
## Contexte
|
||||
|
||||
Le DGX est disponible. Ollama fonctionne, mais Dom veut eviter une dependance unique non challengee. Le prochain sujet apres P1.x est un bake-off d'inference VLM/LLM : Ollama baseline vs vLLM vs SGLang, avec TensorRT-LLM en candidat plus lourd si necessaire.
|
||||
|
||||
## Role si reactive
|
||||
|
||||
Produire une revue courte et factuelle du protocole bake-off :
|
||||
|
||||
- modeles candidats realistes sur DGX ARM64/NVIDIA GB10 ;
|
||||
- compatibilite OpenAI-compatible `/v1/chat/completions` ;
|
||||
- pieges VLM connus : format image, `bbox_2d`, JSON strict, thinking mode, contexte trop large ;
|
||||
- metriques minimales a ne pas oublier ;
|
||||
- risques d'integration si un runtime bat Ollama.
|
||||
|
||||
## Hors scope
|
||||
|
||||
- Pas de patch code sans GO Dom/Codex.
|
||||
- Pas de recommandation de migration runtime avant benchmark.
|
||||
- Pas d'alias Ollama.
|
||||
- Pas de dependance aux donnees patient.
|
||||
|
||||
## Attendu si active
|
||||
|
||||
Repondre dans `docs/coordination/inbox_codex/` avec :
|
||||
|
||||
- `ACK` ;
|
||||
- liste de risques/criteres maximum 10 points ;
|
||||
- eventuels tests de protocole recommandes, sans commande destructive.
|
||||
|
||||
— Codex
|
||||
|
||||
Reference in New Issue
Block a user