chore(dgx): snapshot consolidation WIP pour transfert poc DGX
Some checks failed
tests / Lint (ruff + black) (push) Failing after 1m44s
tests / Tests unitaires (sans GPU) (push) Failing after 1m49s
tests / Tests sécurité (critique) (push) Has been skipped

Regroupe le WIP non committé requis pour le clone/runtime DGX (Option A) :
- api_stream.py : préflight replay + smoke santé modèles + handler 403 WP-B
- de-hardcode VLM : vlm_config, gpu/*, vram_orchestrator, ollama_manager
- stream_processor, semantic_matcher, agent_chat (app/planner/intent)
- workflows.db (acquis ; le transfert artifacts le mettra à jour + rewrite chemins)
- docs : plans DGX, benchmarks VLM/grounders, recherche SOTA, coordination 8 juin

Snapshot destiné à la branche poc-dgx poussée sur Gitea pour cloner le DGX.
Scan anti-secret : clean. graphify (repo embarqué) exclu.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dom
2026-06-08 16:33:58 +02:00
parent f18de016d7
commit 6d34b3cb68
204 changed files with 15744 additions and 47 deletions

View File

@@ -0,0 +1,42 @@
# STANDBY Gemini — veille bake-off DGX VLM
- `De`: Codex
- `A`: Gemini
- `Copie`: Dom, Claude, Qwen
- `Date`: 2026-06-03 10:10 Europe/Paris
- `Statut`: standby — pas de lot bloquant tant que Dom ne reactive pas Gemini
- `Refs`:
- `docs/handoffs/2026-06-02_handoff_codex_fin_session_reprise_2026-06-03.md`
- `docs/coordination/active/2026-06-03_1010_fiches-actions-reprise-vlm-dgx.md`
## Contexte
Le DGX est disponible. Ollama fonctionne, mais Dom veut eviter une dependance unique non challengee. Le prochain sujet apres P1.x est un bake-off d'inference VLM/LLM : Ollama baseline vs vLLM vs SGLang, avec TensorRT-LLM en candidat plus lourd si necessaire.
## Role si reactive
Produire une revue courte et factuelle du protocole bake-off :
- modeles candidats realistes sur DGX ARM64/NVIDIA GB10 ;
- compatibilite OpenAI-compatible `/v1/chat/completions` ;
- pieges VLM connus : format image, `bbox_2d`, JSON strict, thinking mode, contexte trop large ;
- metriques minimales a ne pas oublier ;
- risques d'integration si un runtime bat Ollama.
## Hors scope
- Pas de patch code sans GO Dom/Codex.
- Pas de recommandation de migration runtime avant benchmark.
- Pas d'alias Ollama.
- Pas de dependance aux donnees patient.
## Attendu si active
Repondre dans `docs/coordination/inbox_codex/` avec :
- `ACK` ;
- liste de risques/criteres maximum 10 points ;
- eventuels tests de protocole recommandes, sans commande destructive.
— Codex