chore(dgx): snapshot consolidation WIP pour transfert poc DGX
Some checks failed
tests / Lint (ruff + black) (push) Failing after 1m44s
tests / Tests unitaires (sans GPU) (push) Failing after 1m49s
tests / Tests sécurité (critique) (push) Has been skipped

Regroupe le WIP non committé requis pour le clone/runtime DGX (Option A) :
- api_stream.py : préflight replay + smoke santé modèles + handler 403 WP-B
- de-hardcode VLM : vlm_config, gpu/*, vram_orchestrator, ollama_manager
- stream_processor, semantic_matcher, agent_chat (app/planner/intent)
- workflows.db (acquis ; le transfert artifacts le mettra à jour + rewrite chemins)
- docs : plans DGX, benchmarks VLM/grounders, recherche SOTA, coordination 8 juin

Snapshot destiné à la branche poc-dgx poussée sur Gitea pour cloner le DGX.
Scan anti-secret : clean. graphify (repo embarqué) exclu.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dom
2026-06-08 16:33:58 +02:00
parent f18de016d7
commit 6d34b3cb68
204 changed files with 15744 additions and 47 deletions

View File

@@ -0,0 +1,35 @@
# Memo exploration — Docling
- `Auteur`: Codex
- `Date`: 2026-06-03 12:02 Europe/Paris
- `Statut`: piste exploration, hors chemin critique P1.x
## Sujet
Docling est une brique open source d'ingestion/conversion documentaire utile a tester pour Aiva/Léa.
Usage potentiel :
- convertir PDF, DOCX, PPTX, XLSX, HTML, images ou Markdown en Markdown/JSON exploitable ;
- extraire structure, titres, listes, tables, ordre de lecture, OCR et bounding boxes ;
- alimenter une base RAG/documentaire locale pour procedures, cahiers des charges, docs DSI, contrats, notices ou corpus metier ;
- garder un mode local pour documents sensibles.
## Position provisoire
Docling ne remplace pas le grounding ecran temps reel de Lea. C'est plutot une brique d'ingestion documentaire et de preparation de connaissances.
Tests exploratoires pertinents :
1. convertir un PDF DSI/procedure vers Markdown + JSON ;
2. verifier la qualite des tables et l'ordre de lecture ;
3. mesurer temps CPU/GPU et dependances ;
4. comparer avec pipeline actuel OCR/extraction ;
5. tester integration RAG ou base de connaissances multi-verticale.
## Garde-fous
- Ne pas brancher Docling dans le hot path Lea sans evaluation.
- Ne pas l'ajouter comme dependance projet avant test isole.
- Ne pas traiter de document sensible sans valider le mode local et les chemins de sortie.