chore(dgx): snapshot consolidation WIP pour transfert poc DGX
Regroupe le WIP non committé requis pour le clone/runtime DGX (Option A) : - api_stream.py : préflight replay + smoke santé modèles + handler 403 WP-B - de-hardcode VLM : vlm_config, gpu/*, vram_orchestrator, ollama_manager - stream_processor, semantic_matcher, agent_chat (app/planner/intent) - workflows.db (acquis ; le transfert artifacts le mettra à jour + rewrite chemins) - docs : plans DGX, benchmarks VLM/grounders, recherche SOTA, coordination 8 juin Snapshot destiné à la branche poc-dgx poussée sur Gitea pour cloner le DGX. Scan anti-secret : clean. graphify (repo embarqué) exclu. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,35 @@
|
||||
# Memo exploration — Docling
|
||||
|
||||
- `Auteur`: Codex
|
||||
- `Date`: 2026-06-03 12:02 Europe/Paris
|
||||
- `Statut`: piste exploration, hors chemin critique P1.x
|
||||
|
||||
## Sujet
|
||||
|
||||
Docling est une brique open source d'ingestion/conversion documentaire utile a tester pour Aiva/Léa.
|
||||
|
||||
Usage potentiel :
|
||||
|
||||
- convertir PDF, DOCX, PPTX, XLSX, HTML, images ou Markdown en Markdown/JSON exploitable ;
|
||||
- extraire structure, titres, listes, tables, ordre de lecture, OCR et bounding boxes ;
|
||||
- alimenter une base RAG/documentaire locale pour procedures, cahiers des charges, docs DSI, contrats, notices ou corpus metier ;
|
||||
- garder un mode local pour documents sensibles.
|
||||
|
||||
## Position provisoire
|
||||
|
||||
Docling ne remplace pas le grounding ecran temps reel de Lea. C'est plutot une brique d'ingestion documentaire et de preparation de connaissances.
|
||||
|
||||
Tests exploratoires pertinents :
|
||||
|
||||
1. convertir un PDF DSI/procedure vers Markdown + JSON ;
|
||||
2. verifier la qualite des tables et l'ordre de lecture ;
|
||||
3. mesurer temps CPU/GPU et dependances ;
|
||||
4. comparer avec pipeline actuel OCR/extraction ;
|
||||
5. tester integration RAG ou base de connaissances multi-verticale.
|
||||
|
||||
## Garde-fous
|
||||
|
||||
- Ne pas brancher Docling dans le hot path Lea sans evaluation.
|
||||
- Ne pas l'ajouter comme dependance projet avant test isole.
|
||||
- Ne pas traiter de document sensible sans valider le mode local et les chemins de sortie.
|
||||
|
||||
Reference in New Issue
Block a user