t2a_v2

Dom/t2a_v2

Author	SHA1	Message	Date
dom	5b58886ebf	feat: versioning sémantique (single source of truth) - Crée src/__version__.py comme source unique de version (2.1.0) - pyproject.toml utilise dynamic version via setuptools attr - Affiche la version dans le footer de la sidebar (base.html) - Ajoute endpoint /health avec version et status Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-08 11:47:44 +01:00
dom	79c447688c	fix: ajouter liens navigation vers interface admin regles - Lien sidebar base.html : "Regles metier" sous "Referentiels" - Lien croise admin_referentiels.html → regles - Boutons dashboard : "Gerer les referentiels" + "Regles metier" Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 19:42:42 +01:00
dom	4e2b4bd946	refactor: réorganisation référentiels, nouveaux modules extraction, nettoyage code obsolète - Réorganisation data/referentiels/ : pdfs/, dicts/, user/ (structure unifiée) - Fix badges "Source absente" sur page admin référentiels - Ré-indexation COCOA 2025 (555 → 1451 chunks, couverture 94%) - Fix VRAM OOM : embeddings forcés CPU via T2A_EMBED_CPU - Nouveaux modules : document_router, docx_extractor, image_extractor, ocr_engine - Module complétude (quality/completude.py + config YAML) - Template DIM (synthèse dimensionnelle) - Gunicorn config + systemd service t2a-viewer - Suppression t2a_install_rag_cleanup/ (copie obsolète) - Suppression scripts/ et scripts_t2a_v2/ (anciens benchmarks) - Suppression 81 fichiers _doc.txt de test - Cache Ollama : TTL configurable, corrections loader YAML - Dashboard : améliorations templates (base, index, detail, cpam, validation) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 16:48:10 +01:00
dom	909e051cc9	feat: architecture multi-modèles LLM + quality engine + benchmark - Multi-modèles : 4 rôles LLM (coding=gemma3:27b-cloud, cpam=gemma3:27b-cloud, validation=deepseek-v3.2:cloud, qc=gemma3:12b) avec get_model(role) - Prompts externalisés : 7 templates dans src/prompts/templates.py - Cache Ollama : modèle stocké par entrée (migration auto ancien format) - call_ollama() : paramètre role= (priorité: model > role > global) - Quality engine : veto_engine + decision_engine + rules_router (YAML) - Benchmark qualité : scripts/benchmark_quality.py (A/B, métriques CIM-10) - Fix biologie : valeurs qualitatives (troponine négative) non filtrées - Fix CPAM : gemma3:27b-cloud au lieu de deepseek (JSON tronqué par thinking) - CPAM max_tokens 4000→6000, viewer admin multi-modèles - Benchmark 10 dossiers : 100% DAS valides, 10/10 CPAM, 243s/dossier Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-20 00:21:09 +01:00
dom	40934fdc39	feat: traçabilité source systématique + viewer interactif Ajoute source_page/source_excerpt à tous les types (biologie, imagerie, traitements, actes CCAM, antécédents, complications). Convertit antecedents et complications en types structurés (Antecedent/Complication) avec validators backward-compat pour les vieux JSON. Étend _apply_source_tracking à tous les éléments du dossier. Ajoute un endpoint /api/source-text/ et un modal interactif dans le viewer avec surlignage du texte source. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-18 20:59:50 +01:00
dom	dbc5bdbaf4	feat: mode Validation DIM dans le viewer Flask Permet aux médecins DIM de valider/corriger les codes CIM-10 extraits par le pipeline pour construire un gold standard (50 dossiers). - ValidationManager : gestion annotations JSON dans data/gold_standard/ - Script sélection 50 dossiers (25 CPAM + 25 stratifiés CMD/confiance) - Routes /validation, /api/cim10/search, /api/validation/save, /validation/metrics - Formulaire avec autocomplete CIM-10, boutons Correct/Modifier/Supprimer - Dashboard métriques : precision, recall, F1, hallucination par confiance/source Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 21:43:02 +01:00
dom	01d47f3c4b	feat: mode hybride Ollama — gemma3:27b pour CPAM, 12b pour codage Le pipeline utilise désormais gemma3:12b (rapide) pour le codage CIM-10 et gemma3:27b (meilleur raisonnement) pour la contre-argumentation CPAM. Configurable via OLLAMA_MODEL_CPAM et OLLAMA_TIMEOUT_CPAM. Inclut aussi : traçabilité source/page DAS, niveaux CMA ATIH, sévérité, page tracker PDF, améliorations fusion et filtres DAS. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 17:53:53 +01:00
dom	ee661dae1d	feat: dashboard métriques + vue CPAM agrégée dans le viewer Ajout d'un dashboard global (distribution confiance DP, top 15 codes CIM-10, types GHM, sévérité) et d'une page listant tous les contrôles CPAM agrégés. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-13 18:11:21 +01:00
dom	906a2797e5	feat: champ de recherche dossiers dans la sidebar du viewer Filtrage côté client en temps réel par nom de dossier ou document. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-13 15:39:56 +01:00
dom	f44216b95b	feat: pass LLM hybride pour DAS + interface admin référentiels RAG Chantier 1 — Extraction DAS par LLM : - Nouveau prompt expert DIM dans rag_search.py (extract_das_llm) - Phase 4 dans cim10_extractor.py : détection DAS supplémentaires avant enrichissement RAG - Cache persistant (clé hash du texte), validation CIM-10, déduplication - Activé uniquement avec use_rag=True (--no-rag le désactive) Chantier 2 — Admin référentiels : - Config : REFERENTIELS_DIR, UPLOAD_MAX_SIZE_MB, ALLOWED_EXTENSIONS - Chunking générique (PDF/CSV/Excel/TXT) + ajout incrémental FAISS dans rag_index.py - ReferentielManager CRUD dans viewer/referentiels.py - 5 routes Flask (listing, upload, indexation, suppression, rebuild) - Template admin avec tableau interactif + lien sidebar Fix : if cache → if cache is not None (OllamaCache vide évaluait à False) 410 tests passent (27 nouveaux, 0 régression). Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-12 23:12:39 +01:00
dom	b38f87ac7a	feat: output miroir de input, viewer lisible, mode 100% local - CLI accepte plusieurs chemins en entrée (nargs="*") - Un dossier patient passé directement utilise son nom comme subdir - Filtres Jinja format_dossier_name (15_23096332 → Dossier 23096332) et format_doc_name (CRO_xxx_cim10 → CRO, Trackare, Fusionné) - Sidebar : noms lisibles, fusionné mis en avant (★) - NER CamemBERT en local_files_only (aucun appel réseau) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-11 22:52:10 +01:00
dom	96ccb4850f	fix: script JS cassé par balises <script> imbriquées dans les templates Le block Jinja2 {% block scripts %} était à l'intérieur d'une balise <script> parente, causant des scripts imbriqués invalides qui cassaient le chargement des modèles Ollama et le bouton reprocess. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-11 17:34:33 +01:00
dom	86a26b9f8c	feat: durées en minutes + feedback visuel du retraitement - Filtre format_duration : affiche les temps en min/s au lieu de secondes brutes - Bouton reprocess : spinner animé, compteur temps réel, confirmation immédiate Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-11 17:18:03 +01:00
dom	9d07894c6f	feat: Phase 4 — viewer enrichi, non-cumul CCAM, fusion multi-PDFs + rebuild FAISS (21 141 vecteurs) - Viewer : badges compteurs (DAS, actes, alertes, CMA), raisonnement LLM pliable, regroupement CCAM, navigation patient, alertes NON-CUMUL en rouge - Non-cumul CCAM : 3 règles heuristiques (même base, même regroupement/jour, paires incompatibles) - Fusion multi-PDFs : merge_dossiers() avec priorité Trackare, spécificité CIM-10, déduplication, champ source_files - Index FAISS reconstruit : 21 141 vecteurs (CCAM dict 8 257 + CIM-10 alpha 306) - 192 tests unitaires passent Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-11 12:43:34 +01:00
dom	7e69f994b0	feat: dictionnaire CCAM complet (8 257 codes) + index FAISS enrichi + validation actes Phase 2 (CCAM) : - Nouveau src/medical/ccam_dict.py : build depuis CCAM_V81.xls via xlrd, lookup 3 niveaux, validation codes - Intégration dans l'extracteur : fallback ccam_lookup + _validate_ccam() avec alertes - CLI : --build-ccam-dict, --rebuild-index Phase 3 (FAISS) : - Chunks CCAM depuis le dictionnaire JSON (priorité sur le PDF) - Chunks CIM-10 index alphabétique (terme → code) - Priorisation cim10_alpha dans la recherche RAG Viewer : endpoint reprocess + bloc scripts Tests : 8 tests CCAM + tests raisonnement RAG (161 passed) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-11 11:41:39 +01:00
dom	037d255aa0	feat: ajout viewer Flask CIM-10 avec config Ollama centralisée et chronométrage Ajoute une interface web Flask pour visualiser les dossiers médicaux CIM-10, avec temps de traitement par PDF, sélecteur de modèle Ollama, et centralisation de la config Ollama dans src/config.py. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-10 20:11:07 +01:00

16 Commits