feat: cache Ollama + parallélisation ThreadPool + filtrage DAS renforcé + modules GHM/CPAM/export RUM

- Cache persistant JSON thread-safe pour les résultats Ollama (invalidation par modèle)
- Parallélisation des appels Ollama (ThreadPoolExecutor, 2 workers)
- 6 nouvelles règles de filtrage DAS parasites (doublons, ponctuation, OCR, labo, fragments)
- Client Ollama centralisé (mode JSON natif + retry)
- Module GHM (estimation CMD/sévérité)
- Module contrôle CPAM (parser + contre-argumentation RAG)
- Export RUM (format RSS)
- Viewer enrichi (détail dossier)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
dom
2026-02-12 13:44:34 +01:00
parent a00e5f1147
commit a58398f5d4
25 changed files with 2872 additions and 97 deletions

45
run.sh Executable file
View File

@@ -0,0 +1,45 @@
#!/bin/bash
set -e
cd "$(dirname "$0")"
echo "🚀 Démarrage de l'application T2A..."
# Vérifier si l'environnement virtuel existe
if [ ! -d ".venv" ]; then
echo "📦 Création de l'environnement virtuel..."
python3 -m venv .venv
fi
# Activer l'environnement virtuel
echo "🔧 Activation de l'environnement virtuel..."
source .venv/bin/activate
# Installer/mettre à jour les dépendances
if [ ! -f ".venv/.deps_installed" ] || [ "requirements.txt" -nt ".venv/.deps_installed" ]; then
echo "📥 Installation des dépendances..."
pip install -q --upgrade pip
pip install -q -r requirements.txt
touch .venv/.deps_installed
else
echo "✅ Dépendances déjà installées"
fi
# Créer les répertoires nécessaires
mkdir -p input output/anonymized output/structured output/reports data/rag_index
echo ""
echo "✨ Application prête !"
echo ""
echo "📂 Répertoires :"
echo " - input/ : Placez vos PDFs ici"
echo " - output/ : Résultats du traitement"
echo ""
echo "🌐 Lancement du viewer sur http://localhost:5000"
echo ""
echo " Appuyez sur Ctrl+C pour arrêter"
echo ""
# Lancer le viewer
python3 -m src.viewer