Domi31tls f206d160f4 Intégration VLM (Ollama) pour anonymisation des PDFs scannés
- Ajout paramètre vlm_manager à process_pdf()
- Nouvelle fonction _apply_vlm_on_scanned_pdf() : envoie chaque page
  au VLM (qwen2.5vl) pour détecter visuellement les PII
- Les entités VLM sont ajoutées à l'audit et au texte pseudonymisé
- Dégradation gracieuse : si Ollama indisponible, le pipeline continue
- Actif uniquement sur les PDFs scannés (ocr_used=True)
- Testé sur 2 scans : LACAZE/PAUL/CAPDUPUY détectés et masqués (0 PII résiduel)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-27 01:10:16 +01:00

placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete

L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.

Description
No description provided
Readme 247 MiB
Languages
Python 98.2%
Batchfile 1%
PowerShell 0.5%
Shell 0.3%