anonymisation

Author	SHA1	Message	Date
Domi31tls	4b7c8db9a8	build: retirer torch/docTR du frozen + hiddenimports OnnxTR (pré-audit Qwen GO) Suite à la migration OCR docTR→OnnxTR (`8d683bc`) et au verdict pré-audit Qwen (GO technique, 2026-06-21), préparation des 3 specs PyInstaller pour le prochain rebuild Windows : - Retrait de "torch", "torchvision", "doctr.*" des hiddenimports des 3 specs (anonymisation_onefile, _cli_onefile, _gui_v6_onefile) → -~2 Go EXE attendu, suppression définitive de la classe de bug oneDNN sur CPU contraint. - Ajout des hiddenimports transitifs OnnxTR manquants (réserve R1 Qwen) : "pyclipper", "scipy.cluster.hierarchy", "scipy.special" → anti-omission PyInstaller (évite un crash OCR en frozen). - Retrait de python-doctr[torch]>=0.9.0 de requirements.txt (transitoire levé). _configure_torch_threads() conservé en code (lazy import torch sous try/except, no-op si torch absent) pour future réactivation EDS-Pseudo/GLiNER. Aucun rebuild ni diffusion (gate Dom). 3 specs compilent (py_compile). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-22 16:49:03 +02:00
Domi31tls	8d683bc6d8	feat(ocr): migrer l'OCR de docTR (PyTorch) vers OnnxTR (ONNX Runtime) OnnxTR exécute les MÊMES modèles que docTR (db_resnet50 + crnn_vgg16_bn) sur ONNX Runtime, sans PyTorch. Corrige le crash torch/oneDNN « could not create a primitive » sur CPU contraint (VM 2 cœurs collaborateur : OCR scan impossible → quarantaine). Qualité identique validée empiriquement (CER 0,10-0,23 % vs docTR, 2 validations indépendantes Claude+Qwen), OCR ~2-3× plus rapide CPU. - core : import OnnxTR, _get_ocr_model(), _OCR_AVAILABLE, boucle OCR inchangée (API miroir) ; ONNXTR_CACHE_DIR pour le frozen ; bandeau de logs ENV au démarrage (OS, CPU+AVX, cœurs, RAM, versions, providers) pour retours terrain auto-suffisants. - 3 .spec : embarquent les poids ONNX OnnxTR (fail-closed) + hiddenimports onnxtr. - requirements : onnxtr[cpu] (python-doctr conservé transitoirement). - inclut le correctif quarantaine-visible du runner (GO Qwen). Tests : test_ocr_onnxtr.py (RED→GREEN), 95 unit passed, e2e scan client OK (OCR 5/5, PDF produit, plus de crash). Retrait torch du frozen + rebuild Windows = étapes suivantes (gates Dom). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-19 17:07:00 +02:00
Domi31tls	a6ee68a8a3	feat(gui): add GUI V6 G1 foundation (license client/store, shell, About tab) Socle de la refonte GUI V6 (couche présentation uniquement, aucune logique de détection) : - license_store: stockage licence hors dépôt (%LOCALAPPDATA%/Aivanov \| XDG), read/write atomique/delete, ne journalise aucun token - license_client: LicenseStatus + activate/check/local_status, session HTTP injectable, serveur indisponible géré sans crash, aucune clé privée - theme: 4 thèmes + couleurs de statut licence - app + tab_about: shell customtkinter minimal (header, bandeau licence, 3 onglets), onglet À propos étoffé - Pseudonymisation_Gui_V6.py: point d'entrée + --self-test (exit 0 sans fenêtre) - requirements.txt: customtkinter==5.2.2 Tests: 20 nouveaux (store sur vrais fichiers, client sur session injectée). Suite tests/unit: 167 passed, 0 régression. V5/moteur/managers/specs intacts. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 18:50:23 +02:00
Domi31tls	9163f45608	build(deps): ajoute pyahocorasick aux requirements (C-1 partiel) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-04 16:30:56 +02:00
Domi31tls	1fe0b73105	chore(deps): rendre python-doctr requis (OCR systématique) L'OCR est désormais une vraie dépendance et plus une option commentée : chaque page pauvre en texte natif doit pouvoir basculer sur docTR sans avoir à demander une installation manuelle. Cohérent avec la priorité qualité maximale sur la détection PII. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-27 16:17:41 +02:00
Domi31tls	8339069c83	Initial commit — Pseudonymisation de PDF v5 - GUI v5 : vue unique épurée (tkinter), 2 étapes visuelles - Core ONNX : anonymisation regex + NER optionnel - Extraction globale des noms depuis champs structurés (Patient, Rédigé par, MME/Madame, DR) - Génération simultanée PDF Image + PDF Anonymisé (structure préservée) - Build Windows via Nuitka (script batch + GitHub Actions CI) - install.sh pour setup/run Linux Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-16 15:03:37 +01:00

6 Commits