Files
anonymisation/requirements.txt
Domi31tls 1fe0b73105 chore(deps): rendre python-doctr requis (OCR systématique)
L'OCR est désormais une vraie dépendance et plus une option commentée :
chaque page pauvre en texte natif doit pouvoir basculer sur docTR sans
avoir à demander une installation manuelle. Cohérent avec la priorité
qualité maximale sur la détection PII.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-27 16:17:41 +02:00

36 lines
771 B
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# --- NER ONNX (CPU) ---
onnxruntime>=1.18.0
optimum[onnxruntime]>=2.0.0
transformers>=4.42.0
tokenizers>=0.19.0
sentencepiece>=0.2.0,<0.3
onnx>=1.16.0
# --- Core PDF & utilitaires ---
pymupdf==1.24.9
pdfplumber==0.11.5
pdfminer.six==20231228
Pillow==10.2.0
PyYAML==6.0.2
# (optionnel uniquement si tu utilises la voie PyTorch ailleurs)
# torch==2.3.1
# huggingface_hub==0.23.4
# --- OCR pour PDF scannés ---
python-doctr[torch]>=0.9.0
# (optionnel NER clinique EDS-Pseudo AP-HP, activer manuellement)
# edsnlp[ml]>=0.12.0
# (optionnel thème système natif pour la GUI v5)
# sv_ttk>=2.6
# (optionnel compilation en .exe natif via Nuitka)
# nuitka
# orderedset
# zstandard
# (optionnel si tu gardes spaCy dans d'autres chemins)
# spacy==3.7.4