feat: configuration externalisée via .env + audit requirements

- Externalise 13 variables de config via python-dotenv (chemins PDF,
  modèles Ollama/embedding/NER, FINESS, seuils) avec défauts identiques
- Centralise EMBEDDING_MODEL dans config.py (était hardcodé en 3 endroits)
- Ajoute .env.example documenté et .env au .gitignore
- Ajoute openpyxl et pandas manquants au requirements.txt
- Ajoute data/referentiels au mkdir de run.sh

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
dom
2026-02-13 19:46:33 +01:00
parent c838d75174
commit aa397d5360
7 changed files with 55 additions and 18 deletions

22
.env.example Normal file
View File

@@ -0,0 +1,22 @@
# === Référentiels PDF (chemins absolus vers les PDFs ATIH) ===
# T2A_CIM10_PDF=/chemin/vers/cim-10-fr.pdf
# T2A_GUIDE_METHODO_PDF=/chemin/vers/guide_methodo_mco.pdf
# T2A_CCAM_PDF=/chemin/vers/ccam_descriptive.pdf
# === Ollama ===
# OLLAMA_URL=http://localhost:11434
# OLLAMA_MODEL=gemma3:12b
# OLLAMA_TIMEOUT=120
# OLLAMA_MAX_PARALLEL=2
# === Modèles IA ===
# T2A_EMBEDDING_MODEL=dangvantuan/sentence-camembert-large
# T2A_NER_MODEL=Jean-Baptiste/camembert-ner
# T2A_NER_THRESHOLD=0.80
# === Établissement ===
# T2A_FINESS=000000000
# T2A_NUM_UM=0000
# === Anonymisation ===
# T2A_KEEP_ESTABLISHMENT=True