docs(coordination): rétrograde T-N (ONNX non bloquant) + T-O prioritaire

Vérif code : modèle custom embarqué dans l'EXE au build, autres modèles
téléchargés au 1er lancement. T-N → pérennité backup (priorité normale).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-05 09:46:02 +02:00
parent 04df0f41fa
commit 1bce7b40f4
2 changed files with 23 additions and 8 deletions

View File

@@ -23,7 +23,17 @@ $ git check-ignore -v models/camembert-bio-deid/onnx/model.onnx
```
`model.onnx` (440 Mo) est présent en local mais gitignoré via `models/`.
Un clone frais ne peut pas builder. C'est le sujet de T-N.
**CORRECTION (priorité abaissée par Dom)** : ce n'est PAS un bloquant. Vérifié :
- Le modèle custom `camembert-bio-deid` est **embarqué dans l'EXE au build** (`.spec`
datas l.23) — l'utilisateur final ne le télécharge pas.
- Les autres modèles (GLiNER, docTR, EDS-Pseudo) sont **téléchargés au 1er lancement**
depuis HuggingFace (cf. `launcher.py:466`, « opération unique 3-10 min »).
- La machine de build (192.168.1.11) **possède déjà** le `.onnx` (backupé).
Donc : ni la bêta ni le rebuild v11 ne sont bloqués. Le seul vrai sujet est la
**pérennité du backup** de ce modèle custom (non re-téléchargeable, c'est notre
fine-tune maison). T-N devient un job **priorité normale**, orienté sauvegarde + doc.
## Contexte — ce qui vient d'être fait (côté Claude)
@@ -36,13 +46,16 @@ Ne touche donc PAS au working tree / git / `.gitignore` (déjà traité).
---
## T-N — Plan de résolution du modèle ONNX manquant (docs only, lecture seule)
## T-N — Pérenniser le backup du modèle custom ONNX (docs only, lecture seule) — PRIORITÉ NORMALE
**Problème** : `models/camembert-bio-deid/onnx/model.onnx` (440 Mo) est requis au
build mais gitignoré → build non reproductible depuis un clone frais.
**Problème reformulé** : `models/camembert-bio-deid/onnx/model.onnx` (440 Mo) est
notre modèle fine-tuné maison, gitignoré et **non re-téléchargeable** depuis une
source publique. Pas de blocage build (cf. correction ci-dessus), mais **risque de
perte définitive** si la machine de build et son backup tombent. Objectif : garantir
la reproductibilité long terme et tracer la provenance.
**Objectif** : produire un plan de résolution comparant les options, sans rien
modifier dans le repo. Compare au minimum :
**Objectif** : produire un plan comparant les options, sans rien modifier dans le
repo. Compare au minimum :
1. **Git LFS** — versionner le `.onnx` via LFS. Évalue : taille repo Gitea,
support LFS sur l'instance Gitea locale (`localhost:3100`), impact clone.
@@ -90,7 +103,8 @@ avec un tableau final **GO / NO-GO** par section + verdict global.
## Priorité
T-N d'abord (bloquant reproductibilité build), puis T-O. Réponse dès que possible
aujourd'hui. Si tu manques de temps, T-N seule suffit pour débloquer.
**T-O d'abord** (validation go/no-go pack bêta — c'est le vrai chemin critique avant
livraison), puis T-N (pérennité backup modèle, priorité normale). Réponse dès que
possible aujourd'hui. Si tu manques de temps, T-O seule suffit pour la bêta.
— Claude

View File

@@ -51,3 +51,4 @@ Format : `YYYY-MM-DD HH:MM | AUTEUR | ACTION | RÉSUMÉ`
2026-06-04 14:44 | claude | VERIF tests | T-J passe seul (13 passed). Suite unitaires échoue sans pyahocorasick (Biarritz cas 009), puis passe avec pyahocorasick en venv temporaire (98 passed). `requirements.txt` complété avec pyahocorasick.
2026-06-04 17:00 | claude | ASSAINIT working tree | 6 commits sur feature/q1-quarantine-mvp : chore(rgpd) untrack 48 PII pdf_natif + gitignore RGPD/caches (9f4fe1b), deps pyahocorasick (4b1ab3a), feat batch/manual_masking (91a128d), tests F5/batch/manual/layouts (a02e89b), build(windows), docs(coordination). 48 PII supprimées du disque (~38 Mo). 98 tests unit verts. Restent hors scope : 6 PDF sources pdf_natif/ (gitignorés), rapport-campagne-gui untracked.
2026-06-04 17:05 | claude | ECRIT for-qwen | Nouveaux jobs T-N (plan résolution modèle ONNX gitignoré, 440 Mo, build non reproductible — compare Git LFS / script fetch / release asset / statu quo) + T-O (validation go/no-go pack bêta contre état réel du repo). Lecture seule, anti-conflit working tree.
2026-06-04 17:10 | claude | CORRIGE T-N | Décision Dom : le « bloquant ONNX » de T-L est FAUX. Vérif code : modèle custom camembert-bio embarqué dans l'EXE au build (.spec datas l.23), autres modèles (GLiNER/docTR/EDS) téléchargés au 1er lancement (launcher.py:466). Ni bêta ni rebuild v11 bloqués. T-N rétrogradé en priorité normale (pérennité backup modèle custom non re-téléchargeable). T-O passe en priorité (chemin critique bêta).