feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -56,9 +56,9 @@ naissance: O
|
||||
DAX B-VILLE
|
||||
Nationalité: O
|
||||
FRANCE O
|
||||
Code O
|
||||
Postal: O
|
||||
40465 B-ZIP
|
||||
Code B-ZIP
|
||||
Postal: I-ZIP
|
||||
40465 I-ZIP
|
||||
Adresse: O
|
||||
55 B-ADRESSE
|
||||
RUE I-ADRESSE
|
||||
@@ -150,7 +150,7 @@ Personne O
|
||||
à O
|
||||
prévenir O
|
||||
(Trakcare) O
|
||||
Mère O
|
||||
Mère B-VILLE
|
||||
desert B-PER
|
||||
lacay I-PER
|
||||
hélène I-PER
|
||||
@@ -360,16 +360,16 @@ pour O
|
||||
le O
|
||||
retrait O
|
||||
de O
|
||||
la O
|
||||
garde O
|
||||
la B-VILLE
|
||||
garde I-VILLE
|
||||
de O
|
||||
son O
|
||||
son B-VILLE
|
||||
fils. O
|
||||
possible O
|
||||
deficit O
|
||||
en O
|
||||
carnitine O
|
||||
CONTRE O
|
||||
CONTRE B-VILLE
|
||||
INDICATIONS O
|
||||
pivmecillinam O
|
||||
Anomalie O
|
||||
@@ -377,7 +377,7 @@ du O
|
||||
métabolisme O
|
||||
des O
|
||||
acides O
|
||||
gras O
|
||||
gras B-VILLE
|
||||
Dysurie O
|
||||
tep O
|
||||
scan O
|
||||
@@ -393,14 +393,14 @@ précision O
|
||||
Fibromyalgie O
|
||||
Péricardite O
|
||||
au O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
d'autres O
|
||||
maladies O
|
||||
classées O
|
||||
ailleurs O
|
||||
(dont O
|
||||
au O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
lupus O
|
||||
érythémateux O
|
||||
disséminé, O
|
||||
@@ -477,7 +477,7 @@ DENT O
|
||||
DE O
|
||||
SAGESSE O
|
||||
AERATEUR O
|
||||
TRANS O
|
||||
TRANS B-VILLE
|
||||
TYMPANIQUE O
|
||||
Antécédents O
|
||||
Familiaux O
|
||||
@@ -839,7 +839,7 @@ compétence O
|
||||
du O
|
||||
CH O
|
||||
de O
|
||||
Perpignan. O
|
||||
Perpignan. B-VILLE
|
||||
Elle O
|
||||
présente O
|
||||
en O
|
||||
@@ -883,7 +883,7 @@ familiaux O
|
||||
de O
|
||||
maladie O
|
||||
d’Ehler-Danlos O
|
||||
(mère, O
|
||||
(mère, B-VILLE
|
||||
grand-mère, O
|
||||
oncle O
|
||||
et O
|
||||
@@ -967,7 +967,7 @@ DE O
|
||||
ALMEIDA, O
|
||||
CH O
|
||||
de O
|
||||
DAX) O
|
||||
DAX) B-VILLE
|
||||
: O
|
||||
Pas O
|
||||
de O
|
||||
@@ -1026,7 +1026,7 @@ nodulaire O
|
||||
de O
|
||||
la O
|
||||
dernière O
|
||||
anse, O
|
||||
anse, B-VILLE
|
||||
sans O
|
||||
caractère O
|
||||
pathologique O
|
||||
@@ -1429,18 +1429,18 @@ attente O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
au O
|
||||
CHU O
|
||||
de O
|
||||
Toulouse O
|
||||
Toulouse B-VILLE
|
||||
La O
|
||||
patiente O
|
||||
a O
|
||||
été O
|
||||
adressé O
|
||||
par O
|
||||
son O
|
||||
son B-VILLE
|
||||
médecin O
|
||||
traitant O
|
||||
au O
|
||||
@@ -1501,7 +1501,7 @@ palpation O
|
||||
de O
|
||||
l'abdomen O
|
||||
dans O
|
||||
son O
|
||||
son B-VILLE
|
||||
ensemble O
|
||||
sans O
|
||||
defense. O
|
||||
@@ -1607,8 +1607,8 @@ leucocyturie O
|
||||
Imagerie O
|
||||
: O
|
||||
TDM O
|
||||
TAP O
|
||||
IV O
|
||||
TAP B-PER
|
||||
IV I-PER
|
||||
: O
|
||||
Pas O
|
||||
d'anomalie O
|
||||
@@ -1668,8 +1668,8 @@ de O
|
||||
déficit O
|
||||
humoral. O
|
||||
Sur O
|
||||
le O
|
||||
plan O
|
||||
le B-VILLE
|
||||
plan I-VILLE
|
||||
immunitaire O
|
||||
: O
|
||||
Patient: O
|
||||
@@ -1807,13 +1807,13 @@ pour O
|
||||
le O
|
||||
tenir O
|
||||
au O
|
||||
courant O
|
||||
courant B-VILLE
|
||||
de O
|
||||
cette O
|
||||
décision. O
|
||||
Sur O
|
||||
le O
|
||||
plan O
|
||||
plan B-VILLE
|
||||
hématologique: O
|
||||
Elle O
|
||||
présente O
|
||||
@@ -2346,7 +2346,7 @@ tout O
|
||||
petit O
|
||||
peu O
|
||||
de O
|
||||
selles O
|
||||
selles B-VILLE
|
||||
Duphalac O
|
||||
prescrit O
|
||||
et O
|
||||
@@ -2371,7 +2371,7 @@ sérologie O
|
||||
+ O
|
||||
prescription O
|
||||
de O
|
||||
Bordeaux O
|
||||
Bordeaux B-VILLE
|
||||
à O
|
||||
faire O
|
||||
demain O
|
||||
@@ -2405,7 +2405,7 @@ pas O
|
||||
allée O
|
||||
à O
|
||||
la O
|
||||
selles O
|
||||
selles B-VILLE
|
||||
depuis O
|
||||
9 O
|
||||
jours. O
|
||||
@@ -2661,7 +2661,7 @@ fois O
|
||||
11:42 O
|
||||
Voie O
|
||||
d`administration: O
|
||||
VAGINALE O
|
||||
VAGINALE B-PER
|
||||
Statut O
|
||||
des O
|
||||
prescriptions: O
|
||||
@@ -3016,7 +3016,7 @@ Page O
|
||||
7 O
|
||||
de O
|
||||
17 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -4125,7 +4125,7 @@ Page O
|
||||
10 O
|
||||
de O
|
||||
17 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -5154,7 +5154,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
01/03/2023 O
|
||||
Docteur O
|
||||
|
||||
Reference in New Issue
Block a user