feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -60,7 +60,7 @@ RUE I-ADRESSE
|
||||
DE I-ADRESSE
|
||||
L I-ADRESSE
|
||||
HOPITAL I-ADRESSE
|
||||
Ville O
|
||||
Ville B-VILLE
|
||||
de O
|
||||
résidence: O
|
||||
DAX B-VILLE
|
||||
@@ -72,7 +72,7 @@ No: O
|
||||
Localisation: O
|
||||
NEURO-CHIRURGIE O
|
||||
Médecin O
|
||||
courant: O
|
||||
courant: B-VILLE
|
||||
DR. O
|
||||
Romain B-PER
|
||||
BILLON-GRAND I-PER
|
||||
@@ -153,7 +153,7 @@ Note O
|
||||
Aucune O
|
||||
donnée O
|
||||
renseignée O
|
||||
Signes O
|
||||
Signes B-VILLE
|
||||
vitaux O
|
||||
Item O
|
||||
de O
|
||||
@@ -512,7 +512,7 @@ particulières. O
|
||||
TDM O
|
||||
de O
|
||||
contrôle O
|
||||
vue O
|
||||
vue B-VILLE
|
||||
OK. O
|
||||
Donnait O
|
||||
le O
|
||||
@@ -528,7 +528,7 @@ difficultés O
|
||||
quo'n O
|
||||
identifie O
|
||||
à O
|
||||
son O
|
||||
son B-VILLE
|
||||
absence O
|
||||
quasi O
|
||||
complète O
|
||||
@@ -623,7 +623,7 @@ le O
|
||||
=> O
|
||||
Hospit O
|
||||
urg O
|
||||
DAX B-PER
|
||||
DAX O
|
||||
Glasgow O
|
||||
15, O
|
||||
pas O
|
||||
@@ -664,14 +664,14 @@ CHCB B-HOPITAL
|
||||
- O
|
||||
Atcd O
|
||||
: O
|
||||
pace O
|
||||
pace B-VILLE
|
||||
maker O
|
||||
intérrogé O
|
||||
par O
|
||||
Dr O
|
||||
LAWANI B-PER
|
||||
cardiologue O
|
||||
DAX B-PER
|
||||
DAX O
|
||||
: O
|
||||
RAS O
|
||||
Histoire O
|
||||
@@ -895,7 +895,7 @@ Note O
|
||||
Kinésithérapeute O
|
||||
Jose B-PER
|
||||
RECIO I-PER
|
||||
BERMUDEZ I-PER
|
||||
BERMUDEZ O
|
||||
28/03/2023 O
|
||||
13:25 O
|
||||
Note O
|
||||
@@ -994,7 +994,7 @@ supérieur O
|
||||
droit: O
|
||||
moins O
|
||||
de O
|
||||
force O
|
||||
force B-VILLE
|
||||
de O
|
||||
préhension O
|
||||
que O
|
||||
@@ -1030,7 +1030,7 @@ Transit: O
|
||||
a O
|
||||
eu O
|
||||
des O
|
||||
selles O
|
||||
selles B-VILLE
|
||||
normales O
|
||||
Pris O
|
||||
en O
|
||||
@@ -1414,8 +1414,8 @@ pré O
|
||||
op O
|
||||
ok, O
|
||||
bas O
|
||||
de O
|
||||
contention O
|
||||
de B-PER
|
||||
contention I-PER
|
||||
posé, O
|
||||
AJ O
|
||||
neuro O
|
||||
@@ -1715,7 +1715,7 @@ Devenir O
|
||||
: O
|
||||
Vient O
|
||||
de O
|
||||
DAX B-PER
|
||||
DAX B-VILLE
|
||||
habite O
|
||||
un O
|
||||
appartement O
|
||||
@@ -1763,8 +1763,8 @@ DR. O
|
||||
Estelle B-PER
|
||||
QUEANT I-PER
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -2241,9 +2241,9 @@ Normal O
|
||||
Emilie I-PER
|
||||
DI O
|
||||
LULLO B-PER
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
BAS I-PER
|
||||
DE I-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
Signé O
|
||||
@@ -2256,9 +2256,9 @@ Normal O
|
||||
Emilie I-PER
|
||||
DI O
|
||||
LULLO B-PER
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
BAS I-PER
|
||||
DE I-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
Signé O
|
||||
@@ -2712,7 +2712,7 @@ MAQUILLAGE, O
|
||||
PROTHESES, O
|
||||
VERNIS O
|
||||
A O
|
||||
ONGLES O
|
||||
ONGLES B-VILLE
|
||||
Réalisé O
|
||||
- O
|
||||
à O
|
||||
@@ -3181,7 +3181,7 @@ Page O
|
||||
8 O
|
||||
de O
|
||||
23 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -3316,8 +3316,8 @@ opératoire O
|
||||
Signé O
|
||||
— O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -3344,8 +3344,8 @@ presc.: O
|
||||
Signé O
|
||||
— O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -4308,8 +4308,8 @@ dose: O
|
||||
Signé O
|
||||
— O
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
DE B-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
- O
|
||||
@@ -4327,8 +4327,8 @@ Début: O
|
||||
Signé O
|
||||
— O
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
DE B-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
- O
|
||||
@@ -6548,7 +6548,7 @@ Page O
|
||||
15 O
|
||||
de O
|
||||
23 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -6685,8 +6685,8 @@ opératoire O
|
||||
Signé O
|
||||
— O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -6713,8 +6713,8 @@ presc.: O
|
||||
Signé O
|
||||
— O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -7677,8 +7677,8 @@ dose: O
|
||||
Signé O
|
||||
— O
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
DE B-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
- O
|
||||
@@ -7696,8 +7696,8 @@ Début: O
|
||||
Signé O
|
||||
— O
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
DE B-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
- O
|
||||
@@ -9378,7 +9378,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
26/03/2023 O
|
||||
Docteur O
|
||||
|
||||
Reference in New Issue
Block a user