feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -59,7 +59,7 @@ Adresse: O
|
||||
RUE I-ADRESSE
|
||||
DES I-ADRESSE
|
||||
CHASSEURS I-ADRESSE
|
||||
Ville O
|
||||
Ville B-VILLE
|
||||
de O
|
||||
résidence: O
|
||||
BOUCAU B-VILLE
|
||||
@@ -158,7 +158,7 @@ Note O
|
||||
Aucune O
|
||||
donnée O
|
||||
renseignée O
|
||||
Signes O
|
||||
Signes B-VILLE
|
||||
vitaux O
|
||||
Item O
|
||||
de O
|
||||
@@ -945,7 +945,7 @@ traité O
|
||||
par O
|
||||
FUROSEMIDE O
|
||||
Appel O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
5h O
|
||||
du O
|
||||
matin O
|
||||
@@ -1187,7 +1187,7 @@ sinusal O
|
||||
58/min O
|
||||
pas O
|
||||
de O
|
||||
sus O
|
||||
sus B-VILLE
|
||||
ou O
|
||||
sousdecalage O
|
||||
ST O
|
||||
@@ -1593,7 +1593,7 @@ et O
|
||||
demain O
|
||||
-> O
|
||||
Contrôle O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
lundi O
|
||||
16/09/2023 O
|
||||
12:13 O
|
||||
@@ -1616,7 +1616,7 @@ fievre O
|
||||
depuis O
|
||||
cette O
|
||||
nuit O
|
||||
bonne O
|
||||
bonne B-VILLE
|
||||
diurese O
|
||||
(1l O
|
||||
par O
|
||||
@@ -1651,7 +1651,7 @@ bicar O
|
||||
ECBU: O
|
||||
candida O
|
||||
albicans O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
de O
|
||||
contrôle O
|
||||
demain O
|
||||
@@ -1798,7 +1798,7 @@ aux O
|
||||
alentours O
|
||||
de O
|
||||
150 O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
du O
|
||||
11/9: O
|
||||
creat O
|
||||
@@ -2760,7 +2760,7 @@ claires O
|
||||
12h O
|
||||
( O
|
||||
appareillage O
|
||||
changé O
|
||||
changé B-VILLE
|
||||
) O
|
||||
ELIMINATION O
|
||||
VB O
|
||||
@@ -2969,7 +2969,7 @@ COUDERC I-PER
|
||||
15:38 O
|
||||
Note O
|
||||
IDE O
|
||||
Agnes B-PER
|
||||
Agnes O
|
||||
SAINT- O
|
||||
GERMES O
|
||||
17/09/2023 O
|
||||
@@ -3152,7 +3152,7 @@ pas O
|
||||
de O
|
||||
fièvre O
|
||||
contrôle O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
le O
|
||||
18/09 O
|
||||
fait O
|
||||
@@ -3297,7 +3297,7 @@ COUDERC I-PER
|
||||
15:19 O
|
||||
Note O
|
||||
IDE O
|
||||
Agnes B-PER
|
||||
Agnes O
|
||||
SAINT- O
|
||||
GERMES O
|
||||
16/09/2023 O
|
||||
@@ -3698,7 +3698,7 @@ ARGANO I-PER
|
||||
01:10 O
|
||||
Note O
|
||||
IDE O
|
||||
Agnes B-PER
|
||||
Agnes O
|
||||
SAINT- O
|
||||
GERMES O
|
||||
13/09/2023 O
|
||||
@@ -3934,7 +3934,7 @@ ATF O
|
||||
aec O
|
||||
dose O
|
||||
de O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
en O
|
||||
SSPI O
|
||||
-ATB O
|
||||
@@ -3952,7 +3952,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
10 O
|
||||
@@ -4052,8 +4052,8 @@ VFO O
|
||||
[1] O
|
||||
POCHE(S) O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -4098,10 +4098,10 @@ Statut O
|
||||
des O
|
||||
prescriptions: O
|
||||
En O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
SODIUM O
|
||||
BIC O
|
||||
BAX O
|
||||
BIC B-PER
|
||||
BAX I-PER
|
||||
1,4% O
|
||||
POC O
|
||||
CFX O
|
||||
@@ -4110,8 +4110,8 @@ V1 O
|
||||
[1] O
|
||||
POCHE(S) O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -4119,8 +4119,8 @@ PP O
|
||||
[1] O
|
||||
POCHE(S) O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -4168,7 +4168,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
200 O
|
||||
@@ -4189,7 +4189,7 @@ DRAY I-PER
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
41.666666666666664 O
|
||||
@@ -4223,7 +4223,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
200 O
|
||||
@@ -4250,7 +4250,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
96 O
|
||||
@@ -4312,7 +4312,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
41.666666666666664 O
|
||||
@@ -4337,7 +4337,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
41.666666666666664 O
|
||||
@@ -4362,7 +4362,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
20.833333333333332 O
|
||||
@@ -4602,8 +4602,8 @@ de O
|
||||
KARDEGIC O
|
||||
75MG O
|
||||
PDR O
|
||||
ORALE O
|
||||
SACHET O
|
||||
ORALE B-PER
|
||||
SACHET I-PER
|
||||
[30] O
|
||||
Sachet(s) O
|
||||
1 O
|
||||
@@ -4622,8 +4622,8 @@ DRAY I-PER
|
||||
KARDEGIC O
|
||||
75MG O
|
||||
PDR O
|
||||
ORALE O
|
||||
SACHET O
|
||||
ORALE B-PER
|
||||
SACHET I-PER
|
||||
[30] O
|
||||
Sachet(s) O
|
||||
1 O
|
||||
@@ -5616,8 +5616,8 @@ DURANTEAU I-PER
|
||||
KARDEGIC O
|
||||
75MG O
|
||||
PDR O
|
||||
ORALE O
|
||||
SACHET O
|
||||
ORALE B-PER
|
||||
SACHET I-PER
|
||||
[30] O
|
||||
Sachet(s) O
|
||||
1 O
|
||||
@@ -5862,7 +5862,7 @@ Page O
|
||||
13 O
|
||||
de O
|
||||
27 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -7590,7 +7590,7 @@ Page O
|
||||
17 O
|
||||
de O
|
||||
27 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -9019,7 +9019,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
19/09/2023 O
|
||||
Docteur O
|
||||
@@ -9220,7 +9220,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
19/09/2023 O
|
||||
Docteur O
|
||||
@@ -9547,7 +9547,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
21/09/2023 O
|
||||
Docteur O
|
||||
@@ -9652,7 +9652,7 @@ d'épanchement O
|
||||
pleural O
|
||||
de O
|
||||
faible O
|
||||
abondance O
|
||||
abondance B-VILLE
|
||||
basale O
|
||||
gauche. O
|
||||
Cardiomégalie. O
|
||||
@@ -10583,7 +10583,7 @@ aux O
|
||||
alentours O
|
||||
de O
|
||||
150 O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
du O
|
||||
11/9: O
|
||||
creat O
|
||||
@@ -10731,7 +10731,7 @@ fievre O
|
||||
depuis O
|
||||
cette O
|
||||
nuit O
|
||||
bonne O
|
||||
bonne B-VILLE
|
||||
diurese O
|
||||
(1l O
|
||||
par O
|
||||
@@ -10766,7 +10766,7 @@ bicar O
|
||||
ECBU: O
|
||||
candida O
|
||||
albicans O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
de O
|
||||
contrôle O
|
||||
demain O
|
||||
@@ -10794,7 +10794,7 @@ et O
|
||||
demain O
|
||||
-> O
|
||||
Contrôle O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
lundi O
|
||||
19/09/2023 O
|
||||
10:54 O
|
||||
@@ -11126,7 +11126,7 @@ sinusal O
|
||||
58/min O
|
||||
pas O
|
||||
de O
|
||||
sus O
|
||||
sus B-VILLE
|
||||
ou O
|
||||
sousdecalage O
|
||||
ST O
|
||||
@@ -11185,7 +11185,7 @@ pas O
|
||||
de O
|
||||
douleur O
|
||||
thoracique O
|
||||
bio: O
|
||||
bio: B-VILLE
|
||||
iono O
|
||||
stable, O
|
||||
creat O
|
||||
@@ -11308,7 +11308,7 @@ traité O
|
||||
par O
|
||||
FUROSEMIDE O
|
||||
Appel O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
5h O
|
||||
du O
|
||||
matin O
|
||||
@@ -11542,8 +11542,8 @@ matin O
|
||||
KARDEGIC O
|
||||
75MG O
|
||||
PDR O
|
||||
ORALE O
|
||||
SACHET O
|
||||
ORALE B-PER
|
||||
SACHET I-PER
|
||||
[30] O
|
||||
Sachet(s) O
|
||||
1 O
|
||||
@@ -11676,7 +11676,7 @@ transfert O
|
||||
l'USIC O
|
||||
Fait O
|
||||
à O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
21/09/2023 O
|
||||
à O
|
||||
|
||||
Reference in New Issue
Block a user