feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -63,7 +63,7 @@ PETIT O
|
||||
BASQUE O
|
||||
APT O
|
||||
77 O
|
||||
Ville O
|
||||
Ville B-VILLE
|
||||
de O
|
||||
résidence: O
|
||||
BAYONNE B-VILLE
|
||||
@@ -215,7 +215,7 @@ Motif O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
Dyspnée O
|
||||
Observ. O
|
||||
IDE O
|
||||
@@ -238,14 +238,14 @@ Date O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
médicale O
|
||||
26/05/2023 O
|
||||
Heure O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
médicale O
|
||||
20:12 O
|
||||
CCMU O
|
||||
@@ -380,7 +380,7 @@ Note O
|
||||
Aucune O
|
||||
donnée O
|
||||
renseignée O
|
||||
Signes O
|
||||
Signes B-VILLE
|
||||
vitaux O
|
||||
Item O
|
||||
de O
|
||||
@@ -840,7 +840,7 @@ sat O
|
||||
(améliorée O
|
||||
par O
|
||||
une O
|
||||
bonne O
|
||||
bonne B-VILLE
|
||||
ventilation) O
|
||||
Probable O
|
||||
hypoventilation O
|
||||
@@ -962,7 +962,7 @@ sa O
|
||||
respiration, O
|
||||
a O
|
||||
retrouver O
|
||||
"son O
|
||||
"son B-VILLE
|
||||
état O
|
||||
antérieur" O
|
||||
28/05/2023 O
|
||||
@@ -1046,8 +1046,8 @@ LP O
|
||||
cp O
|
||||
le O
|
||||
soir O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400mg O
|
||||
1-0-2 O
|
||||
RIsperdal O
|
||||
@@ -1058,8 +1058,8 @@ injection O
|
||||
tous O
|
||||
les O
|
||||
15jours O
|
||||
Parkinane O
|
||||
LP O
|
||||
Parkinane B-PER
|
||||
LP I-PER
|
||||
5mg O
|
||||
1-0-2 O
|
||||
Lexomil O
|
||||
@@ -1075,7 +1075,7 @@ depuis O
|
||||
15h, O
|
||||
a O
|
||||
vu O
|
||||
son O
|
||||
son B-VILLE
|
||||
médecin O
|
||||
traitant O
|
||||
cet O
|
||||
@@ -1313,7 +1313,7 @@ ECG O
|
||||
de O
|
||||
contrôle O
|
||||
- O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
de O
|
||||
contrôle O
|
||||
ds O
|
||||
@@ -1403,8 +1403,8 @@ LP O
|
||||
cp O
|
||||
le O
|
||||
soir O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400mg O
|
||||
1-0-2 O
|
||||
RIsperdal O
|
||||
@@ -1415,8 +1415,8 @@ injection O
|
||||
tous O
|
||||
les O
|
||||
15jours O
|
||||
Parkinane O
|
||||
LP O
|
||||
Parkinane B-PER
|
||||
LP I-PER
|
||||
5mg O
|
||||
1-0-2 O
|
||||
Lexomil O
|
||||
@@ -1432,7 +1432,7 @@ naissance: I-DATE_NAISSANCE
|
||||
26/04/1960 I-DATE_NAISSANCE
|
||||
(BA065989 I-DATE_NAISSANCE
|
||||
) O
|
||||
Episode B-PER
|
||||
Episode O
|
||||
N.: O
|
||||
23102874 B-NDA
|
||||
( O
|
||||
@@ -1459,7 +1459,7 @@ depuis O
|
||||
15h, O
|
||||
a O
|
||||
vu O
|
||||
son O
|
||||
son B-VILLE
|
||||
médecin O
|
||||
traitant O
|
||||
cet O
|
||||
@@ -1613,8 +1613,8 @@ Psychiatrie O
|
||||
Item O
|
||||
de O
|
||||
surveillance O
|
||||
30/05/2023 B-DATE_NAISSANCE
|
||||
08:08 I-DATE_NAISSANCE
|
||||
30/05/2023 O
|
||||
08:08 O
|
||||
29/05/2023 O
|
||||
23:30 O
|
||||
29/05/2023 O
|
||||
@@ -1741,8 +1741,8 @@ Note O
|
||||
IDE O
|
||||
Virginie B-PER
|
||||
VIVIER I-PER
|
||||
30/05/2023 B-DATE_NAISSANCE
|
||||
00:15 I-DATE_NAISSANCE
|
||||
30/05/2023 O
|
||||
00:15 O
|
||||
devenir: O
|
||||
possible O
|
||||
sorti O
|
||||
@@ -1892,7 +1892,7 @@ diminuée O
|
||||
à O
|
||||
2L O
|
||||
car O
|
||||
bonne O
|
||||
bonne B-VILLE
|
||||
sat O
|
||||
et O
|
||||
patiente O
|
||||
@@ -1993,8 +1993,8 @@ PHTISIOLOGIE O
|
||||
HC O
|
||||
) O
|
||||
Le O
|
||||
30/05/2023 B-DATE_NAISSANCE
|
||||
14:55 I-DATE_NAISSANCE
|
||||
30/05/2023 O
|
||||
14:55 O
|
||||
Page O
|
||||
5 O
|
||||
de O
|
||||
@@ -2038,8 +2038,8 @@ des O
|
||||
prescriptions: O
|
||||
Réalisé O
|
||||
SODIUM O
|
||||
CHL O
|
||||
MACO O
|
||||
CHL B-PER
|
||||
MACO I-PER
|
||||
0,9% O
|
||||
INJ O
|
||||
PP O
|
||||
@@ -2161,7 +2161,7 @@ et O
|
||||
respiration O
|
||||
sifflante O
|
||||
à O
|
||||
son O
|
||||
son B-VILLE
|
||||
entrée O
|
||||
Aérosol O
|
||||
en O
|
||||
@@ -2210,7 +2210,7 @@ sous O
|
||||
d'O2 O
|
||||
Aérosols O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
Cortico O
|
||||
selon O
|
||||
PM O
|
||||
@@ -2281,7 +2281,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
300 O
|
||||
@@ -2299,7 +2299,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
41.666666666666664 O
|
||||
@@ -2390,8 +2390,8 @@ Page O
|
||||
6 O
|
||||
de O
|
||||
17 O
|
||||
BROMAZEPAM O
|
||||
CRT O
|
||||
BROMAZEPAM B-PER
|
||||
CRT I-PER
|
||||
6MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2410,8 +2410,8 @@ Normal O
|
||||
DR. O
|
||||
Perrine B-PER
|
||||
RAVASSE I-PER
|
||||
BROMAZEPAM O
|
||||
CRT O
|
||||
BROMAZEPAM I-PER
|
||||
CRT I-PER
|
||||
6MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2451,9 +2451,9 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
PARKINANE O
|
||||
LP B-PER
|
||||
5MG I-PER
|
||||
PARKINANE I-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
[20] O
|
||||
Gelule(s) O
|
||||
@@ -2470,9 +2470,9 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
PARKINANE O
|
||||
LP B-PER
|
||||
5MG I-PER
|
||||
PARKINANE I-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
[20] O
|
||||
Gelule(s) O
|
||||
@@ -2505,8 +2505,8 @@ Normal O
|
||||
12:04 B-PER
|
||||
Alexia I-PER
|
||||
ANDRE I-PER
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2524,8 +2524,8 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2543,8 +2543,8 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
TERALITHE O
|
||||
LP O
|
||||
TERALITHE I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[60] O
|
||||
@@ -2562,8 +2562,8 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
TRAMADOL O
|
||||
ARW O
|
||||
TRAMADOL I-PER
|
||||
ARW I-PER
|
||||
50MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2627,9 +2627,9 @@ Normal O
|
||||
DR. O
|
||||
Elise B-PER
|
||||
ABRAHAM I-PER
|
||||
PARKINANE O
|
||||
LP B-PER
|
||||
5MG I-PER
|
||||
PARKINANE I-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
[20] O
|
||||
Gelule(s) O
|
||||
@@ -2646,9 +2646,9 @@ Normal O
|
||||
DR. O
|
||||
Perrine B-PER
|
||||
RAVASSE I-PER
|
||||
PARKINANE O
|
||||
LP B-PER
|
||||
5MG I-PER
|
||||
PARKINANE I-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
[20] O
|
||||
Gelule(s) O
|
||||
@@ -2665,8 +2665,8 @@ Normal O
|
||||
DR. O
|
||||
Perrine B-PER
|
||||
RAVASSE I-PER
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2684,8 +2684,8 @@ Normal O
|
||||
DR. O
|
||||
Perrine B-PER
|
||||
RAVASSE I-PER
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[30] O
|
||||
@@ -2703,8 +2703,8 @@ Normal O
|
||||
DR. O
|
||||
Perrine B-PER
|
||||
RAVASSE I-PER
|
||||
TERALITHE O
|
||||
LP O
|
||||
TERALITHE I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[60] O
|
||||
@@ -2823,8 +2823,8 @@ Sortie O
|
||||
12:06 B-PER
|
||||
Alexia I-PER
|
||||
ANDRE I-PER
|
||||
TERALITHE O
|
||||
LP O
|
||||
TERALITHE I-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
[60] O
|
||||
@@ -2958,8 +2958,8 @@ Statut O
|
||||
des O
|
||||
prescriptions: O
|
||||
Signé O
|
||||
SPIRIVA O
|
||||
RESPIMAT B-PER
|
||||
SPIRIVA B-PER
|
||||
RESPIMAT I-PER
|
||||
2,5MCG O
|
||||
SOL O
|
||||
PR O
|
||||
@@ -2967,8 +2967,8 @@ INHAL O
|
||||
[60] O
|
||||
DISPOSITIF O
|
||||
INHALATEUR(s) O
|
||||
SPIRIVA O
|
||||
RESPIMAT B-PER
|
||||
SPIRIVA B-PER
|
||||
RESPIMAT I-PER
|
||||
2,5MCG O
|
||||
SOL O
|
||||
PR O
|
||||
@@ -2988,8 +2988,8 @@ Statut O
|
||||
des O
|
||||
prescriptions: O
|
||||
Arrêté O
|
||||
IPRATROPIUM O
|
||||
AGT O
|
||||
IPRATROPIUM B-PER
|
||||
AGT I-PER
|
||||
0,5MG/2ML O
|
||||
AD O
|
||||
INHAL O
|
||||
@@ -3016,8 +3016,8 @@ Statut O
|
||||
des O
|
||||
prescriptions: O
|
||||
Réalisé O
|
||||
IPRATROPIUM O
|
||||
AGT O
|
||||
IPRATROPIUM B-PER
|
||||
AGT I-PER
|
||||
0,5MG/2ML O
|
||||
AD O
|
||||
INHAL O
|
||||
@@ -3184,7 +3184,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
6 O
|
||||
@@ -3227,7 +3227,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
7.5 O
|
||||
@@ -3382,8 +3382,8 @@ CPR O
|
||||
ORODISP O
|
||||
[20] O
|
||||
COMPRIME(S) O
|
||||
SPIRIVA O
|
||||
RESPIMAT B-PER
|
||||
SPIRIVA B-PER
|
||||
RESPIMAT I-PER
|
||||
2,5MCG O
|
||||
SOL O
|
||||
PR O
|
||||
@@ -3403,9 +3403,9 @@ IRIBARREN I-PER
|
||||
Emma I-PER
|
||||
IRIBARREN I-PER
|
||||
29/05/2023 O
|
||||
21:15 O
|
||||
Marie O
|
||||
Pierre B-PER
|
||||
21:15 B-PER
|
||||
Marie I-PER
|
||||
Pierre I-PER
|
||||
LORDA I-PER
|
||||
Emma I-PER
|
||||
IRIBARREN I-PER
|
||||
@@ -3583,7 +3583,7 @@ Page O
|
||||
9 O
|
||||
de O
|
||||
17 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -3605,8 +3605,8 @@ Soir O
|
||||
(21h-07h) O
|
||||
Signé O
|
||||
— O
|
||||
SPIRIVA O
|
||||
RESPIMAT B-PER
|
||||
SPIRIVA B-PER
|
||||
RESPIMAT I-PER
|
||||
2,5MCG O
|
||||
SOL O
|
||||
PR O
|
||||
@@ -3904,8 +3904,8 @@ dose: O
|
||||
19:00 O
|
||||
Signé O
|
||||
— O
|
||||
PARKINANE O
|
||||
LP O
|
||||
PARKINANE B-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
- O
|
||||
@@ -4171,8 +4171,8 @@ de O
|
||||
17 O
|
||||
Signé O
|
||||
— O
|
||||
PARKINANE O
|
||||
LP O
|
||||
PARKINANE B-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
- O
|
||||
@@ -4195,8 +4195,8 @@ dose: O
|
||||
08:00 O
|
||||
Signé O
|
||||
— O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400 O
|
||||
MG O
|
||||
CPR O
|
||||
@@ -4220,8 +4220,8 @@ dose: O
|
||||
21:00 O
|
||||
Signé O
|
||||
— O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400 O
|
||||
MG O
|
||||
CPR O
|
||||
@@ -4245,8 +4245,8 @@ dose: O
|
||||
08:00 O
|
||||
Signé O
|
||||
— O
|
||||
TERALITHE O
|
||||
LP O
|
||||
TERALITHE B-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -4269,8 +4269,8 @@ dose: O
|
||||
19:00 O
|
||||
Signé O
|
||||
— O
|
||||
TRAMADOL O
|
||||
ARW O
|
||||
TRAMADOL B-PER
|
||||
ARW I-PER
|
||||
50MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -4299,8 +4299,8 @@ si O
|
||||
douleur O
|
||||
Signé O
|
||||
— O
|
||||
TRAMADOL O
|
||||
ARW O
|
||||
TRAMADOL B-PER
|
||||
ARW I-PER
|
||||
50MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -4790,7 +4790,7 @@ Page O
|
||||
12 O
|
||||
de O
|
||||
17 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -4814,8 +4814,8 @@ Soir O
|
||||
(21h-07h) O
|
||||
Signé O
|
||||
— O
|
||||
SPIRIVA O
|
||||
RESPIMAT B-PER
|
||||
SPIRIVA B-PER
|
||||
RESPIMAT I-PER
|
||||
2,5MCG O
|
||||
SOL O
|
||||
PR O
|
||||
@@ -5113,8 +5113,8 @@ dose: O
|
||||
19:00 O
|
||||
Signé O
|
||||
— O
|
||||
PARKINANE O
|
||||
LP O
|
||||
PARKINANE B-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
- O
|
||||
@@ -5380,8 +5380,8 @@ de O
|
||||
17 O
|
||||
Signé O
|
||||
— O
|
||||
PARKINANE O
|
||||
LP O
|
||||
PARKINANE B-PER
|
||||
LP I-PER
|
||||
5MG O
|
||||
GELULE O
|
||||
- O
|
||||
@@ -5428,8 +5428,8 @@ dose: O
|
||||
08:00 O
|
||||
Signé O
|
||||
— O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400 O
|
||||
MG O
|
||||
CPR O
|
||||
@@ -5453,8 +5453,8 @@ dose: O
|
||||
21:00 O
|
||||
Signé O
|
||||
— O
|
||||
TEGRETOL O
|
||||
LP O
|
||||
TEGRETOL B-PER
|
||||
LP I-PER
|
||||
400 O
|
||||
MG O
|
||||
CPR O
|
||||
@@ -5478,8 +5478,8 @@ dose: O
|
||||
08:00 O
|
||||
Signé O
|
||||
— O
|
||||
TERALITHE O
|
||||
LP O
|
||||
TERALITHE B-PER
|
||||
LP I-PER
|
||||
400MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -5502,8 +5502,8 @@ dose: O
|
||||
19:00 O
|
||||
Signé O
|
||||
— O
|
||||
TRAMADOL O
|
||||
ARW O
|
||||
TRAMADOL B-PER
|
||||
ARW I-PER
|
||||
50MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -5532,8 +5532,8 @@ si O
|
||||
douleur O
|
||||
Signé O
|
||||
— O
|
||||
TRAMADOL O
|
||||
ARW O
|
||||
TRAMADOL B-PER
|
||||
ARW I-PER
|
||||
50MG O
|
||||
CPR O
|
||||
- O
|
||||
@@ -6021,7 +6021,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
26/05/2023 O
|
||||
Docteur O
|
||||
|
||||
Reference in New Issue
Block a user