feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -72,7 +72,7 @@ Localisation: O
|
||||
NEUROLOGIE O
|
||||
B4 O
|
||||
Médecin O
|
||||
courant: O
|
||||
courant: B-VILLE
|
||||
DR. O
|
||||
Antoine B-PER
|
||||
SOULAGES I-PER
|
||||
@@ -177,7 +177,7 @@ Motif O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
Céphalées O
|
||||
venu O
|
||||
au O
|
||||
@@ -202,7 +202,7 @@ Hier O
|
||||
un O
|
||||
Neurologue O
|
||||
en O
|
||||
ville O
|
||||
ville B-VILLE
|
||||
, O
|
||||
TTT O
|
||||
par O
|
||||
@@ -256,14 +256,14 @@ Date O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
médicale O
|
||||
15/04/2023 O
|
||||
Heure O
|
||||
de O
|
||||
prise O
|
||||
en O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
médicale O
|
||||
12:27 O
|
||||
CCMU O
|
||||
@@ -411,7 +411,7 @@ Note O
|
||||
Aucune O
|
||||
donnée O
|
||||
renseignée O
|
||||
Signes O
|
||||
Signes B-VILLE
|
||||
vitaux O
|
||||
Item O
|
||||
de O
|
||||
@@ -858,7 +858,7 @@ DESCLAUX B-PER
|
||||
Dr O
|
||||
HEBERT B-PER
|
||||
(neurologue, O
|
||||
Anglet) O
|
||||
Anglet) B-VILLE
|
||||
1 O
|
||||
épisode O
|
||||
de O
|
||||
@@ -891,7 +891,7 @@ Etudiant O
|
||||
en O
|
||||
BTS O
|
||||
à O
|
||||
Bayonne O
|
||||
Bayonne B-VILLE
|
||||
Céphalées O
|
||||
ictales O
|
||||
récidivantes O
|
||||
@@ -1246,7 +1246,7 @@ polygone O
|
||||
Willis O
|
||||
Avis O
|
||||
neurologique: O
|
||||
Monte O
|
||||
Monte B-VILLE
|
||||
en O
|
||||
neurologie O
|
||||
pour O
|
||||
@@ -1288,8 +1288,8 @@ RAD O
|
||||
le O
|
||||
18/04 O
|
||||
avec O
|
||||
son O
|
||||
père O
|
||||
son B-VILLE
|
||||
père B-VILLE
|
||||
vvp: O
|
||||
retirée O
|
||||
consult: O
|
||||
@@ -1750,7 +1750,7 @@ Hier O
|
||||
un O
|
||||
Neurologue O
|
||||
en O
|
||||
ville O
|
||||
ville B-VILLE
|
||||
, O
|
||||
TTT O
|
||||
par O
|
||||
@@ -1798,7 +1798,7 @@ Pose O
|
||||
de O
|
||||
VVP O
|
||||
+ O
|
||||
bio O
|
||||
bio B-VILLE
|
||||
+ O
|
||||
titration O
|
||||
ATG3 O
|
||||
@@ -1875,7 +1875,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
8 O
|
||||
@@ -1912,7 +1912,7 @@ modifié. O
|
||||
Le O
|
||||
débit O
|
||||
en O
|
||||
cours O
|
||||
cours B-VILLE
|
||||
est O
|
||||
: O
|
||||
400 O
|
||||
@@ -2218,7 +2218,7 @@ Page O
|
||||
6 O
|
||||
de O
|
||||
14 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -3437,7 +3437,7 @@ Page O
|
||||
9 O
|
||||
de O
|
||||
14 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -4596,7 +4596,7 @@ rendu O
|
||||
au O
|
||||
format O
|
||||
texte O
|
||||
Bayonne, O
|
||||
Bayonne, B-VILLE
|
||||
le O
|
||||
15/04/2023 O
|
||||
Docteur O
|
||||
|
||||
Reference in New Issue
Block a user