feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
- Fine-tuning camembert-bio-base : F1=0.903, Recall=0.930 (vs 0.89/0.85) - Data augmentation : substitution noms INSEE (219K patronymes, x3 copies) - Hard negatives BDPM (5.7K médicaments) + QUAERO (1319 termes médicaux) - Annotations silver enrichies par gazetteers (+612 VILLE, +5 HOPITAL) - Export silver avec support multi-répertoires (--extra-dir) - Gazetteers QUAERO : CHEM, DISO, PROC, ANAT depuis DrBenchmark/QUAERO - Gazetteers INSEE : noms de famille fréquents (96K) et complets (219K) - Batch silver 1194 PDFs (run_batch_silver_export.py) pour dataset v3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -56,11 +56,11 @@ Code O
|
||||
Postal: O
|
||||
64600 B-ZIP
|
||||
Adresse: O
|
||||
11 B-VILLE
|
||||
RUE I-VILLE
|
||||
DE I-VILLE
|
||||
CAZALIS I-VILLE
|
||||
Ville O
|
||||
11 B-ADRESSE
|
||||
RUE I-ADRESSE
|
||||
DE I-ADRESSE
|
||||
CAZALIS I-ADRESSE
|
||||
Ville B-VILLE
|
||||
de O
|
||||
résidence: O
|
||||
ANGLET B-VILLE
|
||||
@@ -130,8 +130,8 @@ Personne O
|
||||
prévenir O
|
||||
(Trakcare) O
|
||||
Epouse O
|
||||
vandestock O
|
||||
michele O
|
||||
vandestock B-PER
|
||||
michele I-PER
|
||||
0607265212 B-TEL
|
||||
Personne O
|
||||
de O
|
||||
@@ -198,7 +198,7 @@ Note O
|
||||
Aucune O
|
||||
donnée O
|
||||
renseignée O
|
||||
Signes O
|
||||
Signes B-VILLE
|
||||
vitaux O
|
||||
Item O
|
||||
de O
|
||||
@@ -775,8 +775,8 @@ et O
|
||||
avis O
|
||||
nephro O
|
||||
(Dr O
|
||||
Sie B-PER
|
||||
Valat): I-PER
|
||||
Sie O
|
||||
Valat): O
|
||||
- O
|
||||
Tavanic O
|
||||
500 O
|
||||
@@ -784,7 +784,7 @@ mg O
|
||||
en O
|
||||
dose O
|
||||
de O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
puis O
|
||||
250 O
|
||||
mg O
|
||||
@@ -1310,26 +1310,26 @@ Note O
|
||||
IDE O
|
||||
Charlène B-PER
|
||||
AZIZA I-PER
|
||||
05/06/2023 O
|
||||
15:22 O
|
||||
05/06/2023 B-DATE_NAISSANCE
|
||||
15:22 I-DATE_NAISSANCE
|
||||
Note O
|
||||
IDE O
|
||||
Maite B-PER
|
||||
MINJOU I-PER
|
||||
05/06/2023 O
|
||||
12:58 O
|
||||
05/06/2023 B-DATE_NAISSANCE
|
||||
12:58 I-DATE_NAISSANCE
|
||||
Note O
|
||||
IDE O
|
||||
Isabelle B-PER
|
||||
BRIAULT I-PER
|
||||
05/06/2023 O
|
||||
12:32 O
|
||||
05/06/2023 B-DATE_NAISSANCE
|
||||
12:32 I-DATE_NAISSANCE
|
||||
Note O
|
||||
IDE O
|
||||
Pauline B-PER
|
||||
GODARD I-PER
|
||||
05/06/2023 O
|
||||
01:08 O
|
||||
05/06/2023 B-DATE_NAISSANCE
|
||||
01:08 I-DATE_NAISSANCE
|
||||
Note O
|
||||
IDE O
|
||||
Samantha B-PER
|
||||
@@ -1403,7 +1403,7 @@ os O
|
||||
prescrit O
|
||||
et O
|
||||
débuté O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
14h30 O
|
||||
( O
|
||||
rattrapage O
|
||||
@@ -1466,7 +1466,7 @@ matin O
|
||||
remonté O
|
||||
de O
|
||||
dialyse O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
12h O
|
||||
a O
|
||||
eu O
|
||||
@@ -1636,7 +1636,7 @@ propre, O
|
||||
alginate O
|
||||
mis O
|
||||
en O
|
||||
place O
|
||||
place B-VILLE
|
||||
+ O
|
||||
compresses O
|
||||
mise O
|
||||
@@ -1821,7 +1821,7 @@ Note O
|
||||
IDE O
|
||||
Samantha B-PER
|
||||
DAS I-PER
|
||||
DORES O
|
||||
DORES I-PER
|
||||
02/06/2023 O
|
||||
17:01 O
|
||||
Note O
|
||||
@@ -2042,7 +2042,7 @@ enlevés O
|
||||
alginate O
|
||||
mis O
|
||||
en O
|
||||
place O
|
||||
place B-VILLE
|
||||
compresse O
|
||||
et O
|
||||
bande O
|
||||
@@ -2248,7 +2248,7 @@ jrpatient O
|
||||
revenu O
|
||||
de O
|
||||
dialyse O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
13 O
|
||||
h O
|
||||
20dlr O
|
||||
@@ -2506,7 +2506,7 @@ Page O
|
||||
de O
|
||||
25 O
|
||||
en O
|
||||
place, O
|
||||
place, B-VILLE
|
||||
patient O
|
||||
autonomeENDOC O
|
||||
: O
|
||||
@@ -2540,7 +2540,7 @@ correctepatient O
|
||||
descendu O
|
||||
au O
|
||||
bloc O
|
||||
vers O
|
||||
vers B-VILLE
|
||||
10h O
|
||||
30 O
|
||||
Note O
|
||||
@@ -2575,16 +2575,16 @@ BLOC O
|
||||
à O
|
||||
10H O
|
||||
RAI B-PER
|
||||
RQPR I-PER
|
||||
Patient I-PER
|
||||
de I-PER
|
||||
70 I-PER
|
||||
ans, I-PER
|
||||
RQPR O
|
||||
Patient O
|
||||
de O
|
||||
70 O
|
||||
ans, O
|
||||
vit O
|
||||
au O
|
||||
dom O
|
||||
avec O
|
||||
son O
|
||||
son B-VILLE
|
||||
épouse O
|
||||
avec O
|
||||
passage O
|
||||
@@ -2731,7 +2731,7 @@ de O
|
||||
laparotomie O
|
||||
( O
|
||||
amènera O
|
||||
son O
|
||||
son B-VILLE
|
||||
appareillage O
|
||||
) O
|
||||
Note O
|
||||
@@ -2747,7 +2747,7 @@ sur O
|
||||
laparotomie O
|
||||
ancienne O
|
||||
à O
|
||||
son O
|
||||
son B-VILLE
|
||||
arrivée, O
|
||||
refait O
|
||||
ce O
|
||||
@@ -3097,10 +3097,10 @@ Juliette B-PER
|
||||
LAGARRIGUE I-PER
|
||||
RESIKALI O
|
||||
PDR O
|
||||
SUSP O
|
||||
BUV O
|
||||
OU O
|
||||
RECT O
|
||||
SUSP B-PER
|
||||
BUV I-PER
|
||||
OU I-PER
|
||||
RECT I-PER
|
||||
[25] O
|
||||
Flacon(s) O
|
||||
1 O
|
||||
@@ -3843,7 +3843,7 @@ MAQUILLAGE, O
|
||||
PROTHESES, O
|
||||
VERNIS O
|
||||
A O
|
||||
ONGLES O
|
||||
ONGLES B-VILLE
|
||||
Marie- O
|
||||
France O
|
||||
ETCHEVERRY B-PER
|
||||
@@ -3853,10 +3853,10 @@ Signé O
|
||||
08h O
|
||||
Normal O
|
||||
30/05/2023 O
|
||||
16:58 O
|
||||
BAS O
|
||||
DE O
|
||||
CONTENTION O
|
||||
16:58 B-PER
|
||||
BAS I-PER
|
||||
DE I-PER
|
||||
CONTENTION I-PER
|
||||
: O
|
||||
POSE O
|
||||
Arrêté O
|
||||
@@ -4570,7 +4570,7 @@ Page O
|
||||
9 O
|
||||
de O
|
||||
25 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -5685,9 +5685,9 @@ Signé O
|
||||
— O
|
||||
RESIKALI O
|
||||
PDR O
|
||||
SUSP O
|
||||
BUV O
|
||||
OU O
|
||||
SUSP B-PER
|
||||
BUV I-PER
|
||||
OU I-PER
|
||||
RECT O
|
||||
- O
|
||||
15,18-18,98G O
|
||||
@@ -7876,7 +7876,7 @@ Page O
|
||||
16 O
|
||||
de O
|
||||
25 O
|
||||
Plan O
|
||||
Plan B-VILLE
|
||||
de O
|
||||
soins O
|
||||
Jour O
|
||||
@@ -9029,9 +9029,9 @@ Signé O
|
||||
— O
|
||||
RESIKALI O
|
||||
PDR O
|
||||
SUSP O
|
||||
BUV O
|
||||
OU O
|
||||
SUSP B-PER
|
||||
BUV I-PER
|
||||
OU I-PER
|
||||
RECT O
|
||||
- O
|
||||
15,18-18,98G O
|
||||
@@ -12008,7 +12008,7 @@ multi O
|
||||
opéré, O
|
||||
avec O
|
||||
amputation O
|
||||
trans O
|
||||
trans B-VILLE
|
||||
tibial O
|
||||
à O
|
||||
droite. O
|
||||
@@ -12224,7 +12224,7 @@ mg O
|
||||
en O
|
||||
dose O
|
||||
de O
|
||||
charge O
|
||||
charge B-VILLE
|
||||
puis O
|
||||
250 O
|
||||
mg O
|
||||
|
||||
Reference in New Issue
Block a user