Commit Graph

251 Commits

Author SHA1 Message Date
Dom
e7657ee1e5 Fix: Embeddings CLIP + Nettoyage post-apprentissage
Ce commit corrige deux problèmes critiques dans le pipeline d'apprentissage:

**Fix A - Embeddings CLIP fonctionnels**
- Problème: Chemins relatifs (shots/shot_0001.png) causaient des erreurs
- Solution: Utilisation de chemins absolus dans processing_pipeline.py et graph_builder.py
- Résultat: Embeddings générés avec succès, patterns détectés par clustering DBSCAN

Modifications:
- server/processing_pipeline.py:279 - Chemin absolu pour ScreenState.raw.screenshot_path
- core/graph/graph_builder.py:310 - Chemin absolu pour GraphBuilder._create_screen_states()

**Fix B - Nettoyage post-apprentissage**
- Problème: Screenshots jamais nettoyés ou nettoyés trop tôt (avant apprentissage)
- Solution: Activation du nettoyage APRÈS création des screen_states
- Résultat: Gain d'espace ~99% (screenshots supprimés, screen_states conservés)

Modifications:
- server/processing_pipeline.py:165 - Nettoyage conditionnel si screen_states créés

Impact:
-  CLIP ViT-B-32 chargé et fonctionnel (512D embeddings)
-  3 patterns détectés sur session test (40 screenshots)
-  Nettoyage automatique: uploads/*.enc, uploads/*.zip, sessions/sess_*/ supprimés
-  Données conservées: screen_states/, embeddings/, workflows/
-  Gain d'espace: 98.3% (6 MB → 100 KB par session)

Testé avec: sess_20260107T220743_6be50905 (40 events, 40 screenshots)
Status:  POC/MVP prêt pour démo investisseurs

🤖 Généré avec [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2026-01-07 22:24:19 +01:00